StyleDistance/styledistance_synthetic_only

StyleDistance

Similitud de oraciones

Este modelo fue entrenado con un conjunto de datos sintético utilizando DataDreamer 🤖💤. Este modelo está diseñado para la similitud de oraciones y hace uso de transformadores de oraciones.

Como usar

from sentence_transformers import SentenceTransformer
from sentence_transformers.util import cos_sim

model = SentenceTransformer('SynthSTEL/styledistance_synthetic_only_full_v2') # Cargar modelo

input = model.encode('The Harley School will thrive😀; so many future leaders🎓 will emerge from its doors🚪.')
others = model.encode(["To avoid extra attorney fees💰, they kept the entity's minutes updated⏱️; it proved a wise decision👍.", "To avoid extra attorney fees, they kept the entity's minutes updated; it proved a wise decision."])
print(cos_sim(input, others))

Funcionalidades

Similitud de oraciones
Extracción de características
Compatible con AutoTrain
Compatible con inferencias de incrustaciones de texto
Compatible con puntos finales de inferencia

Casos de uso

Medición de la similitud entre oraciones
Extracción de características textuales para análisis posterior
Detección de duplicados en conjuntos de datos textuales
Agrupación y clasificación de documentos basados en similitud de oraciones