StyleDistance/styledistance_synthetic_only
StyleDistance
Similitud de oraciones
Este modelo fue entrenado con un conjunto de datos sintético utilizando DataDreamer 🤖💤. Este modelo está diseñado para la similitud de oraciones y hace uso de transformadores de oraciones.
Como usar
from sentence_transformers import SentenceTransformer
from sentence_transformers.util import cos_sim
model = SentenceTransformer('SynthSTEL/styledistance_synthetic_only_full_v2') # Cargar modelo
input = model.encode('The Harley School will thrive😀; so many future leaders🎓 will emerge from its doors🚪.')
others = model.encode(["To avoid extra attorney fees💰, they kept the entity's minutes updated⏱️; it proved a wise decision👍.", "To avoid extra attorney fees, they kept the entity's minutes updated; it proved a wise decision."])
print(cos_sim(input, others))
Funcionalidades
- Similitud de oraciones
- Extracción de características
- Compatible con AutoTrain
- Compatible con inferencias de incrustaciones de texto
- Compatible con puntos finales de inferencia
Casos de uso
- Medición de la similitud entre oraciones
- Extracción de características textuales para análisis posterior
- Detección de duplicados en conjuntos de datos textuales
- Agrupación y clasificación de documentos basados en similitud de oraciones