kornwtp/simcse-model-distil-m-bert
kornwtp
Similitud de oraciones
Este es un modelo de transformadores de oraciones utilizando m-Distil-BERT como modelo base: Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y se puede usar para tareas como agrupación o búsqueda semántica. Utilizamos SimCSE aquí y entrenamos el modelo con Wikipedia tailandesa.
Como usar
Usar este modelo se vuelve fácil cuando tienes sentence-transformers instalado:
pip install -U sentence-transformers
Entonces puedes usar el modelo así:
from sentence_transformers import SentenceTransformer
sentences = ["กลุ่มผู้ชายเล่นฟุตบอลบนชายหาด", "กลุ่มเด็กชายกำลังเล่นฟุตบอลบนชายหาด"]
model = SentenceTransformer('{MODEL_NAME}')
embeddings = model.encode(sentences)
print(embeddings)
Funcionalidades
- Transformadores de oraciones
- Basado en m-Distil-BERT
- Espacio vectorial denso de 768 dimensiones
- Ideal para tareas de agrupación
- Ideal para búsqueda semántica
Casos de uso
- Agrupación de oraciones
- Búsqueda semántica de textos