kornwtp/simcse-model-m-bert-thai-cased
kornwtp
Similitud de oraciones
Este es un modelo de sentence-transformers: Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede usarse para tareas como la agrupación o la búsqueda semántica. Usamos SimCSE aquí utilizando mBERT como el modelo base y entrenamos el modelo con Wikipedia tailandesa.
Como usar
Usar este modelo se vuelve fácil cuando tienes sentence-transformers instalado:
pip install -U sentence-transformers
Luego puedes usar el modelo así:
from sentence_transformers import SentenceTransformer
sentences = ["กลุ่มผู้ชายเล่นฟุตบอลบนชายหาด", "กลุ่มเด็กชายกำลังเล่นฟุตบอลบนชายหาด"]
model = SentenceTransformer('{MODEL_NAME}')
embeddings = model.encode(sentences)
print(embeddings)
Funcionalidades
- Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones
- Puede usarse para tareas como la agrupación
- Búsqueda semántica
Casos de uso
- Agrupación de oraciones
- Búsqueda semántica