kornwtp/simcse-model-distil-m-bert

kornwtp
Similitud de oraciones

Este es un modelo de transformadores de oraciones utilizando m-Distil-BERT como modelo base: Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y se puede usar para tareas como agrupación o búsqueda semántica. Utilizamos SimCSE aquí y entrenamos el modelo con Wikipedia tailandesa.

Como usar

Usar este modelo se vuelve fácil cuando tienes sentence-transformers instalado:

pip install -U sentence-transformers

Entonces puedes usar el modelo así:

from sentence_transformers import SentenceTransformer
sentences = ["กลุ่มผู้ชายเล่นฟุตบอลบนชายหาด", "กลุ่มเด็กชายกำลังเล่นฟุตบอลบนชายหาด"]

model = SentenceTransformer('{MODEL_NAME}')
embeddings = model.encode(sentences)
print(embeddings)

Funcionalidades

Transformadores de oraciones
Basado en m-Distil-BERT
Espacio vectorial denso de 768 dimensiones
Ideal para tareas de agrupación
Ideal para búsqueda semántica

Casos de uso

Agrupación de oraciones
Búsqueda semántica de textos