kornwtp/simcse-model-m-bert-thai-cased

kornwtp
Similitud de oraciones

Este es un modelo de sentence-transformers: Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede usarse para tareas como la agrupación o la búsqueda semántica. Usamos SimCSE aquí utilizando mBERT como el modelo base y entrenamos el modelo con Wikipedia tailandesa.

Como usar

Usar este modelo se vuelve fácil cuando tienes sentence-transformers instalado:

pip install -U sentence-transformers

Luego puedes usar el modelo así:

from sentence_transformers import SentenceTransformer
sentences = ["กลุ่มผู้ชายเล่นฟุตบอลบนชายหาด", "กลุ่มเด็กชายกำลังเล่นฟุตบอลบนชายหาด"]

model = SentenceTransformer('{MODEL_NAME}')
embeddings = model.encode(sentences)
print(embeddings)

Funcionalidades

Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones
Puede usarse para tareas como la agrupación
Búsqueda semántica

Casos de uso

Agrupación de oraciones
Búsqueda semántica