mrp/simcse-model-m-bert-thai-cased

mrp

Similitud de oraciones

Este es un modelo de sentence-transformers: mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede ser utilizado para tareas como agrupamiento o búsqueda semántica. Usamos SimCSE aquí utilizando mBERT como modelo base y entrenamos el modelo con Wikipedia en tailandés.

Como usar

Usar este modelo se vuelve fácil cuando tienes instalado sentence-transformers:
 pip install -U sentence-transformers 

Luego puedes usar el modelo de esta manera:
 from sentence_transformers import SentenceTransformer 
 sentences = ["ฉันนะคือคนรักชาติยังไงละ!", "พวกสามกีบล้มเจ้า!"] 

 model = SentenceTransformer('{MODEL_NAME}') 
 embeddings = model.encode(sentences) 
 print(embeddings)

Funcionalidades

Transformadores de oraciones
Extracción de características
Embeddings de texto
Inferencia de texto

Casos de uso

Agrupamiento (clustering)
Búsqueda semántica