mrp/simcse-model-m-bert-thai-cased
mrp
Similitud de oraciones
Este es un modelo de sentence-transformers: mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede ser utilizado para tareas como agrupamiento o búsqueda semántica. Usamos SimCSE aquí utilizando mBERT como modelo base y entrenamos el modelo con Wikipedia en tailandés.
Como usar
Usar este modelo se vuelve fácil cuando tienes instalado sentence-transformers:
pip install -U sentence-transformers
Luego puedes usar el modelo de esta manera:
from sentence_transformers import SentenceTransformer
sentences = ["ฉันนะคือคนรักชาติยังไงละ!", "พวกสามกีบล้มเจ้า!"]
model = SentenceTransformer('{MODEL_NAME}')
embeddings = model.encode(sentences)
print(embeddings)
Funcionalidades
- Transformadores de oraciones
- Extracción de características
- Embeddings de texto
- Inferencia de texto
Casos de uso
- Agrupamiento (clustering)
- Búsqueda semántica