mrp/simcse-model-roberta-base-thai

mrp

Similitud de oraciones

Esta es una implementación de sentence-transformers utilizando XLM-R como el modelo base: mapea oraciones y párrafos a un espacio denso de vectores de 768 dimensiones y se puede utilizar para tareas como la agrupación o la búsqueda semántica. Utilizamos SimCSE y entrenamos el modelo con Wikipedia tailandesa.

Como usar

Usar este modelo se vuelve fácil cuando tienes sentence-transformers instalado:
pip install -U sentence-transformers

Luego puedes utilizar el modelo de esta manera:
from sentence_transformers import SentenceTransformer
sentences = ["ฉันนะคือคนรักชาติยังไงละ!", "พวกสามกีบล้มเจ้า!"]

model = SentenceTransformer('{MODEL_NAME}')
embeddings = model.encode(sentences)
print(embeddings)

Funcionalidades

Transformers
PyTorch
xlm-roberta
Extracción de características
Similitud de oraciones
AutoTrain compatible
Inferencia de incrustaciones de texto
Endpoints de inferencia
arxiv:2104.08821
Región: US

Casos de uso

Agrupación de textos
Búsqueda semántica