mrp/simcse-model-roberta-base-thai
mrp
Similitud de oraciones
Esta es una implementación de sentence-transformers utilizando XLM-R como el modelo base: mapea oraciones y párrafos a un espacio denso de vectores de 768 dimensiones y se puede utilizar para tareas como la agrupación o la búsqueda semántica. Utilizamos SimCSE y entrenamos el modelo con Wikipedia tailandesa.
Como usar
Usar este modelo se vuelve fácil cuando tienes sentence-transformers instalado:
pip install -U sentence-transformers
Luego puedes utilizar el modelo de esta manera:
from sentence_transformers import SentenceTransformer
sentences = ["ฉันนะคือคนรักชาติยังไงละ!", "พวกสามกีบล้มเจ้า!"]
model = SentenceTransformer('{MODEL_NAME}')
embeddings = model.encode(sentences)
print(embeddings)
Funcionalidades
- Transformers
- PyTorch
- xlm-roberta
- Extracción de características
- Similitud de oraciones
- AutoTrain compatible
- Inferencia de incrustaciones de texto
- Endpoints de inferencia
- arxiv:2104.08821
- Región: US
Casos de uso
- Agrupación de textos
- Búsqueda semántica