eduardofv/stsb-m-mt-es-distilbert-base-uncased
eduardofv
Similitud de oraciones
Este es un modelo de prueba que se afinó utilizando los conjuntos de datos en español de stsb_multi_mt para comprender y evaluar los modelos STS.
Como usar
Puedes usarlo como cualquier otro modelo entrenado en STS para extraer embeddings de oraciones. Consulta la documentación de Sentence Transformers.
# Código de ejemplo:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('eduardofv/stsb-m-mt-es-distilbert-base-uncased')
sentence_embeddings = model.encode(['Esta es una oración', 'Esta es otra oración'])
Funcionalidades
- Modelo de distilbert-base-uncased entrenado para la Tarea de Similitud Textual Semántica (STS) en español.
- Utiliza conjuntos de datos STSBenchmark traducidos automáticamente a otros idiomas usando deepl.com.
- Incluye un script modificado para el entrenamiento de STS de Sentence Transformers.
Casos de uso
- Prueba de concepto en la afinación de STS usando datos en español.
- Evaluación del rendimiento respecto a otros modelos de Sentence Transformers y Tensorflow Hub usando STSBenchmark estándar y STSBenchmark Task 3 de 2017 para español.