eduardofv/stsb-m-mt-es-distilbert-base-uncased

eduardofv

Similitud de oraciones

Este es un modelo de prueba que se afinó utilizando los conjuntos de datos en español de stsb_multi_mt para comprender y evaluar los modelos STS.

Como usar

Puedes usarlo como cualquier otro modelo entrenado en STS para extraer embeddings de oraciones. Consulta la documentación de Sentence Transformers.
# Código de ejemplo:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('eduardofv/stsb-m-mt-es-distilbert-base-uncased')
sentence_embeddings = model.encode(['Esta es una oración', 'Esta es otra oración'])

Funcionalidades

Modelo de distilbert-base-uncased entrenado para la Tarea de Similitud Textual Semántica (STS) en español.
Utiliza conjuntos de datos STSBenchmark traducidos automáticamente a otros idiomas usando deepl.com.
Incluye un script modificado para el entrenamiento de STS de Sentence Transformers.

Casos de uso

Prueba de concepto en la afinación de STS usando datos en español.
Evaluación del rendimiento respecto a otros modelos de Sentence Transformers y Tensorflow Hub usando STSBenchmark estándar y STSBenchmark Task 3 de 2017 para español.