jmbrito/ptbr-similarity-e5-small

jmbrito

Similitud de oraciones

Este modelo es una versión afinada de intfloat/multilingual-e5-small utilizando el conjunto de datos ASSIN2 para puntuar la similitud. Este es un modelo de sentence-transformers: mapea oraciones y párrafos a un espacio vectorial denso de 384 dimensiones y puede ser usado para tareas como clustering o búsqueda semántica.

Como usar

Usar este modelo se vuelve fácil cuando tienes sentence-transformers instalado:
pip install -U sentence-transformers

Entonces puedes usar el modelo así:
from sentence_transformers import SentenceTransformer
sentences = ["This is an example sentence", "Each sentence is converted"]

model = SentenceTransformer('jmbrito/ptbr-similarity-e5-small')
embeddings = model.encode(sentences)
print(embeddings)

Funcionalidades

Modelo afinado para la puntuación de similitud
Utiliza el conjunto de datos ASSIN2
Mapea oraciones y párrafos a un espacio vectorial denso de 384 dimensiones
Adecuado para tareas como clustering o búsqueda semántica

Casos de uso

Clustering
Búsqueda semántica