dophys/bge-m3_finetuned

dophys
Similitud de oraciones

Este es un modelo de sentence-transformers entrenado. Asigna oraciones y párrafos a un espacio vectorial denso de 1024 dimensiones y puede ser utilizado para la similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de texto, agrupamiento, y más.

Como usar

Para uso directo (Sentence Transformers)

Instala primero la biblioteca de Sentence Transformers:

pip install -U sentence-transformers

Luego puedes cargar este modelo y ejecutar la inferencia:

from sentence_transformers import SentenceTransformer

# Descargar desde el Hub de 🤗
model = SentenceTransformer("sentence_transformers_model_id")
# Ejecutar inferencia
sentences = [
    'The weather is lovely today.',
    "It's so sunny outside!",
    'He drove to the stadium.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Obtener las puntuaciones de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Funcionalidades

Transformer con longitud máxima de secuencia de 8192 tokens
Dimensionalidad de salida de 1024 tokens
Función de similitud: Similitud coseno
Tokenización sin convertir a minúsculas
Incluye token de cls para modo de agrupamiento
Compatible con AutoTrain
Compatible con endpoints de inferencia

Casos de uso

Similitud textual semántica
Búsqueda semántica
Minería de paráfrasis
Clasificación de texto
Agrupamiento