Gameselo/STS-multilingual-mpnet-base-v2

Gameselo
Similitud de oraciones

Este es un modelo sentence-transformers afinado a partir de sentence-transformers/paraphrase-multilingual-mpnet-base-v2. Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede ser utilizado para similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de texto, agrupación y más.

Como usar

Primero instale la biblioteca de Sentence Transformers:

pip install -U sentence-transformers

Luego puede cargar este modelo y ejecutar la inferencia:

from sentence_transformers import SentenceTransformer

# Descargar desde el Hub de 🤗
model = SentenceTransformer("Gameselo/STS-multilingual-mpnet-base-v2")
# Ejecutar inferencia
sentences = [
    '一个女人正在洗澡。',
    'A woman is taking a bath.',
    'En jente børster håret sitt',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Obtener las puntuaciones de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Funcionalidades

Transformador de oraciones basado en sentence-transformers/paraphrase-multilingual-mpnet-base-v2
Longitud máxima de secuencia: 128 tokens
Dimensionalidad de salida: 768 tokens
Función de similitud: Similitud del Coseno

Casos de uso

Similitud textual semántica
Búsqueda semántica
Minería de paráfrasis
Clasificación de texto
Agrupación