stella-mrl-large-zh-v3.5-1792d

dunzhang

Similitud de oraciones

El modelo stella-mrl-large-zh-v3.5-1792d está basado en stella-large-zh-v3-1792d y fue entrenado usando el método MRL. Su principal característica es la capacidad de variar las dimensiones del vector.

Como usar

from sentence_transformers import SentenceTransformer
from sklearn.preprocessing import normalize

model = SentenceTransformer("infgrad/stella-mrl-large-zh-v3.5-1792d")
# Nota: ¡No normalizar primero! Seleccione los primeros n dim antes de normalizar
vectors = model.encode(["texto1", "texto2"], normalize_embeddings=False)
print(vectors.shape) # la forma es [2,1792]
# n_dims cuanto más grande mejor, pero el coste temporal y espacial aumentan. Se recomienda seleccionar dimensiones en múltiplos de 128, ya que así fue entrenado
n_dims = 768
cut_vecs = normalize(vectors[:, :n_dims])

Funcionalidades

Transformadores de oraciones
Implementación en PyTorch
Extracción de características usando BERT
Resultados de evaluación MTEB
Embebimientos de texto
Endpoints de inferencia
Licencia MIT

Casos de uso

Retrieval (Recuperación de información)
STS (Evaluación de similitud textual)
Clasificación de pares
Clasificación
Reranking (Reordenamiento)
Clustering