stella-mrl-large-zh-v3.5-1792d
dunzhang
Similitud de oraciones
El modelo stella-mrl-large-zh-v3.5-1792d está basado en stella-large-zh-v3-1792d y fue entrenado usando el método MRL. Su principal característica es la capacidad de variar las dimensiones del vector.
Como usar
from sentence_transformers import SentenceTransformer
from sklearn.preprocessing import normalize
model = SentenceTransformer("infgrad/stella-mrl-large-zh-v3.5-1792d")
# Nota: ¡No normalizar primero! Seleccione los primeros n dim antes de normalizar
vectors = model.encode(["texto1", "texto2"], normalize_embeddings=False)
print(vectors.shape) # la forma es [2,1792]
# n_dims cuanto más grande mejor, pero el coste temporal y espacial aumentan. Se recomienda seleccionar dimensiones en múltiplos de 128, ya que así fue entrenado
n_dims = 768
cut_vecs = normalize(vectors[:, :n_dims])
Funcionalidades
- Transformadores de oraciones
- Implementación en PyTorch
- Extracción de características usando BERT
- Resultados de evaluación MTEB
- Embebimientos de texto
- Endpoints de inferencia
- Licencia MIT
Casos de uso
- Retrieval (Recuperación de información)
- STS (Evaluación de similitud textual)
- Clasificación de pares
- Clasificación
- Reranking (Reordenamiento)
- Clustering