LaBSE-EnKo-Nano-Preview-v0.3
lemon-mint
Similitud de oraciones
Este es un modelo de previsualización, liberaré mejores modelos en el futuro, por lo que no inviertas demasiados recursos en él. Este es un modelo de sentence-transformers ajustado a partir de sentence-transformers/LaBSE. Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede ser utilizado para similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de textos, agrupamiento y más.
Como usar
Uso Directo (Transformadores de Oraciones)
# Primero instala la librería de Transformers de Oraciones:
pip install -U sentence-transformers
# Luego puedes cargar este modelo y ejecutar la inferencia.
from sentence_transformers import SentenceTransformer
# Descargar desde el Hub de 🤗
model = SentenceTransformer("lemon-mint/LaBSE-EnKo-Nano-Preview-v0.3")
# Ejecutar inferencia
sentences = [
'The weather is lovely today.',
"It's so sunny outside!",
'He drove to the stadium.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Obtener los puntajes de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Funcionalidades
- Modelo de Transformador de Oraciones
- Modelo base: sentence-transformers/LaBSE
- Longitud Máxima de Secuencia: 512 tokens
- Dimensionalidad de Salida: 768 tokens
- Función de Similitud: Similaridad del Coseno
Casos de uso
- Similitud textual semántica
- Búsqueda semántica
- Minería de paráfrasis
- Clasificación de textos
- Agrupamiento