nomic-embed-philosophy-triplets_v9
m7n
Similitud de oraciones
Este es un modelo de sentence-transformers afinado a partir de nomic-ai/nomic-embed-text-v1. Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede ser utilizado para la similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de textos, agrupación y más.
Como usar
Primero, instala la biblioteca de Sentence Transformers:
pip install -U sentence-transformers
Luego puedes cargar este modelo y ejecutar la inferencia:
from sentence_transformers import SentenceTransformer
# Descargar del hub de 🤗
model = SentenceTransformer("m7n/nomic-embed-philosophy-triplets_v9")
# Ejecutar la inferencia
sentences = [
'compare the remarks in On Habituations ...',
'own characteristically, indeed uniquely, polemical style. For instance, ...',
'Hippocrates and Plato but in spite of ...'
]
embeddings = model.encode(sentences)
print(embeddings.shape) # [3, 768]
# Obtener los puntajes de similitud para los embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape) # [3, 3]
Funcionalidades
- Tipo de modelo: Transformador de oraciones
- Modelo base: nomic-ai/nomic-embed-text-v1
- Longitud máxima de la secuencia: 8192 tokens
- Dimensionalidad de salida: 768 tokens
- Función de similitud: Similitud del coseno
- Generado a partir del dataset nomic
- Resultados de evaluación con TripletEvaluator
- Métrica de pérdida: TripletLoss
Casos de uso
- Similitud textual semántica
- Búsqueda semántica
- Minería de paráfrasis
- Clasificación de textos
- Agrupación de textos