nomic-embed-philosophy-triplets_v9

m7n

Similitud de oraciones

Este es un modelo de sentence-transformers afinado a partir de nomic-ai/nomic-embed-text-v1. Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede ser utilizado para la similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de textos, agrupación y más.

Como usar

Primero, instala la biblioteca de Sentence Transformers:
pip install -U sentence-transformers

Luego puedes cargar este modelo y ejecutar la inferencia:
from sentence_transformers import SentenceTransformer

# Descargar del hub de 🤗
model = SentenceTransformer("m7n/nomic-embed-philosophy-triplets_v9")
# Ejecutar la inferencia
sentences = [
    'compare the remarks in On Habituations ...',
    'own characteristically, indeed uniquely, polemical style. For instance, ...',
    'Hippocrates and Plato but in spite of ...'
]
embeddings = model.encode(sentences)
print(embeddings.shape)  # [3, 768]

# Obtener los puntajes de similitud para los embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)  # [3, 3]

Funcionalidades

Tipo de modelo: Transformador de oraciones
Modelo base: nomic-ai/nomic-embed-text-v1
Longitud máxima de la secuencia: 8192 tokens
Dimensionalidad de salida: 768 tokens
Función de similitud: Similitud del coseno
Generado a partir del dataset nomic
Resultados de evaluación con TripletEvaluator
Métrica de pérdida: TripletLoss

Casos de uso

Similitud textual semántica
Búsqueda semántica
Minería de paráfrasis
Clasificación de textos
Agrupación de textos