multi-qa-MiniLM-L6-cos-v1

sentence-transformers

Similitud de oraciones

Este es un modelo de sentence-transformers: Mapea oraciones y párrafos a un espacio vectorial denso de 384 dimensiones y fue diseñado para la búsqueda semántica. Ha sido entrenado en 215 millones de pares (pregunta, respuesta) de diversas fuentes. Para una introducción a la búsqueda semántica, consulta: SBERT.net - Búsqueda Semántica.

Como usar

from sentence_transformers import SentenceTransformer, util

query = "How many people live in London?"
docs = ["Around 9 Million people live in London", "London is known for its financial district"]

# Cargar el modelo
model = SentenceTransformer('sentence-transformers/multi-qa-MiniLM-L6-cos-v1')

# Codificar consulta y documentos
query_emb = model.encode(query)
doc_emb = model.encode(docs)

# Calcular la puntuación de puntos entre la consulta y todos los embeddings de documentos
scores = util.dot_score(query_emb, doc_emb)[0].cpu().tolist()

# Combinar documentos y puntuaciones
doc_score_pairs = list(zip(docs, scores))

# Ordenar por puntuación descendente
doc_score_pairs = sorted(doc_score_pairs, key=lambda x: x[1], reverse=True)

# Mostrar pasajes y puntuaciones
for doc, score in doc_score_pairs:
    print(score, doc)

Funcionalidades

Transformadores
PyTorch
TensorFlow
Safetensors
Creación de embeddings de texto
Puntos finales de inferencia
Procesamiento simultáneo de múltiples lenguajes
Capacidad de búsqueda semántica

Casos de uso

Búsqueda semántica
Encontrar documentos relevantes para pasajes dados
Generar embeddings vectoriales densos para preguntas y respuestas