multi-qa-MiniLM-L6-cos-v1
sentence-transformers
Similitud de oraciones
Este es un modelo de sentence-transformers: Mapea oraciones y párrafos a un espacio vectorial denso de 384 dimensiones y fue diseñado para la búsqueda semántica. Ha sido entrenado en 215 millones de pares (pregunta, respuesta) de diversas fuentes. Para una introducción a la búsqueda semántica, consulta: SBERT.net - Búsqueda Semántica.
Como usar
from sentence_transformers import SentenceTransformer, util
query = "How many people live in London?"
docs = ["Around 9 Million people live in London", "London is known for its financial district"]
# Cargar el modelo
model = SentenceTransformer('sentence-transformers/multi-qa-MiniLM-L6-cos-v1')
# Codificar consulta y documentos
query_emb = model.encode(query)
doc_emb = model.encode(docs)
# Calcular la puntuación de puntos entre la consulta y todos los embeddings de documentos
scores = util.dot_score(query_emb, doc_emb)[0].cpu().tolist()
# Combinar documentos y puntuaciones
doc_score_pairs = list(zip(docs, scores))
# Ordenar por puntuación descendente
doc_score_pairs = sorted(doc_score_pairs, key=lambda x: x[1], reverse=True)
# Mostrar pasajes y puntuaciones
for doc, score in doc_score_pairs:
print(score, doc)
Funcionalidades
- Transformadores
- PyTorch
- TensorFlow
- Safetensors
- Creación de embeddings de texto
- Puntos finales de inferencia
- Procesamiento simultáneo de múltiples lenguajes
- Capacidad de búsqueda semántica
Casos de uso
- Búsqueda semántica
- Encontrar documentos relevantes para pasajes dados
- Generar embeddings vectoriales densos para preguntas y respuestas