BookingCare/multilingual-e5-base-similarity-v1
BookingCare
Similitud de oraciones
Este es un modelo de transformers de oraciones afinado a partir de BookingCare/multilingual-e5-base-v2. Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones, y puede ser utilizado para similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de texto, agrupación y más.
Como usar
Para usar este modelo, primero instala la biblioteca Sentence Transformers:
pip install -U sentence-transformers
Luego puedes cargar este modelo y ejecutar inferencias.
from sentence_transformers import SentenceTransformer
# Descargar desde el Hub de 🤗
model = SentenceTransformer("BookingCare/multilingual-embed-v1.0")
# Ejecutar inferencias
sentences = [
'Chi phí điều trị xương khớp bằng tế bào gốc là bao nhiêu?',
'Tôi muốn biết giá thành của phương pháp điều trị xương khớp bằng tế bào gốc.',
'Bác sĩ nào giỏi về tim mạch ở Bệnh viện Tim Hà Nội?',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Obtener las puntuaciones de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Funcionalidades
- Modelo de Transformers de Oraciones
- Modelo base: BookingCare/multilingual-e5-base-v2
- Longitud máxima de secuencia: 512 tokens
- Dimensionalidad de la salida: 768 tokens
- Función de similitud: Similitud Coseno
Casos de uso
- Similitud textual semántica
- Búsqueda semántica
- Minería de paráfrasis
- Clasificación de texto
- Agrupación