bge-base-finetuned-hotpotqa
anindya-hf-2002
Similitud de oraciones
Modelo de transformadores de oraciones finetuneado a partir de BAAI/bge-base-en-v1.5 en el conjunto de datos sentence-transformers/hotpotqa. Este modelo mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede ser utilizado para similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de texto, agrupamiento, y más.
Como usar
Para usar este modelo con la biblioteca de Sentence Transformers, sigue los siguientes pasos:
# Primero instala la biblioteca de Sentence Transformers:
pip install -U sentence-transformers
# Luego puedes cargar este modelo y ejecutar inferencias.
from sentence_transformers import SentenceTransformer
# Descarga desde el Hub de 🤗
model = SentenceTransformer("anindya-hf-2002/bge-base-finetuned-hotpotqa")
# Ejecuta inferencias
sentences = [
'James D. Farley, Jr. tuvo un temprano interés en los automóviles por su abuelo que trabajó para qué compañía?',
"Jim Farley (empresario) James D. Farley, Jr. (nacido en junio de 1962) es un ejecutivo estadounidense de automóviles que actualmente sirve como Vicepresidente Ejecutivo de Ford Motor Company y presidente de Global Markets desde junio de 2017. De 2015 a 2017, fue CEO y presidente de Ford Europe. Tuvo un temprano interés en los automóviles, principalmente por su abuelo que trabajó en la Planta River Rouge de Henry Ford desde 1914.",
'Continental Motors Company Continental Motors Company fue un fabricante estadounidense de motores de combustión interna. La compañía produjo motores como proveedor para muchos fabricantes independientes de automóviles, tractores, camiones y equipos estacionarios (como bombas, generadores y transmisiones de maquinaria industrial) desde 1900 hasta la década de 1960. Continental Motors también produjo automóviles de marca Continental en 1932–1933. La Compañía de Motores de Aviones Continental se formó en 1929 para desarrollar y producir sus motores de aviones, y se convertiría en el negocio principal de Continental Motors, Inc.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Obtén los puntajes de similitud para los embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Funcionalidades
- Modelo de transformadores de oraciones
- Longitud máxima de secuencia: 512 tokens
- Dimensionalidad de salida: 768 tokens
- Función de similitud: Similitud de coseno
- Licencia: Apache-2.0
Casos de uso
- Similitud textual semántica
- Búsqueda semántica
- Minería de paráfrasis
- Clasificación de texto
- Agrupamiento