BGE base Finanzas Matryoshka
Sailesh9999
Similitud de oraciones
Este es un modelo de transformers de oraciones ajustado desde BAAI/bge-base-en-v1.5. Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede ser utilizado para la similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de textos, creación de clústeres y más.
Como usar
Instale la biblioteca Sentence Transformers:
pip install -U sentence-transformers
Luego puede cargar este modelo y ejecutar inferencias:
from sentence_transformers import SentenceTransformer
# Descargar del Hub de 🤗
model = SentenceTransformer("Sailesh9999/bge-base-financial-matryoshka_3")
# Ejecutar inferencias
sentences = [
'Chipotle retains an independent third-party compensation consultant each year to conduct a pay equity analysis of its U.S. and Canadian workforce, including factors of pay such as grade level, tenure in role, and external market conditions like geographic location, to ensure consistency and equitable treatment among employees.',
'How does Chipotle ensure pay equity among its employees?',
'How can one locate information on legal proceedings within the Consolidated Financial Statements?',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Obtener las puntuaciones de similitud para los embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Funcionalidades
- Modelo de Transformers de Oraciones
- Modelo base: BAAI/bge-base-en-v1.5
- Longitud máxima de secuencia: 512 tokens
- Dimensionalidad de salida: 768 tokens
- Función de similitud: Similitud coseno
- Idioma: en
- Licencia: apache-2.0
Casos de uso
- Similitud textual semántica
- Búsqueda semántica
- Minería de paráfrasis
- Clasificación de textos
- Creación de clústeres