BGE base Financial Matryoshka
korruz
Similitud de oraciones
Este es un modelo de sentence-transformers afinado a partir de BAAI/bge-base-en-v1.5. Convierte oraciones y párrafos en un espacio vectorial denso de 768 dimensiones y puede utilizarse para similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de texto, agrupación y más.
Como usar
Primero, instale la biblioteca de Sentence Transformers:
pip install -U sentence-transformers
Luego puede cargar este modelo y ejecutar la inferencia:
from sentence_transformers import SentenceTransformer
# Descargar del Hub 🤗
model = SentenceTransformer("korruz/bge-base-financial-matryoshka")
# Ejecutar inferencia
sentences = [
'We use raw materials that are subject to price volatility caused by weather, supply conditions, political and economic variables and other unpredictable factors. We may use futures, options and swap contracts to manage the volatility related to the above exposures.',
'What financial instruments does the company use to manage commodity price exposure?',
'What types of legal proceedings is the company currently involved in?',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Obtener las puntuaciones de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Funcionalidades
- Modelo de Transformador de Oraciones
- Modelo base: BAAI/bge-base-en-v1.5
- Longitud Máxima de la Secuencia: 512 tokens
- Dimensionalidad de la salida: 768 tokens
- Función de similitud: Similitud Coseno
- Idioma: en
- Licencia: apache-2.0
Casos de uso
- Similitud textual semántica
- Búsqueda semántica
- Minería de paráfrasis
- Clasificación de texto
- Agrupación