BGE base Financial Matryoshka

korruz
Similitud de oraciones

Este es un modelo de sentence-transformers afinado a partir de BAAI/bge-base-en-v1.5. Convierte oraciones y párrafos en un espacio vectorial denso de 768 dimensiones y puede utilizarse para similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de texto, agrupación y más.

Como usar

Primero, instale la biblioteca de Sentence Transformers:

pip install -U sentence-transformers

Luego puede cargar este modelo y ejecutar la inferencia:

from sentence_transformers import SentenceTransformer

# Descargar del Hub 🤗
model = SentenceTransformer("korruz/bge-base-financial-matryoshka")
# Ejecutar inferencia
sentences = [
'We use raw materials that are subject to price volatility caused by weather, supply conditions, political and economic variables and other unpredictable factors. We may use futures, options and swap contracts to manage the volatility related to the above exposures.',
'What financial instruments does the company use to manage commodity price exposure?',
'What types of legal proceedings is the company currently involved in?',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Obtener las puntuaciones de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Funcionalidades

Modelo de Transformador de Oraciones
Modelo base: BAAI/bge-base-en-v1.5
Longitud Máxima de la Secuencia: 512 tokens
Dimensionalidad de la salida: 768 tokens
Función de similitud: Similitud Coseno
Idioma: en
Licencia: apache-2.0

Casos de uso

Similitud textual semántica
Búsqueda semántica
Minería de paráfrasis
Clasificación de texto
Agrupación