BGE-M3 Financial Matryoshka

haophancs
Similitud de oraciones

Este es un modelo de sentence-transformers afinado a partir de BAAI/bge-m3. Mapea oraciones y párrafos a un espacio vectorial denso de 1024 dimensiones y se puede utilizar para similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de texto, agrupación y más.

Como usar

Primero instala la biblioteca de Sentence Transformers:

pip install -U sentence-transformers

Luego puedes cargar este modelo y ejecutar la inferencia:

from sentence_transformers import SentenceTransformer

# Descargar del Hub de 🤗
model = SentenceTransformer("haophancs/bge-m3-financial-matryoshka")
# Ejecutar inferencia
sentences = [
    'As of January 28, 2024 the net carrying value of our inventories was $1.3 billion, which included provisions for obsolete and damaged inventory of $139.7 million.',
    "What is the status of the company's inventory as of January 28, 2024, in terms of its valuation and provisions for obsolescence?",
    'What is the relationship between the ESG goals and the long-term growth strategy?',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Obtener las puntuaciones de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Funcionalidades

Modelo de transformadores de oraciones
Modelo base: BAAI/bge-m3
Longitud máxima de secuencia: 8192 tokens
Dimensionalidad de salida: 1024 tokens
Función de similitud: Similitud coseno
Licencia: apache-2.0

Casos de uso

Similitud textual semántica
Búsqueda semántica
Minería de paráfrasis
Clasificación de texto
Agrupación