BGE-M3 Financial Matryoshka
haophancs
Similitud de oraciones
Este es un modelo de sentence-transformers afinado a partir de BAAI/bge-m3. Mapea oraciones y párrafos a un espacio vectorial denso de 1024 dimensiones y se puede utilizar para similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de texto, agrupación y más.
Como usar
Primero instala la biblioteca de Sentence Transformers:
pip install -U sentence-transformers
Luego puedes cargar este modelo y ejecutar la inferencia:
from sentence_transformers import SentenceTransformer
# Descargar del Hub de 🤗
model = SentenceTransformer("haophancs/bge-m3-financial-matryoshka")
# Ejecutar inferencia
sentences = [
'As of January 28, 2024 the net carrying value of our inventories was $1.3 billion, which included provisions for obsolete and damaged inventory of $139.7 million.',
"What is the status of the company's inventory as of January 28, 2024, in terms of its valuation and provisions for obsolescence?",
'What is the relationship between the ESG goals and the long-term growth strategy?',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Obtener las puntuaciones de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Funcionalidades
- Modelo de transformadores de oraciones
- Modelo base: BAAI/bge-m3
- Longitud máxima de secuencia: 8192 tokens
- Dimensionalidad de salida: 1024 tokens
- Función de similitud: Similitud coseno
- Licencia: apache-2.0
Casos de uso
- Similitud textual semántica
- Búsqueda semántica
- Minería de paráfrasis
- Clasificación de texto
- Agrupación