BGE base Financial Matryoshka

philschmid
Similitud de oraciones

Este es un modelo de transformers de oraciones afinado a partir de BAAI/bge-base-en-v1.5. Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede ser utilizado para similitud textual semántica, búsqueda semántica, minería de parafrases, clasificación de texto, agrupación y más.

Como usar

from sentence_transformers import SentenceTransformer

# Descargar desde el Hub 🤗
model = SentenceTransformer('philschmid/bge-base-financial-matryoshka')
# Ejecutar inferencia
sentences = [
    "¿Cuál fue el ingreso total de Gilead en 2023?",
    '¿Cuál fue el ingreso total para el año finalizado el 31 de diciembre de 2023?',
    '¿Cuánto fue la amortización relacionada con el préstamo CAT en 2023?',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Obtener los puntajes de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Funcionalidades

Modelo de tipo Transformer de oraciones
Modelo base: BAAI/bge-base-en-v1.5
Longitud máxima de secuencia: 512 tokens
Dimensionalidad de salida: 768 tokens
Función de similitud: Similitud del coseno
Licencia: apache-2.0

Casos de uso

Similitud textual semántica
Búsqueda semántica
Minería de parafrases
Clasificación de texto
Agrupación