BGE base Financial Matryoshka
philschmid
Similitud de oraciones
Este es un modelo de transformers de oraciones afinado a partir de BAAI/bge-base-en-v1.5. Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede ser utilizado para similitud textual semántica, búsqueda semántica, minería de parafrases, clasificación de texto, agrupación y más.
Como usar
from sentence_transformers import SentenceTransformer
# Descargar desde el Hub 🤗
model = SentenceTransformer('philschmid/bge-base-financial-matryoshka')
# Ejecutar inferencia
sentences = [
"¿Cuál fue el ingreso total de Gilead en 2023?",
'¿Cuál fue el ingreso total para el año finalizado el 31 de diciembre de 2023?',
'¿Cuánto fue la amortización relacionada con el préstamo CAT en 2023?',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Obtener los puntajes de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Funcionalidades
- Modelo de tipo Transformer de oraciones
- Modelo base: BAAI/bge-base-en-v1.5
- Longitud máxima de secuencia: 512 tokens
- Dimensionalidad de salida: 768 tokens
- Función de similitud: Similitud del coseno
- Licencia: apache-2.0
Casos de uso
- Similitud textual semántica
- Búsqueda semántica
- Minería de parafrases
- Clasificación de texto
- Agrupación