Ananthus-BAAI-for-contracts6.0
Ananthu357
Similitud de oraciones
Este es un modelo de transformadores de oraciones afinado a partir de BAAI/bge-large-en. Mapea oraciones y párrafos a un espacio vectorial denso de 1024 dimensiones y puede ser utilizado para similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de texto, agrupación y más.
Como usar
Primero instala la biblioteca de Sentence Transformers:
pip install -U sentence-transformers
Luego puedes cargar este modelo y ejecutar la inferencia.
from sentence_transformers import SentenceTransformer
# Descargar desde el Hub 🤗
model = SentenceTransformer("Ananthu357/Ananthus-BAAI-for-contracts6.0")
# Ejecutar inferencia
sentences = [
'What is the deadline to submit the proposed project schedule?',
'Any item of work carried out by the Contractor on the instructions of the Engineer which is not included in the accepted Schedules of Rates shall be executed at the rates set forth in the Schedule of Rates of Railway.',
'\xa0 \xa0 \xa0 \xa0 The Contractor shall at his own expense provide with sheds, storehouses and yards in such situations and in such numbers',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Obtener los puntajes de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Funcionalidades
- Modelo de Transformadores de Oraciones basado en BAAI/bge-large-en
- Longitud máxima de secuencia: 512 tokens
- Dimensionalidad de salida: 1024 tokens
- Función de similitud: Similitud Coseno
Casos de uso
- Similitud textual semántica
- Búsqueda semántica
- Minería de paráfrasis
- Clasificación de texto
- Agrupación