embed-andegpt-H384
enpaiva
Similitud de oraciones
Este modelo es una versión fine-tuned de nreimers/MiniLM-L6-H384-uncased de sentence-transformers. Mapea oraciones y párrafos a un espacio vectorial denso de 384 dimensiones y puede ser utilizado para similitud semántica textual, búsqueda semántica, minería de paráfrasis, clasificación de texto, clustering y más.
Como usar
Uso Directo (Transformadores de Oración)
Primero, instale la biblioteca Sentence Transformers:
pip install -U sentence-transformers
Luego puede cargar este modelo y ejecutar la inferencia:
from sentence_transformers import SentenceTransformer
# Descargar desde el Hub de 🤗
model = SentenceTransformer("enpaiva/embed-andegpt-H384")
# Ejecutar la inferencia
sentences = [
'¿Cuál es el nombre del reglamento que se menciona en la información proporcionada?',
'Reglamento de Baja Tensión de la ANDE: El 10- trata sobre Partes de que se compone una instalación eléctrica: y tiene las siguientes sub-secciones: 10.1 ',
'Reglamento de Baja Tensión de la ANDE: El 37- trata sobre Soldadura eléctrica: y tiene las siguientes sub-secciones: 37.1, 37.2, 37.3, 37.4 ',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 384]
# Obtener las puntuaciones de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Funcionalidades
- Modelo transformador de oración
- Modelo base: nreimers/MiniLM-L6-H384-uncased
- Longitud máxima de secuencia: 512 tokens
- Dimensionalidad de salida: 384 tokens
- Función de similitud: Similitud coseno
- Idioma: español
- Licencia: apache-2.0
Casos de uso
- Similitud semántica textual
- Búsqueda semántica
- Minería de paráfrasis
- Clasificación de texto
- Clustering