embed-andegpt-H384

enpaiva
Similitud de oraciones

Este modelo es una versión fine-tuned de nreimers/MiniLM-L6-H384-uncased de sentence-transformers. Mapea oraciones y párrafos a un espacio vectorial denso de 384 dimensiones y puede ser utilizado para similitud semántica textual, búsqueda semántica, minería de paráfrasis, clasificación de texto, clustering y más.

Como usar

Uso Directo (Transformadores de Oración)

Primero, instale la biblioteca Sentence Transformers:

pip install -U sentence-transformers

Luego puede cargar este modelo y ejecutar la inferencia:

from sentence_transformers import SentenceTransformer

# Descargar desde el Hub de 🤗
model = SentenceTransformer("enpaiva/embed-andegpt-H384")
# Ejecutar la inferencia
sentences = [
'¿Cuál es el nombre del reglamento que se menciona en la información proporcionada?',
'Reglamento de Baja Tensión de la ANDE: El 10- trata sobre Partes de que se compone una instalación eléctrica: y tiene las siguientes sub-secciones: 10.1 ',
'Reglamento de Baja Tensión de la ANDE: El 37- trata sobre Soldadura eléctrica: y tiene las siguientes sub-secciones: 37.1, 37.2, 37.3, 37.4 ',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 384]

# Obtener las puntuaciones de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Funcionalidades

Modelo transformador de oración
Modelo base: nreimers/MiniLM-L6-H384-uncased
Longitud máxima de secuencia: 512 tokens
Dimensionalidad de salida: 384 tokens
Función de similitud: Similitud coseno
Idioma: español
Licencia: apache-2.0

Casos de uso

Similitud semántica textual
Búsqueda semántica
Minería de paráfrasis
Clasificación de texto
Clustering