juanpablomesa / all-mpnet-base-v2-bioasq-matryoshka
juanpablomesa
Similitud de oraciones
Este es un modelo fine-tuned de sentence-transformers/all-mpnet-base-v2. Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede ser utilizado para la similitud semántica textual, búsqueda semántica, minería de paráfrasis, clasificación de texto, clustering y más.
Como usar
Uso Directo (Transformadores de Oraciones)
Primero instala la librería de Transformadores de Oraciones:
pip install -U sentence-transformers
Luego puedes cargar este modelo y ejecutar inferencias.
from sentence_transformers import SentenceTransformer
# Descarga desde el 🤗 Hub
model = SentenceTransformer("juanpablomesa/all-mpnet-base-v2-bioasq-matryoshka")
# Ejecuta inferencias
sentences = [
'La diversidad de Pcdh multicluster es necesaria para el ensamblaje del circuito neural olfativo en ratones. Las proteínas de superficie celular de protocadherina (Pcdh) están codificadas por tres grupos de genes estrechamente ligados (Pcdhα, Pcdhβ y Pcdhγ). Aunque la eliminación de clusters individuales de Pcdh tuvo consecuencias fenotípicas sutiles, la pérdida de los tres clusters (eliminación tricúster) llevó a un defecto severo de arborización axonal y pérdida de autoevitación.',
'¿Cuáles son los efectos de la eliminación de los tres clusters de Pcdh (eliminación tricúster) en los ratones?',
'¿Cuántos periodos de innovación regulatoria condujeron a la evolución de los vertebrados?',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Obtén los puntajes de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Funcionalidades
- Modelo Transformer de oraciones
- Modelo base: sentence-transformers/all-mpnet-base-v2
- Longitud máxima de secuencia: 384 tokens
- Dimensionalidad de salida: 768 tokens
- Función de similitud: Similitud de coseno
- Lenguaje: Inglés
- Licencia: apache-2.0
Casos de uso
- Similitud semántica textual
- Búsqueda semántica
- Minería de paráfrasis
- Clasificación de texto
- Clustering