Omartificial-Intelligence-Space/Arabic-mpnet-base-all-nli-triplet

Omartificial-Intelligence-Space
Similitud de oraciones

Este es un modelo de sentence-transformers afinado desde tomaarsen/mpnet-base-all-nli-triplet en el conjunto de datos Omartificial-Intelligence-Space/arabic-n_li-triplet. Mapea frases y párrafos en un espacio vectorial denso de 768 dimensiones y se puede utilizar para similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de texto, clustering y más.

Como usar

Primero instala la librería Sentence Transformers:

pip install -U sentence-transformers

Luego puedes cargar este modelo y ejecutar inferencia.

from sentence_transformers import SentenceTransformer

# Descargar del Hub de 🤗
model = SentenceTransformer("Omartificial-Intelligence-Space/mpnet-base-all-nli-triplet-Arabic-mpnet_base")
# Ejecutar inferencia
sentences = [
'يجلس شاب ذو شعر أشقر على الحائط يقرأ جريدة بينما تمر امرأة وفتاة شابة.',
'ذكر شاب ينظر إلى جريدة بينما تمر إمرأتان بجانبه',
'الشاب نائم بينما الأم تقود ابنتها إلى الحديقة',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Obtener las puntuaciones de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Funcionalidades

Modelo de Transformador de Sentencias
Modelo base: tomaarsen/mpnet-base-all-nli-triplet
Longitud máxima de secuencia: 512 tokens
Dimensionalidad de salida: 768 tokens
Función de similitud: Similitud del coseno
Compatible con entornos de producción y experimentación

Casos de uso

Similitud textual semántica
Búsqueda semántica
Minería de paráfrasis
Clasificación de textos
Clustering