Omartificial-Intelligence-Space/Arabic-all-nli-triplet-Matryoshka
Omartificial-Intelligence-Space
Similitud de oraciones
Un modelo de sentence-transformers afinado a partir de sentence-transformers/paraphrase-multilingual-mpnet-base-v2, sobre el conjunto de datos Omartificial-Intelligence-Space/arabic-n_li-triplet. Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y se puede utilizar para similitud semántica textual, búsqueda semántica, minería de paráfrasis, clasificación de texto, agrupamiento y más.
Como usar
Primero instale la biblioteca de Sentence Transformers:
pip install -U sentence-transformers
Luego puede cargar este modelo y ejecutar inferencias.
from sentence_transformers import SentenceTransformer
# Descarga desde el Hub de 🤗
model = SentenceTransformer("Omartificial-Intelligence-Space/Arabic-Nli-Matryoshka")
# Ejecutar inferencias
sentences = [
'يجلس شاب ذو شعر أشقر على الحائط يقرأ جريدة بينما تمر امرأة وفتاة شابة.',
'ذكر شاب ينظر إلى جريدة بينما تمر إمرأتان بجانبه',
'الشاب نائم بينما الأم تقود ابنتها إلى الحديقة',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Obtener las puntuaciones de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Funcionalidades
- Tipo de Modelo: Sentence Transformer
- Modelo base: sentence-transformers/paraphrase-multilingual-mpnet-base-v2
- Longitud máxima de secuencia: 128 tokens
- Dimensionalidad de salida: 768 tokens
- Función de similitud: Similitud coseno
- Conjunto de datos de entrenamiento: Omartificial-Intelligence-Space/arabic-n_li-triplet
Casos de uso
- Similitud semántica entre textos
- Búsqueda semántica
- Minería de paráfrasis
- Clasificación de textos
- Agrupamiento de textos