cassador/4bs4lr2
cassador
Similitud de oraciones
Este es un modelo de sentence-transformers afinado a partir de indobenchmark/indobert-base-p2 en el conjunto de datos afaji/indonli. Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y se puede usar para similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de textos, agrupamiento, y más.
Como usar
Primero instala la biblioteca de Sentence Transformers:
pip install -U sentence-transformers
Luego puedes cargar este modelo y ejecutar la inferencia.
from sentence_transformers import SentenceTransformer
# Descargar desde el Hub de 🤗
model = SentenceTransformer("cassador/4bs4lr2")
# Ejecutar inferencia
sentences = [
'Tujuan dari acara dengar pendapat CRTC adalah untuk mengumpulkan respons dari pada pemangku kepentingan industri ini dan dari masyarakat umum.',
'Masyarakat umum dilibatkan untuk memberikan respon dalam acara dengar pendapat CRTC.',
'Pembuat Rooms hanya bisa membuat meeting yang terbuka.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Obtener las puntuaciones de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Funcionalidades
- Modelo basado en Sentence Transformer
- Modelo base: indobenchmark/indobert-base-p2
- Longitud máxima de secuencia: 512 tokens
- Dimensionalidad de salida: 768 tokens
- Función de similitud: Similitud del coseno
- Conjunto de datos de entrenamiento: afaji/indonli
Casos de uso
- Similitud textual semántica
- Búsqueda semántica
- Minería de paráfrasis
- Clasificación de textos
- Agrupamiento