indoSBERT-grande

denaya

Similitud de oraciones

Este es un modelo de sentence-transformers: mapea oraciones y párrafos a un espacio vectorial denso de 256 dimensiones y puede ser utilizado para tareas como agrupamiento o búsqueda semántica. IndoSBERT es una modificación de https://huggingface.co/indobenchmark/indobert-large-p1 que ha sido afinado utilizando el esquema de red siamesa inspirado en SBERT (Reimers et al., 2019). Este modelo fue afinado con el STS Dataset (2012-2016) que fue traducido automáticamente al idioma indonesio. Este modelo puede proporcionar embeddings de oraciones semánticas significativas para oraciones en indonesio.

Como usar

Usar este modelo se vuelve fácil cuando tienes sentence-transformers instalado:
pip install -U sentence-transformers

Luego puedes utilizar el modelo así:
from sentence_transformers import SentenceTransformer
sentences = ["Komposer favorit saya adalah Joe Hisaishi", "Sapo tahu enak banget"]

model = SentenceTransformer('denaya/indoSBERT-large')
embeddings = model.encode(sentences)
print(embeddings)

Funcionalidades

Transformadores de oraciones
Espacio vectorial denso de 256 dimensiones
Afinado con el esquema de red siamesa de SBERT
Proporciona embeddings semánticos de oraciones

Casos de uso

Clustering
Búsqueda semántica