indoSBERT-grande
denaya
Similitud de oraciones
Este es un modelo de sentence-transformers: mapea oraciones y párrafos a un espacio vectorial denso de 256 dimensiones y puede ser utilizado para tareas como agrupamiento o búsqueda semántica. IndoSBERT es una modificación de https://huggingface.co/indobenchmark/indobert-large-p1 que ha sido afinado utilizando el esquema de red siamesa inspirado en SBERT (Reimers et al., 2019). Este modelo fue afinado con el STS Dataset (2012-2016) que fue traducido automáticamente al idioma indonesio. Este modelo puede proporcionar embeddings de oraciones semánticas significativas para oraciones en indonesio.
Como usar
Usar este modelo se vuelve fácil cuando tienes sentence-transformers instalado:
pip install -U sentence-transformers
Luego puedes utilizar el modelo así:
from sentence_transformers import SentenceTransformer
sentences = ["Komposer favorit saya adalah Joe Hisaishi", "Sapo tahu enak banget"]
model = SentenceTransformer('denaya/indoSBERT-large')
embeddings = model.encode(sentences)
print(embeddings)
Funcionalidades
- Transformadores de oraciones
- Espacio vectorial denso de 256 dimensiones
- Afinado con el esquema de red siamesa de SBERT
- Proporciona embeddings semánticos de oraciones
Casos de uso
- Clustering
- Búsqueda semántica