all-MiniLM-L6-v2-ct2-int8

jncraton

Similitud de oraciones

Este es un modelo de sentence-transformers: mapea oraciones y párrafos a un espacio vectorial denso de 384 dimensiones y puede ser utilizado para tareas como clustering o búsqueda semántica. El proyecto tiene como objetivo entrenar modelos de embeddings de oraciones en conjuntos de datos a nivel de oración muy grandes utilizando un objetivo de aprendizaje contrastivo auto-supervisado. Utilizamos el modelo preentrenado nreimers/MiniLM-L6-H384-uncased y lo refinamos en un conjunto de datos de 1 mil millones de pares de oraciones.

Como usar

Uso (Sentence-Transformers)

Funcionalidades

Mapea oraciones y párrafos a un espacio vectorial denso de 384 dimensiones.
Puede ser utilizado para clustering o búsqueda semántica.
Utiliza aprendizaje contrastivo auto-supervisado.
Modelo refinado en un conjunto de datos de 1 mil millones de pares de oraciones.
Entrenado utilizando TPUs v3-8 eficientes.

Casos de uso

Codificación de oraciones y párrafos cortos.
Recuperación de información.
Clustering.
Tareas de similitud entre oraciones.