all-MiniLM-L6-v2-ct2-int8
jncraton
Similitud de oraciones
Este es un modelo de sentence-transformers: mapea oraciones y párrafos a un espacio vectorial denso de 384 dimensiones y puede ser utilizado para tareas como clustering o búsqueda semántica. El proyecto tiene como objetivo entrenar modelos de embeddings de oraciones en conjuntos de datos a nivel de oración muy grandes utilizando un objetivo de aprendizaje contrastivo auto-supervisado. Utilizamos el modelo preentrenado nreimers/MiniLM-L6-H384-uncased y lo refinamos en un conjunto de datos de 1 mil millones de pares de oraciones.
Como usar
Uso (Sentence-Transformers)
Funcionalidades
- Mapea oraciones y párrafos a un espacio vectorial denso de 384 dimensiones.
- Puede ser utilizado para clustering o búsqueda semántica.
- Utiliza aprendizaje contrastivo auto-supervisado.
- Modelo refinado en un conjunto de datos de 1 mil millones de pares de oraciones.
- Entrenado utilizando TPUs v3-8 eficientes.
Casos de uso
- Codificación de oraciones y párrafos cortos.
- Recuperación de información.
- Clustering.
- Tareas de similitud entre oraciones.