flax-sentence-embeddings/all_datasets_v3_roberta-large
El proyecto tiene como objetivo entrenar modelos de incrustación de oraciones en conjuntos de datos a nivel de oraciones muy grandes utilizando un objetivo de aprendizaje contrastivo auto-supervisado. Usamos el modelo roberta-large preentrenado y lo afinamos en un conjunto de datos de 1B pares de oraciones. Usamos un objetivo de aprendizaje contrastivo: dada una oración del par, el modelo debe predecir cuál de un conjunto de otras oraciones muestreadas aleatoriamente fue realmente emparejada con ella en nuestro conjunto de datos. Desarrollamos este modelo durante la Semana de la Comunidad utilizando JAX/Flax para NLP y CV, organizada por Hugging Face, como parte del proyecto Entrenar el Mejor Modelo de Incrustación de Oraciones de Todos los Tiempos con 1B Pares de Entrenamiento. Nos beneficiamos de una infraestructura de hardware eficiente para ejecutar el proyecto: 7 TPUs v3-8, así como de la intervención de miembros del equipo de Flax, JAX y Cloud de Google sobre marcos eficientes de aprendizaje profundo.
Como usar
Aquí está cómo usar este modelo para obtener las características de un texto dado utilizando la biblioteca SentenceTransformers:
from sentence_transformers import SentenceTransformer
modelo = SentenceTransformer('flax-sentence-embeddings/all_datasets_v3_roberta-large')
texto = "Reemplázame por cualquier texto que te guste."
texto_embedding = modelo.encode(texto)
# array([-0.01559514, 0.04046123, 0.1317083 , 0.00085931, 0.04585106,
# -0.05607086, 0.0138078 , 0.03569756, 0.01420381, 0.04266302 ...],
# dtype=float32)
Funcionalidades
- Uso del modelo roberta-large preentrenado
- Objetivo de aprendizaje contrastivo auto-supervisado
- Entrenado en un conjunto de datos de más de 1 mil millones de pares de oraciones
- Infraestructura de hardware de 7 TPUs v3-8
- Desarrollado durante la semana de la comunidad de Hugging Face utilizando JAX/Flax
Casos de uso
- Codificación de oraciones
- Recuperación de información
- Agrupamiento
- Tareas de similitud de oraciones