SGPT-2.7B-weightedmean-msmarco-specb-bitfit
Muennighoff
Similitud de oraciones
El modelo SGPT-2.7B-weightedmean-msmarco-specb-bitfit es un transformador de oraciones basado en GPTNeo. Fue diseñado principalmente para tareas de búsqueda semántica, fabricación de embeddings de oraciones para determinar la similitud de sentencias y extracción de características.
Como usar
Para instrucciones de uso, consulte nuestro repositorio de código: https://github.com/Muennighoff/sgpt
# Ejemplo de código para usar el modelo
dataloader = torch.utils.data.dataloader.DataLoader(...)
loss = sentence_transformers.losses.MultipleNegativesRankingLoss(...)
modelo.fit(...)
Funcionalidades
- Basado en la arquitectura GPTNeo
- Utiliza embeddings de oraciones para búsqueda semántica
- Compatible con PyTorch
- Capacidades de extracción de características
- Evaluado en múltiples datasets de clasificación y recuperación
- Compatible con entornos de endpoints de inferencia y AutoTrain
Casos de uso
- Búsqueda semántica en bases de datos de documentos
- Clasificación de sentimientos y polaridades en reseñas de productos
- Agrupamiento de documentos científicos
- Re-rankeador en preguntas duplicadas en foros de discusión
- Medición de similitud semántica en oraciones