SGPT-2.7B-weightedmean-msmarco-specb-bitfit

Muennighoff
Similitud de oraciones

El modelo SGPT-2.7B-weightedmean-msmarco-specb-bitfit es un transformador de oraciones basado en GPTNeo. Fue diseñado principalmente para tareas de búsqueda semántica, fabricación de embeddings de oraciones para determinar la similitud de sentencias y extracción de características.

Como usar

Para instrucciones de uso, consulte nuestro repositorio de código: https://github.com/Muennighoff/sgpt

# Ejemplo de código para usar el modelo
dataloader = torch.utils.data.dataloader.DataLoader(...)
loss = sentence_transformers.losses.MultipleNegativesRankingLoss(...)
modelo.fit(...)

Funcionalidades

Basado en la arquitectura GPTNeo
Utiliza embeddings de oraciones para búsqueda semántica
Compatible con PyTorch
Capacidades de extracción de características
Evaluado en múltiples datasets de clasificación y recuperación
Compatible con entornos de endpoints de inferencia y AutoTrain

Casos de uso

Búsqueda semántica en bases de datos de documentos
Clasificación de sentimientos y polaridades en reseñas de productos
Agrupamiento de documentos científicos
Re-rankeador en preguntas duplicadas en foros de discusión
Medición de similitud semántica en oraciones