yes_no_qna_deberta_model
nc33
Clasificación de texto
Este modelo es una versión ajustada de microsoft/deberta-v3-base en el conjunto de datos super_glue. El modelo logra los siguientes resultados en el conjunto de evaluación: - Pérdida: 0.5570 - Precisión: 0.8508
Como usar
Los siguientes hiperparámetros se utilizaron durante el entrenamiento:
- tasa de aprendizaje: 2e-05
- tamaño del lote de entrenamiento: 16
- tamaño del lote de evaluación: 16
- semilla: 42
- optimizador: Adam con betas=(0.9,0.999) y epsilon=1e-08
- tipo de programador de tasa de aprendizaje: lineal
- número de épocas: 3
Resultados del entrenamiento:
Pérdida de Entrenamiento
Época
Paso
Pérdida de Validación
Precisión
0.583
1.0
590
0.4086
0.8251
0.348
2.0
1180
0.4170
0.8465
0.2183
3.0
1770
0.5570
0.8508
Versión de los frameworks:
- Transformers 4.25.1
- Pytorch 1.13.0+cu116
- Datasets 2.8.0
- Tokenizers 0.13.2
Funcionalidades
- Clasificación de Texto
- Transformers
- PyTorch
- TensorBoard
- Generado a partir del Entrenador de Evaluación
Casos de uso
- Clasificación de respuestas de sí/no en preguntas
- Evaluación de datasets relacionados con Super Glue
- Mejora en la precisión de clasificación de texto