yes_no_qna_deberta_model

nc33
Clasificación de texto

Este modelo es una versión ajustada de microsoft/deberta-v3-base en el conjunto de datos super_glue. El modelo logra los siguientes resultados en el conjunto de evaluación: - Pérdida: 0.5570 - Precisión: 0.8508

Como usar

Los siguientes hiperparámetros se utilizaron durante el entrenamiento:

  • tasa de aprendizaje: 2e-05
  • tamaño del lote de entrenamiento: 16
  • tamaño del lote de evaluación: 16
  • semilla: 42
  • optimizador: Adam con betas=(0.9,0.999) y epsilon=1e-08
  • tipo de programador de tasa de aprendizaje: lineal
  • número de épocas: 3

Resultados del entrenamiento:

Pérdida de Entrenamiento
Época
Paso
Pérdida de Validación
Precisión

0.583
1.0
590
0.4086
0.8251

0.348
2.0
1180
0.4170
0.8465

0.2183
3.0
1770
0.5570
0.8508

Versión de los frameworks:

  • Transformers 4.25.1
  • Pytorch 1.13.0+cu116
  • Datasets 2.8.0
  • Tokenizers 0.13.2

Funcionalidades

Clasificación de Texto
Transformers
PyTorch
TensorBoard
Generado a partir del Entrenador de Evaluación

Casos de uso

Clasificación de respuestas de sí/no en preguntas
Evaluación de datasets relacionados con Super Glue
Mejora en la precisión de clasificación de texto