yes_no_qna_deberta_model

nc33

Clasificación de texto

Este modelo es una versión ajustada de microsoft/deberta-v3-base en el conjunto de datos super_glue. El modelo logra los siguientes resultados en el conjunto de evaluación: - Pérdida: 0.5570 - Precisión: 0.8508

Como usar

Los siguientes hiperparámetros se utilizaron durante el entrenamiento:

tasa de aprendizaje: 2e-05
tamaño del lote de entrenamiento: 16
tamaño del lote de evaluación: 16
semilla: 42
optimizador: Adam con betas=(0.9,0.999) y epsilon=1e-08
tipo de programador de tasa de aprendizaje: lineal
número de épocas: 3

Resultados del entrenamiento:
Pérdida de Entrenamiento
Época
Paso
Pérdida de Validación
Precisión

0.583
1.0
590
0.4086
0.8251

0.348
2.0
1180
0.4170
0.8465

0.2183
3.0
1770
0.5570
0.8508

Versión de los frameworks:

Transformers 4.25.1
Pytorch 1.13.0+cu116
Datasets 2.8.0
Tokenizers 0.13.2

Funcionalidades

Clasificación de Texto
Transformers
PyTorch
TensorBoard
Generado a partir del Entrenador de Evaluación

Casos de uso

Clasificación de respuestas de sí/no en preguntas
Evaluación de datasets relacionados con Super Glue
Mejora en la precisión de clasificación de texto