deberta-base-newsqa
stevemobs
Pregunta y respuesta
Este modelo es una versión ajustada de microsoft/deberta-base en el conjunto de datos None. Alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 0.7628
Como usar
Para usar este modelo, se pueden seguir estos hiperparámetros durante el entrenamiento:
learning_rate: 2e-05
train_batch_size: 12
eval_batch_size: 12
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 2
Funcionalidades
- Transformadores
- PyTorch
- TensorBoard
Casos de uso
- Respuesta a preguntas