deberta-base-newsqa

stevemobs

Pregunta y respuesta

Este modelo es una versión ajustada de microsoft/deberta-base en el conjunto de datos None. Alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 0.7628

Como usar

Para usar este modelo, se pueden seguir estos hiperparámetros durante el entrenamiento:
learning_rate: 2e-05
train_batch_size: 12
eval_batch_size: 12
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 2

Funcionalidades

Transformadores
PyTorch
TensorBoard

Casos de uso

Respuesta a preguntas