stevemobs/deberta-base-combined-squad1-aqa-newsqa-50-and-newsqa-50

stevemobs

Pregunta y respuesta

Este modelo es una versión ajustada de stevemobs/deberta-base-combined-squad1-aqa-newsqa-50 en el conjunto de datos None. Se logra la siguiente puntuación en el conjunto de evaluación: Pérdida: 0.4881

Como usar

Estos son los hiperparámetros utilizados durante el entrenamiento:
- learning_rate: 2e-05
- train_batch_size: 12
- eval_batch_size: 12
- seed: 42
- optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
- lr_scheduler_type: linear
- num_epochs: 2

Funcionalidades

Ajuste fino en el conjunto de datos combinado Squad1, AQA, y NewsQA
Transformers
PyTorch
TensorBoard

Casos de uso

Respuestas a preguntas