stevemobs/deberta-base-combined-squad1-aqa-newsqa-50-and-newsqa-50
stevemobs
Pregunta y respuesta
Este modelo es una versión ajustada de stevemobs/deberta-base-combined-squad1-aqa-newsqa-50 en el conjunto de datos None. Se logra la siguiente puntuación en el conjunto de evaluación: Pérdida: 0.4881
Como usar
Estos son los hiperparámetros utilizados durante el entrenamiento:
- learning_rate: 2e-05
- train_batch_size: 12
- eval_batch_size: 12
- seed: 42
- optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
- lr_scheduler_type: linear
- num_epochs: 2
Funcionalidades
- Ajuste fino en el conjunto de datos combinado Squad1, AQA, y NewsQA
- Transformers
- PyTorch
- TensorBoard
Casos de uso
- Respuestas a preguntas