deberta_squadnewsqa
sophiebottani
Pregunta y respuesta
Este modelo es una versión afinada de microsoft/deberta-v3-base en los conjuntos de datos Squad_v2 y NewsQA. Alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 0.9648.
Como usar
Los siguientes hiperparámetros se utilizaron durante el entrenamiento:
learning_rate: 2e-05
train_batch_size: 8
eval_batch_size: 8
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 1
Funcionalidades
- Transformers
- Cuestionario
- PyTorch
- squad_v2
- newsqa
- deberta-v2
- Generado a partir de Trainer
- Endpoints de Inferencia