xtremedistil-l6-h256-uncased-finetuned_lr-2e-05_epochs-6
husnu
Pregunta y respuesta
Este modelo es una versión ajustada de microsoft/xtremedistil-l6-h256-uncased en el conjunto de datos SQuAD. El modelo alcanza los siguientes resultados en el conjunto de evaluación: pérdida: 1.2578.
Como usar
Hiperparámetros de entrenamiento
Se utilizaron los siguientes hiperparámetros durante el entrenamiento:
learning_rate: 2e-05
train_batch_size: 48
eval_batch_size: 48
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 6
Funcionalidades
- Transformers
- PyTorch
- TensorBoard
- Generado desde el Trainer
- Endpoints de inferencia
Casos de uso
- Responder a preguntas