xtremedistil-l6-h256-uncased-finetuned_lr-2e-05_epochs-6

husnu
Pregunta y respuesta

Este modelo es una versión ajustada de microsoft/xtremedistil-l6-h256-uncased en el conjunto de datos SQuAD. El modelo alcanza los siguientes resultados en el conjunto de evaluación: pérdida: 1.2578.

Como usar

Hiperparámetros de entrenamiento

Se utilizaron los siguientes hiperparámetros durante el entrenamiento:

learning_rate: 2e-05
train_batch_size: 48
eval_batch_size: 48
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 6

Funcionalidades

Transformers
PyTorch
TensorBoard
Generado desde el Trainer
Endpoints de inferencia

Casos de uso

Responder a preguntas