xtremedistil-l6-h256-uncased-finetuned_lr-2e-05_epochs-3

husnu
Pregunta y respuesta

Este modelo es una versión ajustada de microsoft/xtremedistil-l6-h256-uncased en el conjunto de datos squad. Alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 1.2864.

Como usar

Los siguientes hiperparámetros fueron utilizados durante el entrenamiento:

learning_rate: 2e-05
train_batch_size: 16
eval_batch_size: 16
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 3

Funcionalidades

Cuestionario de respuestas
Transformadores
PyTorch
TensorBoard

Casos de uso

Cuestionario de respuestas en el conjunto de datos SQuAD