xtremedistil-l6-h256-uncased-TQUAD-finetuned_lr-2e-05_epochs-3
husnu
Pregunta y respuesta
Este modelo es una versión afinada de microsoft/xtremedistil-l6-h256-uncased en el conjunto de datos turco de SQuAD. Alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 2.6510
Como usar
Los siguientes hiperparámetros se utilizaron durante el entrenamiento:
- learning_rate: 2e-05
- train_batch_size: 16
- eval_batch_size: 16
- seed: 42
- optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
- lr_scheduler_type: linear
- num_epochs: 3
Resultados de entrenamiento:
Pérdida de Entrenamiento
Época
Paso
Pérdida de Validación
3.0113
1.0
1050
2.7529
2.838
2.0
2100
2.6510
2.8168
3.0
3150
2.6510
Versiones del marco
Transformers 4.15.0
Pytorch 1.10.0+cu111
Datasets 1.17.0
Tokenizers 0.10.3
Funcionalidades
- Respuesta a preguntas
- Transformers
- PyTorch
- TensorBoard
- Generado a partir de Trainer
- Puntos finales de Inferencia
Casos de uso
- Responder a preguntas en turco