Fine_tuned_on_summarized_dataset
HafijulHoquenabid2
Pregunta y respuesta
Este modelo es una versión afinada de google-t5/t5-base en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 1.7484.
Como usar
Hiperparámetros de Entrenamiento
Los siguientes hiperparámetros se utilizaron durante el entrenamiento:
- learning_rate: 3e-05
- train_batch_size: 4
- eval_batch_size: 4
- seed: 42
- gradient_accumulation_steps: 4
- total_train_batch_size: 16
- optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
- lr_scheduler_type: linear
- num_epochs: 4
## Resultados de Entrenamiento
- Pérdida de Entrenamiento
- Época
- Paso
- Pérdida de Validación
1.9488 (Época 1, Paso 113) - Pérdida de Validación: 0.9978
1.8455 (Época 2, Paso 226) - Pérdida de Validación: 1.9956
1.7470 (Época 3, Paso 339) - Pérdida de Validación: 2.9934
1.7591 (Época 4, Paso 452) - Pérdida de Validación: 3.9912
## Versiones del Framework
- Transformers 4.42.4
- Pytorch 2.3.1+cu121
- Datasets 2.21.0
- Tokenizers 0.19.1
Funcionalidades
- Transformers
- Safetensors
- t5
- text2text-generation
- Generated from Trainer
- text-generation-inference
- Inference Endpoints
- AutoTrain Compatible
- apache-2.0 License
- Región: EE.UU.
Casos de uso
- Generación de preguntas y respuestas
- Generación de texto
- Inferencia de endpoints