Fine_tuned_on_summarized_dataset

HafijulHoquenabid2
Pregunta y respuesta

Este modelo es una versión afinada de google-t5/t5-base en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 1.7484.

Como usar

Hiperparámetros de Entrenamiento

Los siguientes hiperparámetros se utilizaron durante el entrenamiento:

- learning_rate: 3e-05
- train_batch_size: 4
- eval_batch_size: 4
- seed: 42
- gradient_accumulation_steps: 4
- total_train_batch_size: 16
- optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
- lr_scheduler_type: linear
- num_epochs: 4

## Resultados de Entrenamiento

- Pérdida de Entrenamiento
- Época
- Paso
- Pérdida de Validación

1.9488 (Época 1, Paso 113) - Pérdida de Validación: 0.9978
1.8455 (Época 2, Paso 226) - Pérdida de Validación: 1.9956
1.7470 (Época 3, Paso 339) - Pérdida de Validación: 2.9934
1.7591 (Época 4, Paso 452) - Pérdida de Validación: 3.9912

## Versiones del Framework

- Transformers 4.42.4
- Pytorch 2.3.1+cu121
- Datasets 2.21.0
- Tokenizers 0.19.1

Funcionalidades

Transformers
Safetensors
t5
text2text-generation
Generated from Trainer
text-generation-inference
Inference Endpoints
AutoTrain Compatible
apache-2.0 License
Región: EE.UU.

Casos de uso

Generación de preguntas y respuestas
Generación de texto
Inferencia de endpoints