bert-base-cased-finetuned-sst2
Este modelo es una versión ajustada de bert-base-cased en el conjunto de datos GLUE SST2. Fue afinado para comparar google/fnet-base como se introduce en este artículo frente a bert-base-cased. El modelo logra los siguientes resultados en el conjunto de evaluación: Pérdida: 0.3649, Precisión: 0.9232. Se entrenó usando el script run_glue.
Como usar
python ../run_glue.py \
--model_name_or_path bert-base-cased \
--task_name sst2 \
--do_train \
--do_eval \
--max_seq_length 512 \
--per_device_train_batch_size 16 \
--learning_rate 2e-5 \
--num_train_epochs 3 \
--output_dir bert-base-cased-finetuned-sst2 \
--push_to_hub \
--hub_strategy all_checkpoints \
--logging_strategy epoch \
--save_strategy epoch \
--evaluation_strategy epoch
Hyperparámetros de entrenamiento
Los siguientes hiperparámetros se usaron durante el entrenamiento:
- learning_rate: 2e-05
- train_batch_size: 16
- eval_batch_size: 8
- seed: 42
- optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
- lr_scheduler_type: linear
- num_epochs: 3.0
Resultados de entrenamiento
| Pérdida de entrenamiento | Época | Paso | Precisión | Pérdida de validación |
|:------------------------:|:-----:|:-----:|:---------:|:---------------------:|
| 0.233 | 1.0 | 4210 | 0.9174 | 0.2841 |
| 0.1261 | 2.0 | 8420 | 0.9278 | 0.3310 |
| 0.0768 | 3.0 | 12630 | 0.9232 | 0.3649 |
Versiones del framework
- Transformers 4.11.0.dev0
- Pytorch 1.9.0
- Datasets 1.12.1
- Tokenizers 0.10.3
Funcionalidades
- Clasificación de texto
- Transformers
- PyTorch
- TensorBoard
Casos de uso
- Clasificación de sentimientos en texto