vit-base-mnist
farleyknight-org-username
Clasificación de imagen
Este modelo es una versión afinada de google/vit-base-patch16-224-in21k en el conjunto de datos mnist. Alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 0.0236, Precisión: 0.9949.
Como usar
El siguiente hiperparámetro se utilizó durante el entrenamiento:
learning_rate: 2e-05
train_batch_size: 8
eval_batch_size: 8
seed: 1337
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 5.0
Resultados del entrenamiento:
Pérdida de entrenamiento
Época
Paso
Pérdida de Validación
Precisión
0.3717
1.0
6375
0.0522
0.9893
0.3453
2.0
12750
0.0370
0.9906
0.3736
3.0
19125
0.0308
0.9916
0.3224
4.0
25500
0.0269
0.9939
0.2846
5.0
31875
0.0236
0.9949
Funcionalidades
- Clasificación de imágenes
- Transformadores
- PyTorch
- TensorBoard
- Generado a partir de Trainer
Casos de uso
- Clasificación de dígitos escritos a mano utilizando el conjunto de datos mnist.