vit-base-mnist

farleyknight-org-username
Clasificación de imagen

Este modelo es una versión afinada de google/vit-base-patch16-224-in21k en el conjunto de datos mnist. Alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 0.0236, Precisión: 0.9949.

Como usar

El siguiente hiperparámetro se utilizó durante el entrenamiento:

learning_rate: 2e-05
train_batch_size: 8
eval_batch_size: 8
seed: 1337
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 5.0

Resultados del entrenamiento:

Pérdida de entrenamiento

Época
Paso
Pérdida de Validación
Precisión

0.3717
1.0
6375
0.0522
0.9893

0.3453
2.0
12750
0.0370
0.9906

0.3736
3.0
19125
0.0308
0.9916

0.3224
4.0
25500
0.0269
0.9939

0.2846
5.0
31875
0.0236
0.9949

Funcionalidades

Clasificación de imágenes
Transformadores
PyTorch
TensorBoard
Generado a partir de Trainer

Casos de uso

Clasificación de dígitos escritos a mano utilizando el conjunto de datos mnist.