touchtech/fashion-images-perspectives-vit-large-patch16-224-in21k-v4

touchtech

Clasificación de imagen

Este modelo es una versión afinada de google/vit-large-patch16-224-in21k en el conjunto de datos touchtech/fashion-images-perspectives. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 0.2203, Precisión: 0.9434.

Como usar

El modelo utiliza los siguientes hiperparámetros durante el entrenamiento:
learning_rate: 2e-05
train_batch_size: 8
eval_batch_size: 8
seed: 1337
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: lineal
num_epochs: 5.0

Funcionalidades

Clasificación de imágenes
Transformadores
PyTorch
Modelo afinado usando touchtech/fashion-images-perspectives
Logra una precisión del 94.34%

Casos de uso

Clasificación de imágenes de moda
Evaluación de perspectivas de imágenes de moda