timm/fbnetc_100.rmsp_in1k

timm
Clasificación de imagen

Un modelo de clasificación de imágenes FBNet. Entrenado en ImageNet-1k con timm utilizando la plantilla de receta descrita a continuación. Detalles de la receta: una receta simple basada en RmsProp sin RandAugment. Utilizando RandomErasing, mixup, dropout y la augmentación estándar de crop de redimensionamiento aleatorio. Optimizador RMSProp (comportamiento TF 1.0), EMA promediado de peso. Programación de LR de decaimiento exponencial con warmup.

Como usar

from urllib.request import urlopen
from PIL import Image
import timm

img = Image.open(urlopen(
'https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/beignets-task-guide.png'
))

model = timm.create_model('fbnetc_100.rmsp_in1k', pretrained=True)
model = model.eval()

# obtener las transformaciones específicas del modelo (normalización, redimensionamiento)
data_config = timm.data.resolve_model_data_config(model)
transforms = timm.data.create_transform(**data_config, is_training=False)

output = model(transforms(img).unsqueeze(0)) # añadir una dimersión para imagen única

top5_probabilities, top5_class_indices = torch.topk(output.softmax(dim=1) * 100, k=5)

Funcionalidades

Clasificación de imágenes
Extracción de mapas de características
Embeddings de imágenes

Casos de uso

Clasificación de imágenes
Extracción de mapas de características
Obtención de embeddings de imágenes para otras tareas de visión por computadora