timm/tf_efficientnet_b5.ap_in1k

timm
Clasificación de imagen

Un modelo de clasificación de imágenes EfficientNet. Entrenado en ImageNet-1k con AdvProp (ejemplos adversariales) en Tensorflow por los autores del artículo, portado a PyTorch por Ross Wightman.

Como usar

from urllib.request import urlopen
from PIL import Image
import timm

img = Image.open(urlopen(
'https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/beignets-task-guide.png'
))

model = timm.create_model('tf_efficientnet_b5.ap_in1k', pretrained=True)
model = model.eval()

# obtener transformaciones específicas del modelo (normalización, redimensionado)
data_config = timm.data.resolve_model_data_config(model)
transforms = timm.data.create_transform(**data_config, is_training=False)

output = model(transforms(img).unsqueeze(0)) # redimensionar imagen única en lote de 1

top5_probabilities, top5_class_indices = torch.topk(output.softmax(dim=1) * 100, k=5)

Funcionalidades

Clasificación de imágenes
Extracción del mapa de características
Generación de embeddings de imágenes

Casos de uso

Clasificación de imágenes para tareas de visión por computadora
Extracción de características de imágenes para análisis más complejo
Generación de embeddings para tareas personalizadas de aprendizaje profundo