efficientnet_em.ra2_in1k
timm
Clasificación de imagen
Un modelo de clasificación de imágenes EfficientNet-EdgeTPU. Entrenado en ImageNet-1k usando timm y una receta de augmentación aleatoria (RandAugment RA2). Inspirado y evolucionado a partir de recetas RandAugment de EfficientNet. La receta B se publica en ResNet Strikes Back. Utiliza el optimizador RMSProp (comportamiento TF 1.0) y el promedio de pesos EMA. Programa de LR de paso (decadencia exponencial con escalones) con calentamiento inicial.
Como usar
Clasificación de imágenes
from urllib.request import urlopen
from PIL import Image
import timm
img = Image.open(urlopen('https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/beignets-task-guide.png'))
model = timm.create_model('efficientnet_em.ra2_in1k', pretrained=True)
model = model.eval()
data_config = timm.data.resolve_model_data_config(model)
transforms = timm.data.create_transform(**data_config, is_training=False)
output = model(transforms(img).unsqueeze(0))
# probabilities principales y sus índices
Extracción del Mapa de Características
from urllib.request import urlopen
from PIL import Image
import timm
img = Image.open(urlopen('https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/beignets-task-guide.png'))
model = timm.create_model('efficientnet_em.ra2_in1k', pretrained=True, features_only=True)
model = model.eval()
data_config = timm.data.resolve_model_data_config(model)
transforms = timm.data.create_transform(**data_config, is_training=False)
output = model(transforms(img).unsqueeze(0))
Embeddings de Imágenes
from urllib.request import urlopen
from PIL import Image
import timm
img = Image.open(urlopen('https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/beignets-task-guide.png'))
model = timm.create_model('efficientnet_em.ra2_in1k', pretrained=True, num_classes=0)
model = model.eval()
data_config = timm.data.resolve_model_data_config(model)
transforms = timm.data.create_transform(**data_config, is_training=False)
output = model(transforms(img).unsqueeze(0))
output = model.forward_features(transforms(img).unsqueeze(0))
output = model.forward_head(output, pre_logits=True)
Funcionalidades
- Optimización con RMSProp
- Promedio de pesos EMA
- Esquema de LR con disminución exponencial y escalones
- Tamaño de imagen: 240 x 240
- Total de parámetros: 6.9 millones
- GMACs: 3.0
- Activaciones: 14.3 millones
Casos de uso
- Clasificación de imágenes
- Extracción de mapas de características
- Generación de embeddings de imágenes