timm/resnetrs152.tf_in1k

timm
Clasificación de imagen

Un modelo de clasificación de imágenes ResNetRS-B. Este modelo cuenta con activaciones ReLU, una única capa de convolución 7x7 con agrupación y un atajo de muestreo reducido de convolución 1x1. Entrenado en ImageNet-1k por los autores del artículo en Tensorflow.

Como usar

from urllib.request import urlopen
from PIL import Image
import timm

img = Image.open(urlopen('https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/beignets-task-guide.png'))

model = timm.create_model('resnetrs152.tf_in1k', pretrained=True)
model = model.eval()

# Obtener transformaciones específicas del modelo (normalización, redimensionado)
data_config = timm.data.resolve_model_data_config(model)
transforms = timm.data.create_transform(**data_config, is_training=False)

output = model(transforms(img).unsqueeze(0)) # añadir una dimensión para convertir la imagen en un lote de tamaño 1

top5_probabilities, top5_class_indices = torch.topk(output.softmax(dim=1) * 100, k=5)
from urllib.request import urlopen
from PIL import Image
import timm

img = Image.open(urlopen('https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/beignets-task-guide.png'))

model = timm.create_model('resnetrs152.tf_in1k', pretrained=True, features_only=True)
model = model.eval()

# Obtener transformaciones específicas del modelo (normalización, redimensionado)
data_config = timm.data.resolve_model_data_config(model)
transforms = timm.data.create_transform(**data_config, is_training=False)

output = model(transforms(img).unsqueeze(0)) # añadir una dimensión para convertir la imagen en un lote de tamaño 1

for o in output:
    print(o.shape)
from urllib.request import urlopen
from PIL import Image
import timm

img = Image.open(urlopen('https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/beignets-task-guide.png'))

model = timm.create_model('resnetrs152.tf_in1k', pretrained=True, num_classes=0)
model = model.eval()

# Obtener transformaciones específicas del modelo (normalización, redimensionado)
data_config = timm.data.resolve_model_data_config(model)
transforms = timm.data.create_transform(**data_config, is_training=False)

output = model(transforms(img).unsqueeze(0)) # La salida es un tensor con forma (tamaño_lote, num_características)

Funcionalidades

Activaciones ReLU
Capa de convolución 7x7 con agrupación
Atajo de muestreo reducido de convolución 1x1

Casos de uso

Clasificación de imágenes
Extracción de mapas de características
Obtención de embeddings de imágenes