timm/convnext_pico_ols.d1_in1k

timm

Clasificación de imagen

Un modelo de clasificación de imágenes ConvNeXt. Entrenado en timm en ImageNet-1k por Ross Wightman. Este modelo está diseñado para clasificación de imágenes, extracción de mapas de características y embeddings de imágenes. Detalles del modelo: tipo de modelo: clasificación de imágenes / columna vertebral de características, parámetros: 9.1M, GMACs: 1.4, activaciones: 6.5M, tamaño de imagen: entrenamiento = 224x224, prueba = 288x288.

Como usar

from urllib.request import urlopen
from PIL import Image
import timm

# Clasificación de imágenes
img = Image.open(urlopen('https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/beignets-task-guide.png'))
model = timm.create_model('convnext_pico_ols.d1_in1k', pretrained=True)
model = model.eval()
data_config = timm.data.resolve_model_data_config(model)
transforms = timm.data.create_transform(**data_config, is_training=False)
output = model(transforms(img).unsqueeze(0)) 

# Extracción de mapas de características
model = timm.create_model('convnext_pico_ols.d1_in1k', pretrained=True, features_only=True)
model = model.eval()
output = model(transforms(img).unsqueeze(0))

# Embeddings de imágenes
model = timm.create_model('convnext_pico_ols.d1_in1k', pretrained=True, num_classes=0)
model = model.eval()
output = model(transforms(img).unsqueeze(0))
output = model.forward_features(transforms(img).unsqueeze(0))
output = model.forward_head(output, pre_logits=True)

Funcionalidades

Clasificación de imágenes
Extracción de mapas de características
Embeddings de imágenes
Núcleo de características

Casos de uso

Clasificación de imágenes
Extracción de características de imágenes
Generación de embeddings de imágenes