cs3darknet_focus_m.c2ns_in1k
timm
Clasificación de imagen
Un modelo de clasificación de imágenes CS3-DarkNet (Cross-Stage-Partial con 3 convoluciones). Entrenado en ImageNet-1k en timm utilizando la plantilla de receta descrita a continuación. Detalles de la receta: basado en recetas de ResNet Strikes Back sin repeat-aug y con una mezcla más fuerte (mixup). Optimizador SGD (con Nesterov) y AGC (recorte adaptativo del gradiente). No se utilizó profundidad estocástica en esta variación de la receta. Programación de LR coseno con calentamiento.
Como usar
from urllib.request import urlopen
from PIL import Image
import timm
img = Image.open(urlopen('https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/beignets-task-guide.png'))
model = timm.create_model('cs3darknet_focus_m.c2ns_in1k', pretrained=True)
model = model.eval()
# obtener transformaciones específicas del modelo (normalización, cambio de tamaño)
data_config = timm.data.resolve_model_data_config(model)
transforms = timm.data.create_transform(**data_config, is_training=False)
output = model(transforms(img).unsqueeze(0)) # descomprimir la única imagen en un lote de 1
top5_probabilities, top5_class_indices = torch.topk(output.softmax(dim=1) * 100, k=5)
from urllib.request import urlopen
from PIL import Image
import timm
img = Image.open(urlopen('https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/beignets-task-guide.png'))
model = timm.create_model('cs3darknet_focus_m.c2ns_in1k', pretrained=True, features_only=True)
model = model.eval()
# obtener transformaciones específicas del modelo (normalización, cambio de tamaño)
data_config = timm.data.resolve_model_data_config(model)
transforms = timm.data.create_transform(**data_config, is_training=False)
output = model(transforms(img).unsqueeze(0)) # descomprimir la única imagen en un lote de 1
for o in output:
print(o.shape)
from urllib.request import urlopen
from PIL import Image
import timm
img = Image.open(urlopen('https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/beignets-task-guide.png'))
model = timm.create_model('cs3darknet_focus_m.c2ns_in1k', pretrained=True, num_classes=0) # eliminar clasificador nn.Linear
model = model.eval()
# obtener transformaciones específicas del modelo (normalización, cambio de tamaño)
data_config = timm.data.resolve_model_data_config(model)
transforms = timm.data.create_transform(**data_config, is_training=False)
output = model(transforms(img).unsqueeze(0)) # la salida es un tensor en forma de (batch_size, num_features)
# o de manera equivalente (sin necesidad de establecer num_classes=0)
output = model.forward_features(transforms(img).unsqueeze(0))
# la salida no agrupada, un tensor en forma (1, 768, 8, 8)
output = model.forward_head(output, pre_logits=True)
# la salida es un tensor en forma de (1, num_features)
Funcionalidades
- Clasificación de imágenes
- Extracción de mapas de características
- Embeddings de imágenes
- Comparación de modelos
Casos de uso
- Clasificación de imágenes
- Extracción de características de mapas de imágenes
- Generación de embeddings de imágenes