RegNet-Y-040

facebook
Clasificación de imagen

El modelo RegNet entrenado en imagenet-1k. Fue introducido en el artículo 'Designing Network Design Spaces' y lanzado por primera vez en este repositorio. Los autores diseñan espacios de búsqueda para realizar la Búsqueda de Arquitectura Neural (NAS). Primero comienzan desde un espacio de búsqueda de alta dimensión y reducen iterativamente el espacio de búsqueda aplicando empíricamente restricciones basadas en los modelos de mejor rendimiento muestreados por el espacio de búsqueda actual.

Como usar

Aquí está cómo usar este modelo:

from transformers import AutoFeatureExtractor, RegNetForImageClassification
import torch
from datasets import load_dataset

dataset = load_dataset("huggingface/cats-image")
image = dataset["test"]["image"][0]

feature_extractor = AutoFeatureExtractor.from_pretrained("facebook/regnet-y-040")
model = RegNetForImageClassification.from_pretrained("facebook/regnet-y-040")

inputs = feature_extractor(image, return_tensors="pt")

with torch.no_grad():
    logits = model(**inputs).logits

# El modelo predice una de las 1000 clases ImageNet
predicted_label = logits.argmax(-1).item()
print(model.config.id2label[predicted_label])
'tabby, tabby cat'

Para más ejemplos de código, consulte la documentación.

Funcionalidades

Entrenado en imagenet-1k
Realiza la Búsqueda de Arquitectura Neural (NAS)
Aplicación de restricciones empíricas

Casos de uso

Clasificación de imágenes