RegNet-Y-040
facebook
Clasificación de imagen
El modelo RegNet entrenado en imagenet-1k. Fue introducido en el artículo 'Designing Network Design Spaces' y lanzado por primera vez en este repositorio. Los autores diseñan espacios de búsqueda para realizar la Búsqueda de Arquitectura Neural (NAS). Primero comienzan desde un espacio de búsqueda de alta dimensión y reducen iterativamente el espacio de búsqueda aplicando empíricamente restricciones basadas en los modelos de mejor rendimiento muestreados por el espacio de búsqueda actual.
Como usar
Aquí está cómo usar este modelo:
from transformers import AutoFeatureExtractor, RegNetForImageClassification
import torch
from datasets import load_dataset
dataset = load_dataset("huggingface/cats-image")
image = dataset["test"]["image"][0]
feature_extractor = AutoFeatureExtractor.from_pretrained("facebook/regnet-y-040")
model = RegNetForImageClassification.from_pretrained("facebook/regnet-y-040")
inputs = feature_extractor(image, return_tensors="pt")
with torch.no_grad():
logits = model(**inputs).logits
# El modelo predice una de las 1000 clases ImageNet
predicted_label = logits.argmax(-1).item()
print(model.config.id2label[predicted_label])
'tabby, tabby cat'
Para más ejemplos de código, consulte la documentación.
Funcionalidades
- Entrenado en imagenet-1k
- Realiza la Búsqueda de Arquitectura Neural (NAS)
- Aplicación de restricciones empíricas
Casos de uso
- Clasificación de imágenes