resnet-18

microsoft

Clasificación de imagen

ResNet modelo entrenado en imagenet-1k. Fue introducido en el artículo Deep Residual Learning for Image Recognition y lanzado por primera vez en este repositorio. ResNet introdujo conexiones residuales que permiten entrenar redes con un número no visto de capas (hasta 1000). ResNet ganó la competencia ILSVRC y COCO en 2015, un hito importante en la visión por computadora profunda.

Como usar

Aquí se muestra cómo usar este modelo:
from transformers import AutoImageProcessor, AutoModelForImageClassification
import torch
from datasets import load_dataset

dataset = load_dataset("huggingface/cats-image")
image = dataset["test"]["image"][0]

image_processor = AutoImageProcessor.from_pretrained("microsoft/resnet-18")
model = AutoModelForImageClassification.from_pretrained("microsoft/resnet-18")

inputs = image_processor(image, return_tensors="pt")

with torch.no_grad():
    logits = model(**inputs).logits

# el modelo predice una de las 1000 clases de ImageNet
predicted_label = logits.argmax(-1).item()
print(model.config.id2label[predicted_label])
tiger cat

Funcionalidades

Clasificación de imágenes
Transformers
PyTorch
TensorFlow
Safetensors

Casos de uso

Clasificación de imágenes