resnet-18
microsoft
Clasificación de imagen
ResNet modelo entrenado en imagenet-1k. Fue introducido en el artículo Deep Residual Learning for Image Recognition y lanzado por primera vez en este repositorio. ResNet introdujo conexiones residuales que permiten entrenar redes con un número no visto de capas (hasta 1000). ResNet ganó la competencia ILSVRC y COCO en 2015, un hito importante en la visión por computadora profunda.
Como usar
Aquí se muestra cómo usar este modelo:
from transformers import AutoImageProcessor, AutoModelForImageClassification
import torch
from datasets import load_dataset
dataset = load_dataset("huggingface/cats-image")
image = dataset["test"]["image"][0]
image_processor = AutoImageProcessor.from_pretrained("microsoft/resnet-18")
model = AutoModelForImageClassification.from_pretrained("microsoft/resnet-18")
inputs = image_processor(image, return_tensors="pt")
with torch.no_grad():
logits = model(**inputs).logits
# el modelo predice una de las 1000 clases de ImageNet
predicted_label = logits.argmax(-1).item()
print(model.config.id2label[predicted_label])
tiger cat
Funcionalidades
- Clasificación de imágenes
- Transformers
- PyTorch
- TensorFlow
- Safetensors
Casos de uso
- Clasificación de imágenes