google/mobilenet_v1_1.0_224

google

Clasificación de imagen

MobileNet V1 es un modelo preentrenado en ImageNet-1k con una resolución de 224x224. Fue introducido en el artículo MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications por Howard et al, y lanzado por primera vez en este repositorio. MobileNets son modelos pequeños, de baja latencia y bajo consumo de energía parametrizados para satisfacer las restricciones de recursos de una variedad de casos de uso. Pueden ser utilizados para clasificación, detección, incrustaciones y segmentación, similar a cómo se utilizan otros modelos populares a gran escala, como Inception. MobileNets pueden ejecutarse eficientemente en dispositivos móviles, equilibrando entre latencia, tamaño y precisión, comparándose favorablemente con modelos populares de la literatura.

Como usar

from transformers import AutoImageProcessor, AutoModelForImageClassification
from PIL import Image
import requests

url = "http://images.cocodataset.org/val2017/000000039769.jpg"
image = Image.open(requests.get(url, stream=True).raw)

preprocessor = AutoImageProcessor.from_pretrained("google/mobilenet_v1_1.0_224")
model = AutoModelForImageClassification.from_pretrained("google/mobilenet_v1_1.0_224")

inputs = preprocessor(images=image, return_tensors="pt")

outputs = model(**inputs)
logits = outputs.logits

# el modelo predice una de las 1000 clases de ImageNet
predicted_class_idx = logits.argmax(-1).item()
print("Clase predicha:", model.config.id2label[predicted_class_idx])

Funcionalidades

Clasificación
Detección
Incrustaciones
Segmentación

Casos de uso

Clasificación de imágenes