Clasificador de Pokémon

imjeffhi
Clasificación de imagen

Una versión ajustada de ViT-base en un conjunto de imágenes de Pokémon recolectadas. Puedes leer más sobre el modelo aquí.

Como usar

from transformers import ViTForImageClassification, ViTFeatureExtractor
from PIL import Image
import torch

# Cargando el modelo
device = "cuda" if torch.cuda.is_available() else "cpu"
model = ViTForImageClassification.from_pretrained( "imjeffhi/pokemon_classifier").to(device)
feature_extractor = ViTFeatureExtractor.from_pretrained('imjeffhi/pokemon_classifier')

# Llamando al modelo en una imagen de prueba
img = Image.open('test.jpg')
extracted = feature_extractor(images=img, return_tensors='pt').to(device)
predicted_id = model(**extracted).logits.argmax(-1).item()
predicted_pokemon = model.config.id2label[predicted_id]

Funcionalidades

Clasificación de imágenes
Uso de Transformers
Compatibilidad con PyTorch
Puntos finales de inferencia

Casos de uso

Clasificación de imágenes de Pokémon
Identificación de especies de Pokémon en imágenes