nateraw/food

nateraw
Clasificación de imagen

Este modelo es una versión afinada de google/vit-base-patch16-224-in21k en el conjunto de datos nateraw/food101. Alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 0.4501, Precisión: 0.8913.

Como usar

from transformers import ViTFeatureExtractor, ViTForImageClassification
from PIL import Image
import requests

# Cargar el model
model = ViTForImageClassification.from_pretrained('nateraw/food')
# Extraer características
feature_extractor = ViTFeatureExtractor.from_pretrained('nateraw/food')

# Función de predicción
def predict(image_path):
    image = Image.open(image_path)
    inputs = feature_extractor(images=image, return_tensors='pt')
    outputs = model(**inputs)
    logits = outputs.logits
    predicted_class_idx = logits.argmax(-1).item()
    return predicted_class_idx

# Ejemplo de uso
predicted_class = predict('ruta/a/la/imagen.jpg')
print(f'Predicted class: {predicted_class}')

Funcionalidades

Clasificación de imágenes
Transformers
PyTorch
TensorBoard
Generado a partir de Trainer
Resultados de evaluación
Puntos finales de inferencia

Casos de uso

Clasificación de alimentos en imágenes
Estimación de calorías
Aplicaciones de seguimiento de consumo alimenticio
Asistentes para la preparación de comidas
Aplicaciones de dieta y salud