nateraw/food
nateraw
Clasificación de imagen
Este modelo es una versión afinada de google/vit-base-patch16-224-in21k en el conjunto de datos nateraw/food101. Alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 0.4501, Precisión: 0.8913.
Como usar
from transformers import ViTFeatureExtractor, ViTForImageClassification
from PIL import Image
import requests
# Cargar el model
model = ViTForImageClassification.from_pretrained('nateraw/food')
# Extraer características
feature_extractor = ViTFeatureExtractor.from_pretrained('nateraw/food')
# Función de predicción
def predict(image_path):
image = Image.open(image_path)
inputs = feature_extractor(images=image, return_tensors='pt')
outputs = model(**inputs)
logits = outputs.logits
predicted_class_idx = logits.argmax(-1).item()
return predicted_class_idx
# Ejemplo de uso
predicted_class = predict('ruta/a/la/imagen.jpg')
print(f'Predicted class: {predicted_class}')
Funcionalidades
- Clasificación de imágenes
- Transformers
- PyTorch
- TensorBoard
- Generado a partir de Trainer
- Resultados de evaluación
- Puntos finales de inferencia
Casos de uso
- Clasificación de alimentos en imágenes
- Estimación de calorías
- Aplicaciones de seguimiento de consumo alimenticio
- Asistentes para la preparación de comidas
- Aplicaciones de dieta y salud