hermanshid/yolo-layout-detector
hermanshid
Detección de objetos
Este modelo está diseñado para la detección de objetos utilizando YOLOv5. Es capaz de identificar varios tipos de objetos dentro de una imagen, lo que incluye leyendas, gráficos, imágenes, subtítulos de imágenes, tablas, subtítulos de tablas, texto y títulos. El modelo es adecuado para realizar detecciones precisas en imágenes de layouts, con una precisión autoinformada de [email protected](box) de 0.979.
Como usar
Instalar la biblioteca
pip install yolov5==7.0.5 torch
Cargar el modelo y realizar una predicción
import yolov5
from PIL import Image
model = yolov5.load(models_id)
model.overrides['conf'] = 0.25 # Umbral de confianza NMS
model.overrides['iou'] = 0.45 # Umbral NMS IoU
model.overrides['max_det'] = 1000 # número máximo de detecciones por imagen
# establecer imagen
image = 'https://huggingface.co/spaces/hermanshid/yolo-layout-detector-space/raw/main/test_images/example1.jpg'
# realizar inferencia
results = model.predict(image)
# observar resultados
print(results[0].boxes)
render = render_result(model=model, image=image, result=results[0])
render.show()
Funcionalidades
- Detección de objetos con YOLOv5
- Soporte para múltiples etiquetas
- Altamente preciso con un [email protected](box) de 0.979
Casos de uso
- Detección de objetos en layouts de documentos
- Análisis de imágenes para identificar elementos como tablas y texto
- Automatización de la clasificación de componentes en imágenes complejas