hermanshid/yolo-layout-detector

hermanshid

Detección de objetos

Este modelo está diseñado para la detección de objetos utilizando YOLOv5. Es capaz de identificar varios tipos de objetos dentro de una imagen, lo que incluye leyendas, gráficos, imágenes, subtítulos de imágenes, tablas, subtítulos de tablas, texto y títulos. El modelo es adecuado para realizar detecciones precisas en imágenes de layouts, con una precisión autoinformada de [email protected](box) de 0.979.

Como usar

Instalar la biblioteca
pip install yolov5==7.0.5 torch

Cargar el modelo y realizar una predicción
import yolov5
from PIL import Image

model = yolov5.load(models_id)

model.overrides['conf'] = 0.25 # Umbral de confianza NMS
model.overrides['iou'] = 0.45 # Umbral NMS IoU
model.overrides['max_det'] = 1000 # número máximo de detecciones por imagen

# establecer imagen
image = 'https://huggingface.co/spaces/hermanshid/yolo-layout-detector-space/raw/main/test_images/example1.jpg'

# realizar inferencia
results = model.predict(image)

# observar resultados
print(results[0].boxes)
render = render_result(model=model, image=image, result=results[0])
render.show()

Funcionalidades

Detección de objetos con YOLOv5
Soporte para múltiples etiquetas
Altamente preciso con un [email protected](box) de 0.979

Casos de uso

Detección de objetos en layouts de documentos
Análisis de imágenes para identificar elementos como tablas y texto
Automatización de la clasificación de componentes en imágenes complejas