Detección de Tablas YOLOv8s
El modelo de detección de tablas YOLOv8s es un modelo de detección de objetos basado en el framework YOLO (You Only Look Once). Está diseñado para detectar tablas, ya sean con borde o sin borde, en imágenes. El modelo ha sido ajustado en un vasto conjunto de datos y ha logrado una alta precisión en la detección de tablas y la distinción entre aquellas con borde y sin borde. Este modelo no solo detecta tablas, sino que también desempeña un papel crucial en el análisis de documentos no estructurados mediante técnicas avanzadas como la delimitación de cuadros de delimitación. Además, su integración con la tecnología de Reconocimiento Óptico de Caracteres (OCR) permite no solo localizar tablas sino también extraer datos pertinentes contenidos en ellas. Este enfoque integral agiliza el proceso de recuperación de información de documentos no estructurados.
Como usar
Para comenzar a usar el modelo de detección de tablas YOLOv8s, siga estos pasos:
pip install ultralyticsplus==0.0.28 ultralytics==8.0.43
Cargar el modelo y realizar la predicción:
from ultralyticsplus import YOLO, render_result
# cargar el modelo
model = YOLO('foduucom/table-detection-and-extraction')
# establecer parámetros del modelo
model.overrides['conf'] = 0.25 # Umbral de confianza de NMS
model.overrides['iou'] = 0.45 # Umbral de IoU de NMS
model.overrides['agnostic_nms'] = False # NMS independiente de clases
model.overrides['max_det'] = 1000 # número máximo de detecciones por imagen
# establecer imagen
image = '/path/to/your/document/images'
# realizar inferencia
results = model.predict(image)
# observar resultados
print(results[0].boxes)
render = render_result(model=model, image=image, result=results[0])
render.show()
Funcionalidades
- Detección precisa de tablas con borde y sin borde
- Integración con OCR para extracción de datos
- Ajuste fino en un amplio conjunto de datos
- Capacidad para manejar documentos no estructurados
- Detección y clasificación de tablas utilizando técnicas avanzadas de cuadros de delimitación
Casos de uso
- Detección de tablas en imágenes, ya sean con borde o sin borde
- Extracción de datos basada en imágenes en campos como reconocimiento de muebles, diseño de interiores, y otros relacionados
- Procesamiento de documentos no estructurados para aislar tablas dentro del contenido visual
- Colaboración para mejorar la capacidad del modelo mediante el aporte de imágenes de tablas de diversos tipos y diseños