360LayoutAnalysis

qihoo360
Detección de objetos

360LayoutAnalysis es un modelo de análisis de diseño de documentos desarrollado por Qihoo 360. En la era digital actual, el análisis de diseño de documentos es fundamental para la extracción de información y la comprensión de documentos. Este modelo permite identificar y extraer texto, imágenes, tablas y otros elementos de imágenes de documentos escaneados, mejorando la automatización del procesamiento de documentos, el intercambio electrónico de datos y la digitalización de documentos históricos. El modelo ha sido entrenado con datos de alta calidad para reconocer con precisión la estructura de los documentos, con un enfoque especial en la anotación de párrafos.

Como usar

Peso del archivo del modelo:

360LayoutAnalysis.pth

Uso:

from ultralytics import YOLO

image_path = '' # Ruta de la imagen a predecir
model_path = '' # Ruta del peso del modelo
model = YOLO(model_path)

result = model(image_path, save=True, conf=0.5, save_crop=False, line_width=2)
print(result)

print(result[0].names) # Salida del id2label map
print(result[0].boxes) # Salida de todos los bounding box detectados
print(result[0].boxes.xyxy) # Salida de las coordenadas superior izquierda e inferior derecha de todos los bounding box detectados
print(result[0].boxes.cls) # Salida del id correspondiente a las categorías de los bounding box detectados
print(result[0].boxes.conf) # Salida de la confianza de todos los bounding box detectados

Funcionalidades

Cubre documentos en chino e inglés en diversos escenarios, incluyendo artículos académicos y reportes de investigación.
Modelos ligeros para una inferencia rápida.
Reconocimiento preciso de la estructura del documento incluyendo bordes de párrafos, imágenes, tablas y fórmulas.
Entrenado con datos de alta calidad específicos para el análisis de diseño de documentos en varios escenarios.

Casos de uso

Procesamiento automatizado de documentos.
Intercambio electrónico de datos.
Digitalización de documentos históricos.