SalML/DETR-table-structure-recognition

SalML

Detección de objetos

El modelo DETR-table-structure-recognition de SalML es una implementación basada en transformadores para la detección de objetos en PyTorch, entrenado con el dataset PubTables-1M. Se utiliza principalmente para el reconocimiento de estructuras de tablas en imágenes. El modelo original proviene de https://github.com/microsoft/table-transformer y ahora está disponible en https://huggingface.co/microsoft/table-transformer-structure-recognition. También está disponible un espacio en HuggingFace: https://huggingface.co/spaces/SalML/TableTransformer2CSV que ejecuta OCR en las imágenes obtenidas por table-transformer para obtener una tabla descargable en formato CSV.

Como usar

Puedes usar este modelo en tus aplicaciones de detección de objetos para identificar y reconocer estructuras de tablas en imágenes. Desafortunadamente, este modelo aún no tiene suficiente actividad para ser implementado en la API de Inferencia (sin servidor). Sin embargo, puedes desplegarlo en Inference Endpoints dedicados para su uso.
import torch
from transformers import DetrImageProcessor, DetrForObjectDetection

model_name = 'SalML/DETR-table-structure-recognition'
processor = DetrImageProcessor.from_pretrained(model_name)
model = DetrForObjectDetection.from_pretrained(model_name)

# Carga y procesa la imagen
image = 'ruta/a/tu/imagen.png'
inputs = processor(images=image, return_tensors='pt')

# Realiza la inferencia
with torch.no_grad():
    outputs = model(**inputs)

Funcionalidades

Detección de objetos
Basado en transformadores
Entrenado con el dataset PubTables-1M
Reconocimiento de estructuras de tablas en imágenes
OCR para obtener tablas en formato CSV

Casos de uso

Reconocimiento de estructuras de tablas en documentos escaneados
Digitalización de tablas en imágenes para extracción de datos
OCR para convertir tablas en imágenes en formato CSV