SalML/DETR-table-structure-recognition
El modelo DETR-table-structure-recognition de SalML es una implementación basada en transformadores para la detección de objetos en PyTorch, entrenado con el dataset PubTables-1M. Se utiliza principalmente para el reconocimiento de estructuras de tablas en imágenes. El modelo original proviene de https://github.com/microsoft/table-transformer y ahora está disponible en https://huggingface.co/microsoft/table-transformer-structure-recognition. También está disponible un espacio en HuggingFace: https://huggingface.co/spaces/SalML/TableTransformer2CSV que ejecuta OCR en las imágenes obtenidas por table-transformer para obtener una tabla descargable en formato CSV.
Como usar
Puedes usar este modelo en tus aplicaciones de detección de objetos para identificar y reconocer estructuras de tablas en imágenes. Desafortunadamente, este modelo aún no tiene suficiente actividad para ser implementado en la API de Inferencia (sin servidor). Sin embargo, puedes desplegarlo en Inference Endpoints dedicados para su uso.
import torch
from transformers import DetrImageProcessor, DetrForObjectDetection
model_name = 'SalML/DETR-table-structure-recognition'
processor = DetrImageProcessor.from_pretrained(model_name)
model = DetrForObjectDetection.from_pretrained(model_name)
# Carga y procesa la imagen
image = 'ruta/a/tu/imagen.png'
inputs = processor(images=image, return_tensors='pt')
# Realiza la inferencia
with torch.no_grad():
outputs = model(**inputs)
Funcionalidades
- Detección de objetos
- Basado en transformadores
- Entrenado con el dataset PubTables-1M
- Reconocimiento de estructuras de tablas en imágenes
- OCR para obtener tablas en formato CSV
Casos de uso
- Reconocimiento de estructuras de tablas en documentos escaneados
- Digitalización de tablas en imágenes para extracción de datos
- OCR para convertir tablas en imágenes en formato CSV