Microsoft/TATR - Reconocimiento de estructura de tablas v1.1

microsoft
Detección de objetos

Transformer de tablas (preentrenado para reconocimiento de estructura de tablas). El modelo Transformer de Tablas (TATR) está entrenado en PubTables1M y FinTabNet.c. Fue presentado en el artículo 'Alineando conjuntos de datos de referencia para el reconocimiento de estructura de tablas' por Smock et al. y se lanzó por primera vez en este repositorio. El Transformer de Tablas es equivalente a DETR, un modelo de detección de objetos basado en Transformer. Los autores decidieron usar la configuración 'normalizar antes' de DETR, lo que significa que layernorm se aplica antes de la autoatención y la atención cruzada.

Como usar

Puede usar el modelo en crudo para detectar tablas en documentos. Consulte la documentación para más información.

Descargas en el último mes: 578,534
Tamaño del modelo Safetensors: 28.8M parámetros
Tipo de tensor: F32

Funcionalidades

Reconocimiento de estructura de tablas
Basado en transformadores
Utiliza la configuración 'normalizar antes' de DETR
Entrenado en PubTables1M y FinTabNet.c

Casos de uso

Detección de tablas en documentos PDF
Reconocimiento de la estructura de tablas en imágenes