Microsoft/TATR - Reconocimiento de estructura de tablas v1.1
microsoft
Detección de objetos
Transformer de tablas (preentrenado para reconocimiento de estructura de tablas). El modelo Transformer de Tablas (TATR) está entrenado en PubTables1M y FinTabNet.c. Fue presentado en el artículo 'Alineando conjuntos de datos de referencia para el reconocimiento de estructura de tablas' por Smock et al. y se lanzó por primera vez en este repositorio. El Transformer de Tablas es equivalente a DETR, un modelo de detección de objetos basado en Transformer. Los autores decidieron usar la configuración 'normalizar antes' de DETR, lo que significa que layernorm se aplica antes de la autoatención y la atención cruzada.
Como usar
Puede usar el modelo en crudo para detectar tablas en documentos. Consulte la documentación para más información.
Descargas en el último mes: 578,534
Tamaño del modelo Safetensors: 28.8M parámetros
Tipo de tensor: F32
Funcionalidades
- Reconocimiento de estructura de tablas
- Basado en transformadores
- Utiliza la configuración 'normalizar antes' de DETR
- Entrenado en PubTables1M y FinTabNet.c
Casos de uso
- Detección de tablas en documentos PDF
- Reconocimiento de la estructura de tablas en imágenes