Reconocimiento de estructura de tablas con transformadores v1.1 de Microsoft
El modelo Table Transformer (pre-entrenado para el reconocimiento de estructuras de tablas) es un modelo de detección de objetos basado en Transformers equivalente al modelo DETR. Entrenado en FinTabNet.c, fue introducido en el artículo 'Aligning benchmark datasets for table structure recognition' por Smock et al. y lanzado por primera vez en este repositorio. Nota: El equipo que lanzó Table Transformer no escribió una tarjeta de modelo para este modelo, así que esta tarjeta fue escrita por el equipo de Hugging Face. Los autores decidieron usar la configuración 'normalizar antes' de DETR, lo que significa que la normalización de capa se aplica antes de la autoatención y la atención cruzada.
Como usar
Puede usar el modelo crudo para detectar tablas en documentos. Consulte la documentación para más información.
Funcionalidades
- Modelo Transformer-based para detección de objetos
- Normalización de capa antes de la autoatención y atención cruzada
- Entregado en formato Safetensors
- Tamaño del modelo: 28.8M parámetros
- Tipo de tensor: F32
Casos de uso
- Extracción de tablas de documentos PDF
- Reconocimiento de estructuras de tablas en imágenes de PDF