detr-doc-table-detection

TahaDouaji
Detección de objetos

detr-doc-table-detection es un modelo entrenado para detectar tanto tablas con bordes como tablas sin bordes en documentos, basado en facebook/detr-resnet-50.

Como usar

Utiliza el siguiente código para comenzar a usar el modelo.

from transformers import DetrImageProcessor, DetrForObjectDetection
import torch
from PIL import Image
import requests

image = Image.open("IMAGE_PATH")

processor = DetrImageProcessor.from_pretrained("TahaDouaji/detr-doc-table-detection")
model = DetrForObjectDetection.from_pretrained("TahaDouaji/detr-doc-table-detection")

inputs = processor(images=image, return_tensors="pt")
outputs = model(**inputs)

# convert outputs (bounding boxes and class logits) to COCO API
# let's only keep detections with score > 0.9
target_sizes = torch.tensor([image.size[::-1]])
results = processor.post_process_object_detection(outputs, target_sizes=target_sizes, threshold=0.9)[0]

for score, label, box in zip(results["scores"], results["labels"], results["boxes"]):
    box = [round(i, 2) for i in box.tolist()]
    print(
        f"Detected {model.config.id2label[label.item()]} with confidence "
        f"{round(score.item(), 3)} at location {box}"
)

Funcionalidades

Detección de objetos
Transformadores
Compatible con PyTorch
Soporte para Safetensors
Endpoints de inferencia

Casos de uso

Este modelo se puede utilizar para la tarea de detección de objetos.
El modelo no debe utilizarse para crear intencionalmente ambientes hostiles o alienantes para las personas.