yolov10n

onnx-community
Detección de objetos

YOLOv10: Detección de objetos en tiempo real de extremo a extremo. Proporciona una balance entre latencia y precisión, así como entre tamaño y precisión. Uso real-time para una detección de objetos rápida y precisa.

Como usar

Si aún no lo has hecho, puedes instalar la biblioteca de JavaScript Transformers.js desde NPM usando:

npm i @xenova/transformers

Ejemplo: Realizar la detección de objetos.

import { AutoModel, AutoProcessor, RawImage } from '@xenova/transformers';

// Cargar modelo
const model = await AutoModel.from_pretrained('onnx-community/yolov10n', {
  // quantized: false,    // (Opcional) Usar versión no cuantizada.
});

// Cargar procesador
const processor = await AutoProcessor.from_pretrained('onnx-community/yolov10n');

// Leer imagen y ejecutar procesador
const url = 'https://huggingface.co/datasets/Xenova/transformers.js-docs/resolve/main/city-streets.jpg';
const image = await RawImage.read(url);
const { pixel_values, reshaped_input_sizes } = await processor(image);

// Ejecutar detección de objetos
const { output0 } = await model({ images: pixel_values });
const predictions = output0.tolist()[0];

const threshold = 0.5;
const [newHeight, newWidth] = reshaped_input_sizes[0]; // Altura y anchura rescaladas
const [xs, ys] = [image.width / newWidth, image.height / newHeight]; // escalas de redimensionamiento x e y
for (const [xmin, ymin, xmax, ymax, score, id] of predictions) {
  if (score < threshold) continue;
  
  // Convertir a coordenadas originales de la imagen
  const bbox = [xmin * xs, ymin * ys, xmax * xs, ymax * ys].map(x => x.toFixed(2)).join(', ');
  console.log(`Found "${model.config.id2label[id]}" at [${bbox}] with score ${score.toFixed(2)}.`);
}
// Encontrado "coche" en [559.30, 472.72, 799.58, 598.15] con puntuación 0.95.
// Encontrado "coche" en [221.91, 422.56, 498.09, 521.85] con puntuación 0.94.
// Encontrado "bicicleta" en [1.59, 646.99, 137.72, 730.35] con puntuación 0.92.
// Encontrado "bicicleta" en [561.25, 593.65, 695.01, 671.73] con puntuación 0.91.
// Encontrado "persona" en [687.74, 324.93, 739.70, 415.04] con puntuación 0.89.
// ...```

Funcionalidades

Detección de objetos en tiempo real
Equilibrio entre latencia y precisión
Equilibrio entre tamaño y precisión
Soporte de pesos ONNX

Casos de uso

Detección de coches en tiempo real
Detección de bicicletas en tiempo real
Detección de personas en tiempo real