Which model to use for vision

YoloV5 ← ток
YoloV8
- https://docs.ultralytics.com/guides/object-counting/#what-is-object-counting
- https://docs.ultralytics.com/guides/nvidia-jetson/#nvidia-jetson-orin-yolov8-benchmarks
  — YoloV6-v3, разрешение 1280 пикселей, GPL-3.0, из исходного кода.
https://github.com/lyuwenyu/RT-DETR с 54,8 мАР
https://github.com/jozhang97/DETA 63,5 мАР
MCUNet ? https://github.com/mit-han-lab/mcunet

Модели с нулевым выстрелом кажутся довольно плохими:

YoloWorld
СОВА + CLIP
СОВА + ViT
LLaVA 1.5 = обнаружить всё
NanoOWL github.com/NVIDIA-AI-IOT/nanoowl

Аппаратное обеспечение

RTX
A100

Время выполнения

Pytorch
TensorRT
ONNX