Which model to use for vision
- YoloV5 ← ток
- YoloV8
- https://docs.ultralytics.com/guides/object-counting/#what-is-object-counting
- https://docs.ultralytics.com/guides/nvidia-jetson/#nvidia-jetson-orin-yolov8-benchmarks
— YoloV6-v3, разрешение 1280 пикселей, GPL-3.0, из исходного кода.
- https://github.com/lyuwenyu/RT-DETR с 54,8 мАР
- https://github.com/jozhang97/DETA 63,5 мАР
- MCUNet ? https://github.com/mit-han-lab/mcunet
Модели с нулевым выстрелом кажутся довольно плохими:
- YoloWorld
- СОВА + CLIP
- СОВА + ViT
- LLaVA 1.5 = обнаружить всё
- NanoOWL github.com/NVIDIA-AI-IOT/nanoowl
Аппаратное обеспечение
- RTX
- A100
Время выполнения
- Pytorch
- TensorRT
- ONNX