Millist mudelit nägemiseks kasutada
- YoloV5 ← vool
- YoloV8
- YoloV6-v3 1280 piksliga, GPL-3.0, lähtekoodist
- https://github.com/lyuwenyu/RT-DETR 54,8 mAP-ga
- https://github.com/jozhang97/DETA 63,5 mAP
- MCUNet? https://github.com/mit-han-lab/mcunet
Nullkaadri mudelid tunduvad üsna halvad:
- YoloWorld
- ÖÖKULL + KLIP
- ÖÖKULL + ViT
- LLaVA 1.5 = tuvasta kõik
- NanoOWL github.com/NVIDIA-AI-IOT/nanoowl
Riistvara
- RTX
- A100
Kestus
- Pytorch
- TensorRT
- ONNX