Датасеты
Собранные нами данные доступны через Google Drive, в основном из-за большого объёма данных.
Сюда входят:
Фото
Фотографии, сделанные вручную во время осмотров рамок улья (без аннотаций, JPG, ~15MP) за 2019, 2020, 2021 и 2024 годы.
Пример фотографии (webp, повторно сжатой для веба):
Видео
👁️🗨️ Entrance Observer — видео 🎥 летка улья

2025
Видео кодировались на edge-устройстве следующим образом:
Input #0
Metadata:
major_brand : isom
minor_version : 512
compatible_brands: isomiso2mp41
encoder : Lavf59.27.100
Duration: 00:00:30.03, start: 0.000000, bitrate: 14927 kb/s
Stream #0:0[0x1](und): Video: mpeg4 (Simple Profile) (mp4v / 0x7634706D), yuv420p, 1280x720 [SAR 1:1 DAR 16:9], 14926 kb/s, 15.02 fps, 15.02 tbr, 12016 tbn (default)
Тип датасета 1
- September 04.
- у некоторых чанков есть пары с суффиксом
_detect.mp4, показывающие детекции модели yolov8. - 5-25mb per chunk. mp4
- у некоторых чанков есть пары с суффиксом
- September 05
- Длительность датасета ~8 ч (11:30 - 20:00 EEST)
- Солнечная погода.
- Зум на прилётной доске ~ 40 см по ширине
- ~ 25 GB суммарно
- 1280x720px. Чанки по 30 минут. 15 FPS. 5–25 MB на чанк. mp4
- имена файлов заданы в UTC timestamps.
- метрики в формате jsonl
- траектории пчёл в формате jsonl
- September 6th. Солнечная погода.
- Dataset duration ~8h (8:00-15:36, 19:35-20:35 EEST)
- около 13:20 наблюдается характерный рисунок облёта
- metrics in jsonl
- bee tracks in jsonl
Пример видео (ffmpeg, повторно сжатого для веба):
Тип датасета 2
- September 7th
- September 8th
- September 9th
- Длительность датасета ~3 ч (12:00–15:00 EEST)
Тип датасета 3
Камера установлена на вторую секцию улья (ближе), изменён зум, убраны стеклянные и алюминиевые границы, вместо них добавлены камни
- September 10th
- 11:30 - 17:00
- September 11th
- дождливый день, очень низкая активность
- September 13th
- rainy day
- September 14th
- облачный день
2024
2024, 19 мая.
- разрешение 640x480, чанки по 10 сек
- белый фон, много теней.
- ~ 1 ч видео суммарно, 1.1 GB
2023
18–20 июля 2023 — небольшой набор видео для тестирования результатов детекции нейросети
- 3840 x 2160, разные ракурсы и длительность
Внешние ресурсы, которые могут быть полезны
- Текущая модель детекции пчёл использует веса yolo v5 из https://universe.roboflow.com/matt-nudi/honey-bee-detection-model-zgjnb
- Датасеты команды из Brno: https://www.kaggle.com/datasets/imonbilk/bee-dataset-but-1 https://www.kaggle.com/datasets/imonbilk/bee-dataset-but-2 https://www.kaggle.com/datasets/imonbilk/bee-dataset-but-hs
- датасеты roboflow (с аннотациями) https://universe.roboflow.com/search?q=varroa
- датасеты inaturalist https://www.inaturalist.org/observations?place_id=any&taxon_id=54328 https://www.inaturalist.org/observations?place_id=any&taxon_id=47219