An Analysis of Visual Single Object Tracking Methods

dc.contributor.authorРоманяк, Євген С.
dc.date.accessioned2026-04-17T07:38:02Z
dc.date.available2026-04-17T07:38:02Z
dc.date.issued2026
dc.description.abstractВступ. Візуальне простеження (трекінг) об’єктів це важлива задача у комп’ютерному зорі, що має широкий спектр застосувань, включаючи автономну навігацію, робототехніку та задачі моніторингу. Завдання полягає в оцінці положення об'єкта у послідовності відеокадрів, виходячи з його положення на початковому кадрі. Незважаючи на значні зусилля дослідників, завдання залишається складним через такі чинники як перекриття цілі, зміни умов освітлення, розмиття в русі та деформації об’єкта. Методи простеження поділяються на короткострокові, де припускається, що ціль залишається у полі зору, і довгострокові, які обробляють зникнення об’єкта і його повторну появу. Дана стаття надає глибокий аналіз різних методів відстеження одного об'єкта, охоплюючи як традиційні підходи, такі як трекери з використанням кореляційних фільтрів та ключових точок, так і сучасні методи глибокого навчання. Мета роботи – полягає в аналізі різних алгоритмів відстеження об’єкта, як короткострокових, так і довгострокових, а також наборів даних, що використовуються для оцінки якості цих алгоритмів. Стаття має на меті розглянути основні принципи різних підходів до відстеження, включаючи кореляційні фільтри, методи, засновані на відстеженні ключових точок, і різні моделі глибокого навчання, такі як сіамські нейронні мережі, трансформери та інші. Крім того, дослідження представляє огляд популярних еталонних наборів даних, таких як VOT 2018, LaSOT і GOT-10k, та порівнює точність багатьох з розглянутих у статті алгоритмів на цих бенчмарках. Це порівняння висвітлює сильні та слабкі сторони різних підходів до трекінгу і створює основу для майбутніх напрямків досліджень, зокрема, щодо підвищення ефективності, адаптивності та швидкодії алгоритмів відстеження для застосувань у реальних задачах. Результати. Кореляційні трекери відомі своєю високою швидкістю та хорошою точністю. Ці методи використовують перетворення Фур’є для ефективних обчислень, точність яких може бути покращена за допомогою ознакового опису зображення, від HOG ознак, до представлення, отриманого глибокою згортковою нейронною мережею. Однак, вони потребують модифікацій для довгострокового відстеження, щоб справлятися зі зникненням об’єкта і зменшувати накопичення помилок. Хоча деякі з розглянутих методів враховують ці складнощі, вони не вирішують їх повністю. Трекери, що використовують ключові точки, відстежують об’єкти, ідентифікуючи та зіставляючи цікаві точки або ознаки в кадрах. Такі методи, як метод Канаде – Лукаса – Томасі, це основа, тоді як детектори SIFT або ORB підвищують стійкість до шуму та змін масштабу. Ці трекери є особливо корисними для сценаріїв, де об’єкт частково перекривається, оскільки вони можуть відстежувати підмножину точок об’єкта. Однак вони можуть мати проблеми з мало текстурованими та маленькими об’єктами. Трекери, засновані на глибокому навчанні, є значним досягненням, що перевершує традиційні методи за точністю та стійкістю завдяки їх можливостям представлення ознак зображення. Деякі глибокі трекери, такі як SiamFC чи SiamRPN, демонструють високу точність та швидкодію у реальному часі на графічному процесорі (GPU). Порівняння алгоритмів на бенчмарках, таких як VOT 2018, LaSOT та GOT-10k, показує, що підходи, засновані на глибокому навчанні демонструють вищу точність у складних сценаріях відстеження, але потребують більш значних обчислювальних ресурсів. Висновки. Алгоритми простеження об’єктів значно еволюціонували з появою методів глибокого навчання, що дозволило трекерам досягти вищої точності та стійкості порівняно з традиційними методами, наприклад, на основі кореляційних фільтрів чи ключових точок. Поява великого об’єму розмічених даних, наприклад, датасетів VOT, GOT-10k та LaSOT, стало важливим кроком у розроблені глибоких трекерів та стандартизованої основи для оцінки нових алгоритмів. Хоча методи на основі кореляційних фільтрів або ключових точок все ще використовуються, наприклад, у середовищах з обмеженими обчислювальними ресурсами, трекери, засновані на глибокому навчанні, зокрема, сіамські мережі та трансформери, показують найкращу точність. Подальші дослідження повинні зосередитися на оптимізації ефективності та адаптивності цих алгоритмів, щоб зробити їх більш придатними для застосувань у реальному часі та різноманітних реальних сценаріїв.
dc.identifier.citationRomaniak Y. An Analysis of Visual Single Object Tracking Methods. Cybernetics and Computer Technologies. 2026. 1. P. 75–93. https://doi.org/10.34229/2707-451X.26.1.7
dc.identifier.urihttps://cctech.org.ua/ua/index.php?option=com_content&view=article&id=801:abstract-26-1-7-artu&catid=11:vertikalnoe-menyu-ua&Itemid=101
dc.identifier.urihttps://dr.csbc.edu.ua/handle/123456789/1830
dc.publisherІнститут кібернетики імені В.М. Глушкова НАН України
dc.subjectSOCIAL SCIENCES::Statistics, computer and systems science::Informatics, computer and systems science
dc.subjectTECHNOLOGY::Information technology::Computer engineering
dc.titleAn Analysis of Visual Single Object Tracking Methods
dc.title.alternativeАналіз методів відстеження об’єктів у відео
dc.typeArticle
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
paper_26_1_7.pdf
Size:
986.08 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: