An Analysis of Visual Single Object Tracking Methods

Романяк, Євген С.

An Analysis of Visual Single Object Tracking Methods

dc.contributor.author	Романяк, Євген С.
dc.date.accessioned	2026-04-17T07:38:02Z
dc.date.available	2026-04-17T07:38:02Z
dc.date.issued	2026
dc.description.abstract	Вступ. Візуальне простеження (трекінг) об’єктів це важлива задача у комп’ютерному зорі, що має широкий спектр застосувань, включаючи автономну навігацію, робототехніку та задачі моніторингу. Завдання полягає в оцінці положення об'єкта у послідовності відеокадрів, виходячи з його положення на початковому кадрі. Незважаючи на значні зусилля дослідників, завдання залишається складним через такі чинники як перекриття цілі, зміни умов освітлення, розмиття в русі та деформації об’єкта. Методи простеження поділяються на короткострокові, де припускається, що ціль залишається у полі зору, і довгострокові, які обробляють зникнення об’єкта і його повторну появу. Дана стаття надає глибокий аналіз різних методів відстеження одного об'єкта, охоплюючи як традиційні підходи, такі як трекери з використанням кореляційних фільтрів та ключових точок, так і сучасні методи глибокого навчання. Мета роботи – полягає в аналізі різних алгоритмів відстеження об’єкта, як короткострокових, так і довгострокових, а також наборів даних, що використовуються для оцінки якості цих алгоритмів. Стаття має на меті розглянути основні принципи різних підходів до відстеження, включаючи кореляційні фільтри, методи, засновані на відстеженні ключових точок, і різні моделі глибокого навчання, такі як сіамські нейронні мережі, трансформери та інші. Крім того, дослідження представляє огляд популярних еталонних наборів даних, таких як VOT 2018, LaSOT і GOT-10k, та порівнює точність багатьох з розглянутих у статті алгоритмів на цих бенчмарках. Це порівняння висвітлює сильні та слабкі сторони різних підходів до трекінгу і створює основу для майбутніх напрямків досліджень, зокрема, щодо підвищення ефективності, адаптивності та швидкодії алгоритмів відстеження для застосувань у реальних задачах. Результати. Кореляційні трекери відомі своєю високою швидкістю та хорошою точністю. Ці методи використовують перетворення Фур’є для ефективних обчислень, точність яких може бути покращена за допомогою ознакового опису зображення, від HOG ознак, до представлення, отриманого глибокою згортковою нейронною мережею. Однак, вони потребують модифікацій для довгострокового відстеження, щоб справлятися зі зникненням об’єкта і зменшувати накопичення помилок. Хоча деякі з розглянутих методів враховують ці складнощі, вони не вирішують їх повністю. Трекери, що використовують ключові точки, відстежують об’єкти, ідентифікуючи та зіставляючи цікаві точки або ознаки в кадрах. Такі методи, як метод Канаде – Лукаса – Томасі, це основа, тоді як детектори SIFT або ORB підвищують стійкість до шуму та змін масштабу. Ці трекери є особливо корисними для сценаріїв, де об’єкт частково перекривається, оскільки вони можуть відстежувати підмножину точок об’єкта. Однак вони можуть мати проблеми з мало текстурованими та маленькими об’єктами. Трекери, засновані на глибокому навчанні, є значним досягненням, що перевершує традиційні методи за точністю та стійкістю завдяки їх можливостям представлення ознак зображення. Деякі глибокі трекери, такі як SiamFC чи SiamRPN, демонструють високу точність та швидкодію у реальному часі на графічному процесорі (GPU). Порівняння алгоритмів на бенчмарках, таких як VOT 2018, LaSOT та GOT-10k, показує, що підходи, засновані на глибокому навчанні демонструють вищу точність у складних сценаріях відстеження, але потребують більш значних обчислювальних ресурсів. Висновки. Алгоритми простеження об’єктів значно еволюціонували з появою методів глибокого навчання, що дозволило трекерам досягти вищої точності та стійкості порівняно з традиційними методами, наприклад, на основі кореляційних фільтрів чи ключових точок. Поява великого об’єму розмічених даних, наприклад, датасетів VOT, GOT-10k та LaSOT, стало важливим кроком у розроблені глибоких трекерів та стандартизованої основи для оцінки нових алгоритмів. Хоча методи на основі кореляційних фільтрів або ключових точок все ще використовуються, наприклад, у середовищах з обмеженими обчислювальними ресурсами, трекери, засновані на глибокому навчанні, зокрема, сіамські мережі та трансформери, показують найкращу точність. Подальші дослідження повинні зосередитися на оптимізації ефективності та адаптивності цих алгоритмів, щоб зробити їх більш придатними для застосувань у реальному часі та різноманітних реальних сценаріїв.
dc.identifier.citation	Romaniak Y. An Analysis of Visual Single Object Tracking Methods. Cybernetics and Computer Technologies. 2026. 1. P. 75–93. https://doi.org/10.34229/2707-451X.26.1.7
dc.identifier.uri	https://cctech.org.ua/ua/index.php?option=com_content&view=article&id=801:abstract-26-1-7-artu&catid=11:vertikalnoe-menyu-ua&Itemid=101
dc.identifier.uri	https://dr.csbc.edu.ua/handle/123456789/1830
dc.publisher	Інститут кібернетики імені В.М. Глушкова НАН України
dc.subject	SOCIAL SCIENCES::Statistics, computer and systems science::Informatics, computer and systems science
dc.subject	TECHNOLOGY::Information technology::Computer engineering
dc.title	An Analysis of Visual Single Object Tracking Methods
dc.title.alternative	Аналіз методів відстеження об’єктів у відео
dc.type	Article

Files

Original bundle

Now showing 1 - 1 of 1

Name:: paper_26_1_7.pdf
Size:: 986.08 KB
Format:: Adobe Portable Document Format

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 1.71 KB
Format:: Item-specific license agreed to upon submission
Description:

Download

Collections

Збірник наукових праць "Кібернетика та комп'ютерні технології", 2026, № 1