Information Technologies and Systems (Інформаційні технології та системи), 2025, Том 1, № 1
Permanent URI for this collection
Browse
Browsing Information Technologies and Systems (Інформаційні технології та системи), 2025, Том 1, № 1 by Author "Коротюк, М. І."
Now showing 1 - 1 of 1
Results Per Page
Sort Options
Item Автоматизоване вирівнювання речень в українсько-німецьких паралельних текстах(Інститут інформаційних технологій та систем НАН України, Видавничий дім "Академперіодика" НАН України, 2025) Коротюк, М. І.; Рибачок, НаталіяВступ. Вирівнювання речень в українсько-німецьких паралельних текстах є актуальним завданням, яке дає змогу отримувати набори паралельних даних, необхідних для багатьох завдань комп’ютерної лінгвістики, таких як побудова паралельних корпусів та машинний переклад. Стаття описує основні завдання вирівнювання речень, розглядає наявні методи та аналізує їхні ідеї. На основі цього аналізу пропонується новий метод, який ґрунтується на підході Bleualign і використовує системи машинного перекладу та метрику BLEU для оцінки схожості речень. Однак він відрізняється використанням додаткових словників маркерів для галузевих термінів та сполучників, включаючи їхні синоніми. Мета. Розроблення методу та відповідного програмного забезпечення автоматизованого вирівнювання речень в українсько-німецьких паралельних текстах. Методи. За основу розробленого методу використано метод Bleualign та метрику BLEU. Його удосконалено використанням словників галузевих термінів та сполучників, а також передбачено фокусування на одній мовній парі — українсько-німецькій. Запропонований метод складається із 6 етапів, які дозволяють виконати вирівнювання речень в українсько-німецьких паралельних текстах. Запропонований метод програмно реалізовано із використанням мови програмування Python. Результати. Розроблено новий метод вирівнювання речень для українсько-німецьких паралельних текстів та виконано його програмну реалізацію. Запропонований метод базується на статистичних підходах і не вимагає значних обчислювальних ресурсів. На відміну від методу Bleualign, у ньому використано словники галузевих термінів і сполучників для більш точного вирівнювання речень. Висновки. Подальші дослідження включатимуть проведення експериментів і порівняння результатів вирівнювання, отриманих при застосуванні запропонованого методу, із результатами методу Bleualign.