FROM STATISTICAL PATTERN RECOGNITION TO EMOTION ANALYSYS: APPLICATION OF THE APPARATUS OF DECOMPOSITION IN SPAСE WITH A GENERATING ELEMENT FOR NLP MODELS

Abstract
Розпізнавання емоцій у текстах є важливою задачею сучасного оброблення природної мови, де на сьогодні домінують трансформерні архітектури. Однак їхні внутрішні механізми залишаються «чорною скринькою», а якість класифікації, особливо для складних випадків, має потенціал для покращення. У цій роботі запропоновано новий гібридний підхід, який поєднує потужність сучасних мовних моделей з глибоким аналізом їхніх векторних представлень за допомогою адаптації класичного методу статистичного розпізнавання образів, що ґрунтується на розкладі в просторі з порідним елементом (просторі Кунченка). Метод дає змогу згенерувати новий набір «статистико-геометричних» ознак на основі похибки реконструкції векторного представлення текстових повідомлень відповідних класів. Експерименти на українському (EMOBENCH-UA) та англійському (EmoEvent) наборах даних показали, що запропонований гібридний підхід забезпечує статистично значуще підвищення яккості класифікації. Дослідження також виявило ключові умови ефективності методу: він є потужним «уточнювачем» для моделей, донавчених на цільовій задачі, але неефективний на «сирих», неспеціалізованих векторних представленнях. Встановлено, що вибір базисних функцій для реконструкції є важливим гіперпараметром, що дає можливість адаптувати метод до специфічної геометрії простору даних.
Description
Keywords
TECHNOLOGY, SOCIAL SCIENCES::Statistics, computer and systems science::Informatics, computer and systems science::Information technology
Citation
Заболотній С.В., Чепинога А.В., Хотунов В.І. FROM STATISTICAL PATTERN RECOGNITION TO EMOTION ANALYSYS: APPLICATION OF THE APPARATUS OF DECOMPOSITION IN SPACE WITH A GENERATING ELEMENT FOR NLP MODELS. Кібернетика та системний аналіз. 2026. № 2. C. 168-179 https://doi.org/10.34229/kca2522-9664.26.2.15