ПРОГНОЗУВАННЯ ДИНАМІКИ РИНКУ КРИПТОВАЛЮТ НА ОСНОВІ ДАНИХ СОЦІАЛЬНИХ МЕРЕЖ

Автор(и)

Анотація

У сучасній економіці дослідження на основі даних із соціальних мереж набувають все
більшої популярності. Інтерактивні платформи, такі як тікток, фейсбук, інстаграм, ікс (твіт-
тер), лінкедин та інші, генерують велику кількість даних, які можуть бути використані для
аналізу поведінки користувачів. Обробка великих обсягів інформації вимагає розробки ефек-
тивних інструментів їх збору та аналізу. Прикладний програмний інтерфейс (API) є одним з
ключових методів, який забезпечує доступ до даних у реальному часі. Прикладний програм-
ний інтерфейс дозволяє науковцям автоматизувати процес збору інформації, налаштовувати
запити за різними критеріями та отримувати структуровані дані для подальшого аналізу.
Науковці активно досліджують використання API соціальних мереж для збору та
аналізу даних, прогнозування динаміки ринку криптовалют за допомогою методів інтелек-
туального аналізу даних. Так, Poudel, Weninger аналізували проблеми пов’язані з доступом
до соціальних мереж [1]. Розробка та керування прикладним програмним інтерфейсом при-
вертає значну увагу розробників програмного забезпечення [2]. Публікація “Advances in Intelligent
Data Analysis and Its Applications” Zhang, C., Li, W., Zhang, H., & Zhan, T. містить
огляд теоретичних основ методів інтелектуального аналізу даних і пропонує практичні реко-
28
мендації для підвищення точності та швидкості аналізу [3]. У дослідженні Mudassir, M.,
Bennbaia "Time-series forecasting of Bitcoin prices using high-dimensional features: a machine
learning approach" автори прогнозують ціну на біткоїн за допомогою моделей машинного
навчання, визначають точність прогнозування для короткострокового та середньострокового
періоду упередження [4].
Метою дослідження є проведення комплексного аналізу моделей для прогнозування
динаміки ринку криптовалют за даними соціальних мереж. Відповідно до мети дослідження
основними завданнями є:
- зібрати базу даних про активність користувачів у соціальних мережах;
- виконати обробку, агрегацію даних;
- побудувати моделі прогнозування на основі поліноміальної регресії, а також методів
машинного навчання (Random Forest, Decision Tree) та Prophet;
- оцінити точність та ефективність моделей за допомогою метрик Mean Squared Error та
Mean Absolute Error.
Збір інформації з соціальних мереж включав формування тематичних запитів. Вико-
ристання структурованих запитів дозволило ефективно вилучати дані, релевантні до до-
сліджуваної теми, чим забезпечило репрезентативність вибірки для аналізу.
Парсинг включав перетворення необробленої інформації на структуровані формати,
придатні для подальшого аналізу. Коректність обробки даних забезпечується застосуванням
сучасних бібліотек Python, таких як requests та json.
Код для обробки включав адаптацію алгоритмів збору інформації до специфіки кож-
ної соціальної мережі. Наступний етап - формування термінологічних баз із ключових слів,
фраз та синонімів. Розробка програмного забезпечення для автоматизації створення запитів
до API здійснювалась із застосуванням HTTP-методу POST. Розробка скриптів для перевірки
статусу та результатів виконання запитів, зроблених до API, здійснювалась з використанням
HTTP-методу GET. Зроблено автоматизацію перенесення даних із хмарної бази PostgreSQL
(через PGAdmin) до локальних файлів формату CSV для подальшої обробки. Далі - оп-
тимізація циклічного виконання запитів із врахуванням обмежень швидкості API та розробка
алгоритмів для регулювання частоти запитів із використанням таймерів (time.sleep) або черг
завдань для забезпечення відповідності правилам використання API. Реалізація скриптів для
обробки, візуалізації та аналізу даних кожної соціальної мережі окремо включає методи ча-
стотного аналізу та аналізу настроїв із використанням бібліотек Python (NLTK, scikit-learn,
matplotlib).
Система моніторингу збору даних дозволяє інтегрувати отримані дані в аналітичні та
дослідницькі процеси. Така універсальність даної системи є перспективною для подальшого
використання в бізнесі, науці та освіті. Досліджено варіанти інтеграції отриманих даних для
описового аналізу, кількісного аналізу, лінгвістичного аналізу, аналізу часових рядів, мере-
жевого аналізу, семантичного аналізу. Слід також зазначити, що отримані таким чином дані
дозволяють здійснити детальний контент-аналіз на кшталт визначення найпопулярніших
тегів, топ-постів по окремим соціальним мережам, топ найпопулярніших емодзі. Ефективним
є їх використання для категоризації та візуалізації медіа-контенту.
Серед моделей прогнозування динаміки криптовалют саме модель дерева рішень про-
демонструвала хорошу точність. MSE становить 2,532,048.20, що свідчить про порівняно
низький рівень розбіжностей між прогнозованими та фактичними значеннями. Коефіцієнт
детермінації R² підтверджує, що 79.3% варіації ціни біткоїна пояснюється побудованою мо-
деллю, що свідчить про її адекватність моделі та доцільність врахування даних соціальних
мереж під час прогнозування ринку криптовалют.
Побудована модель дерева рішень продемонструвала певний успіх у прогнозуванні
цін на біткоїн, проте зросли відхилення у прогнозах з часом. Тому в ході дослідження ро-
зроблено модель випадкового лісу для врахування більш складних взаємозв'язків між
змінними (рис. 1).

##submission.downloads##

Опубліковано

2025-05-27

Номер

Розділ

Моделювання економічних процесів: методи та цифрові технології