Науковий вісник Одеського національного економічного університету 2023, 9 (310), 37-43

Open Access Article

Аналіз великих об’ємів даних та їх візуалізація в R

Орлов Євгеній Вікторович
кандидат фізико-математичних наук, доцент, доцент кафедри статистики та математичних методів в економіці, Одеський національний економічний університет, м. Одеса, Україна, e-mail: orlov_ev@onu.edu.ua, ORCID ID: https://orcid.org/0000-0002-9212-9973

Кривошеїна Єлизавета Олександрівна
студентка факультету економіки і управління підприємництвом, Одеський національний економічний університет, м. Одеса, Україна, e-mail: yelyzavetakryvosheina@gmail.com

Сіренко Анна Олександрівна
студентка факультету економіки і управління підприємництвом, Одеський національний економічний університет, м. Одеса, Україна, e-mail: sirenko.anna06@gmail.com

Цитувати статтю:

Орлов Є. В., Кривошеїна Є. О., Сіренко А. О. Аналіз великих об’ємів даних та їх візуалізація в R. Науковий вісник Одеського національного економічного університету: зб. наук. праць; за ред.: В.В. Коваленко (голов. ред.). (ISSN 2409-9260). Одеса: Одеський національний економічний університет. 2023. № 9 (310). С. 37-43.

Анотація

Стаття присвячена дослідженню методів та інструментів для аналізу та візуалізації великих об'ємів даних у R. Метою статті є обґрунтування вибору методів аналізу великих обсягів даних із використанням середовища програмування R, а також можливості їх візуалізації. Описано різні підходи до обробки великих наборів даних в R, такі як використання пакетів для роботи з великими об'ємами даних, інструментів візуалізації та аналізу даних. Наведено приклади використання середовища програмування R для комплексного аналізу даних великих компаній. Платформи соціальних медіа, такі як Twitter, Facebook і Instagram, генерують великі обсяги даних, які можна використовувати для аналізу настроїв користувачів, дослідження тенденцій і визначення реакції на новини та події.

Ключові слова

великі об’єми даних, середовище програмування R, статистичний аналіз, візуалізація даних.

JEL classification: C810; C820; C870; DOI: 10.32680/2409-9260-2023-9-310-37-43

УДК: 311.21; 303.72

Лицензия Creative Commons
Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0. Переглянути копію цієї ліцензії можна за посиланням: http://creativecommons.org/licenses/by/4.0/

Література

  1. Evaluation of cerebrospinal fluid proteins as potential biomarkers for early stage Parkinson’s disease diagnosis / D. Scheller et al. PLoS ONE. 2018. С. 7–12.
  2. The Comprehensive R Archive Network. URL: https://cran.r-project.org/ (дата звернення 28.04.2023).
  3. Paradis E. R for beginners. The Comprehensive R Archive Network. URL: https://cran.rproject. org/doc/contrib/Paradis-rdebuts_en.pdf / (дата звернення 28.04.2023).
  4. R Markdown. URL: https://rmarkdown.rstudio.com/lesson-1.html (date of access: 29.04.2023).
  5. Dalpiaz D. Applied Statistics with R. Illinois, 2016. 417 p. URL: https://dokumen. tips/documents/applied-statistics-with-r-david-dalpiaz-collinearity-287-welcome-to-applied. html?page=1 С. 52–55. (дата звернення 28.04.2023).
  6. Hodeghatta, U. R. Practical business analytics using R and Python: solve business problems using a data-driven approach. Apress Berkeley. 2023. 706 р. https://doi.org/10.1007/978-1-4842- 8754-5
  7. de Micheaux P. L., Drouilhet R., Liquet B. The R Software. Fundamentals of Programming and Statistical Analysis. Springer New York. 2016. 628 р. DOI https://doi.org/10.1007/978-1- 4614-9020-3
  8. Fox J., Weisberg S. An R Companion to Applied Regression. SAGE Publications. 2018. 608 p.
  9. Tattar P. N., Ramaiah S., Manjunath B. G. A Course in Statistics with R. Wiley. 2016. 696 p.
  10. Chambers J. M. Software for data analysis. Springer. 2008. 500 p. DOI https://doi. org/10.1007/978-0-387-75936-4

Україна, м.Одеса, 65082
вул. Гоголя, 18, ауд. 110.
(048) 777-89-16
visnik.nauka visnik.nauka@gmail.com

ПнВтСрЧтПтСбНд

 

Flag Counter
 -->