INTELLECTUAL ANALYSIS OF WEB CONTENT FOR THE FORMATION OF SOCIAL AND DIGITAL IDENTITY OF WEB USER

2023;
: 32-46
1
Lviv Polytechnic National University

The article discusses the growing need to analyze and understand web user behavior due to the unprecedented amount of digital content being generated and distributed on the Internet. Web content intelligence is presented as an effective way to explore and extract valuable information from online content, including websites, social media platforms, and other digital sources, to better understand web users' interests, preferences, and behaviors. The ability to identify web users based on their online behavior is important for industries such as marketing, psychology, and law enforcement. However, there are certain problems associated with this approach, such as ensuring the privacy and security of web users’ data, as well as assessing the accuracy and reliability of web content analysis tools. The purpose of the article is to review the current state of web content analysis, its potential applications in various industries, and its role in shaping the digital future. The article emphasizes the importance of an interdisciplinary approach to the study of virtual identification and self-presentation in online communities, taking into account the socio-demographic characteristics of a web personality involved in social interactions. The article also explores the latest trends and developments in the field of web data mining, including web content analysis, web structure analysis, web page usage analysis, and social media data analysis. A software solution for conducting intelligent analysis of web content is proposed to form a social and digital identity of a web user using a specialized dictionary of content markers of a web community member.

[1]       K. Krippendorff, “Content analysis”. SAGE Publications, Inc., 2019. DOI: 10.4135/9781071878781.

[2]       S. C. Herring, “Web Content Analysis: Expanding the Paradigm. International Handbook of Internet Research”. Springer, Dordrecht, 2009, pp. 233–249. DOI: 10.1007/978-1-4020-9789-8_14.

[3]       P. Loyola, P. E. Roman, J. D. Velasquez, “Predicting web user behavior using learning-based ant colony optimization”. Engineering Applications of Artificial Intelligence, 25(5), pp. 889–897, 2012.

[4]       S. Fedushko, T. Ustyianovych, “E-Commerce Customers Behavior Research Using Cohort Analysis: A Case Study of COVID-19”. Journal of Open Innovation: Technology, Market, and Complexity, 8(1), 12, 2022.  DOI: 10.3390/joitmc8010012

[5]       S. Fedushko, M. Davidekova, “Analytical service for processing behavioral, psychological and communicative features in the online communication”. Procedia Computer Science, Vol. 160, pp. 509–514, 2019.  DOI: 10.1016/j.procs.2019.11.056

[6]       Y. C. Yang, “Web user behavioral profiling for user identification”. Decision Support Systems, 49(3), pp. 261–271, 2010. DOI: 10.1016/j.dss.2010.03.001

[7]       D. O’Neil, “Analysis of Internet users’ level of online privacy concerns”. Social Science Computer Review, 19(1), pp. 17–31, 2001. DOI: 10.1177/089443930101900103

[8]       J. J. Hathaliya, S. Tanwar, “An exhaustive survey on security and privacy issues in Healthcare 4.0”. Computer Communications, 153, pp. 311–335, 2020.  DOI: 10.1016/j.comcom.2020.02.018

[9]       С. С. Федушко, “Розроблення системи верифікації соціально-демографічних даних учасника віртуальної спільноти”. Радіоелектроніка, інформатика, управління, № 3, С. 87–92, 2016. DOI: 10.15588/1607-3274-2016-3-11.

[10]    M. L. Cantuaria, V. Blanes-Vidal, “Self-reported data in environmental health studies: mail vs. web-based surveys”. BMC medical research methodology, 19(1), pp. 1–13, 2019. DOI: 10.1186/s12874-019-0882-x

[11]     С. С. Федушко, Г. І. Білущак, “Формування системи лінгво-комунікативних індикаторів соціально-демо­гра­фічних характеристик web-учасників”. Управління розвитком складних систем: зб. наук. праць Київсь­кого нац. університету будівництва і архітектури, 18, C. 112–122, 2014. DOI: 10.6084/m9.figshare.11089865.v1

[12]    S. Sharma, S. K. Sharma, “Web Mining: A Framework”. IITM Journal of Management and IT, 12(1), pp. 93–98, 2021.

[13]    Ibrahim, K. K., Obaid, A. J. “Web Mining Techniques and Technologies: A Landscape View”. Journal of Physics: Conference Series. IOP Publishing, Vol. 1879, No. 3, p. 032125, 2021. DOI: 10.1088/1742-6596/1879/3/032125

[14]    О. Я. Ярмолюк, О. С. Борисенко, Ю. В. Фісун, “Теоретико-методологічні аспекти таргетованої рекла­ми як інструменту комплексного інтернет-маркетингу”. Науковий вісник Херсонського державного університету. Серія: Економічні науки, (46), С. 23–29, 2022.

[15]    Н. Гук, С. Диханов, І. Долотов, “Аналіз структури сайту з використанням поняття модуляр­ності”. Математичне та комп’ютерне моделювання. Серія: Фізико-математичні науки, С. 99–114, 2020.

[16]    Y. Kryvenchuk, M. Y. Khanas, “Алгоритм видобування та опрацювання споріднених даних в соціальних мережах”.  Вісник Хмельницького національного університету, № 4, 2022 (311), С.. 115–118, 2022. DOI: 10.31891/2307-5732-2022-311-4-115-118.

[17]    О. І. Чумаченко, О. І. Житков, “Інтелектуальний аналіз веб-даних”. Електроніка та системи управ­ління, 2(32), С. 14–20, 2012.

[18]    Ю. В. Рогушина, “Засоби та методи аналізу неструктурованих даних”. Проблеми програмування, № 1, С. 57–77, 2019. DOI: 10.15407/pp2019.01.057.

[19]    Веб-форум “Дівочі посиденьки”. http://posydenky.lvivport.com/showthread.php?t=76784.

[20]    С. В. Голуб, А. С. Авраменко, “Підвищення ефективності координації структури інформаційної системі комп’ютерного моніторингу з багаторівневим перетворенням даних”. Секція 1. Сучасні аспекти математичного та імітаційного моделювання систем в екології, 21, С. 277–278, 2013.

[21]    О. В. Харченко, С. В. Голуб, І. А. Жирякова, “Удосконалення методу висхідного синтезу елементів в інформаційній технології багаторівневого моніторингу мобільного робота”. Математичні машини і системи, (3), С. 41–47, 2016.