Інформаційна технологія інтелектуального пошуку контенту в системах е-комерції

Ілля Балуш; Вікторія Висоцька; Марина Шевченко; Оксана Бродяк

Описано розроблення технології інтелектуального пошуку контенту із реалізацією модуля систем е-комерції для формування списку рекомендацій постійному користувачу. Інтелектуальний пошук контенту ґрунтується на методах лінгвістичного аналізу, сучасних алгоритмах розбору і знаходження слів, рекомендаціях на основі вподобань користувачів. Основними складовими такого пошуку є парсинг текстових ланцюжків, виокремлення ключових слів, перевірка правопису, розпізнавання загальних скорочень та акронімів, семантичний аналіз тексту, пошук за релевантністю з використанням синонімів, фільтрів та сортування. Розроблено вебдодаток на базі Java і Elasticsearch з імплементацією рекомендаційної системи на основі алгоритму колаборативної фільтрації. Мета – розроблення технології інтелектуального пошуку товарів із формуванням списку рекомендацій для користувача. Об’єктом дослідження є процеси інтелектуального пошуку з можливістю генерування рекомендацій для користувачів у сфері будь- якої e-комерції без прив’язки до категоризації товару/послуг тощо. Предметом дослідження є методи та засоби інтелектуального пошуку рекомендаційних систем на основі алгоритму Collaborative Filtering для формування рекомендацій щодо товарів для користувачів, що орієнтується на загальні збіги вибору подібних користувачів. Під час експериментальної апробації розробленої системи здійснено низку пошукових запитів із NLP-алгоритмом і без, результати яких продемонстрували покращення роботи системи в межах 15–95 % залежно від ключового слова та наявності/відсутності помилок у словах пошуку. Також виконано порівняння швидкості виконання запитів з уже наявними системами. Кількість даних у сховищі може відрізнятися (похибка під час порівняння 60–70 мс). Наприклад, запит, який складається з одного або двох слів, опрацьовується значно швидше – на 20–70 мс порівняно з аналогами в таких межах. Але якщо слів три і більше, результати приблизно подібні – на 9–20 мс швидше.

пошукова система

elastic search

Рекомендаційні системи

колаборативна фільтрація

вебзастосунок

пошук

нечіткий пошук

Eileen Pangu. The Search Backend (2020). URL: https://eileen-code4fun.medium.com/system-design- interview-mini-google-search-6fd319cd66ca.
Traditional Database (Forward Indexes) vs Search Engines (Inverted Index) (2020). URL: https://dev.to/search?q=%28Forward%20Indexes%29%20vs%20Search%20Engines. https://dev.to/im_bhatman/introduction- to-inverted-indexes-l04
Alex Franz, Thorsten Brants (2006). All Our N-gram are Belong to You, August.
David Guthrie (2017). A Closer Look at Skip-gram. NLP Research group, Department of Computer Science.
Levenshtein V. I. (1986). Binary codes with correction of dropouts, insertions and substitutions, 845–848.
Navarro Gonzalo (2006). A guided tour to approximate string matching. Department of Computer Science, University of Chile, 31–88. DOI: 10.1145/375360.375365
The Levenshtein Algorithm. Example (2021). URL: https://www.cuel.ogic.com/blog/the-levenshtein- algorithm.
Levenshtein distance (2011). URL: https://habr.com/ru/post/114997/.
Ghazanfar, Mustansar Ali; Prügel-Bennett, Adam; Szedmak, Sandor (2012). KernelMapping Recommender system algorithms. School of Electronics and Computer Science, 81–104. DOI: 10.1016/j.ins.2012.04.012
Ricci F., Rokach L., Shapira B. (2011). Introduction to Recommender Systems Handbook, Recommender Systems Handbook, Springer. Faculty of Computer Science, 32–35. DOI: 10.1007/978-0-387-85820-3_1
Linden, Gregory D., Brent Russell Smith, Nida K. Zada (2017). Automated detection and exposure of behavior-based relationships between browsable items, 40–42.
Terveen, Loren Hill (2011). Beyond Recommender Systems: Helping People Help Each Other items. University of Minnesota Twin Cities, February.
Chaitanya Belhekar. Collaborative Filtering Recommender System (2020). URL: https://medium.com/@chaitanyarb619/recommendationsystems-a-walk-trough-33587fecc195.
Introducing intelligence in relevance search (2020). URL: https://powerapps.microsoft.com/.
Robert P. Hanrahan. The IDEF Family of Methods (2020). URL: http://www.sba.oakland.edu/faculty/mathieson/mis524/resources/readings/idef/idef.html.
How search algorithms work. (2022). URL: https://www.google.com/intl/uk/search/howsearchworks/algorithms/.
DFD (2020). URL: https://habr.com/ru/company/trinion/blog/340064.
What is an Elasticsearch index? (2022). URL: https://www.elastic.co/what-is/elasticsearch.
5 reasons to choose mysql. (2017). URL: https://dataconomy.com/2017/04/5-reasons-challenges-mysql/.
Java (2023). URL: https://techterms.com/definition/java.
Why would you choose Java programming language over others? (2008). URL: https:// stackoverflow.com/questions/209555/why-would-you-choose-the-javaprogramming-language-over-others.
A Collaborative Filtering Recommendation System in Java (2022). URL: https://www.baeldung.com/java- collaborative-filtering-recommendations.
Shi, Yue; Larson, Martha; Hanjalic, Alan (2014). Collaborative filtering beyond the user-item matrix: A survey of the state of the art and future challenges. ACM Computing Surveys, 47. DOI: 10.1145/2556270
Figueroa, Alejandro; Atkinson, John (2012). Contextual Language Models for Ranking Answers to Natural Language Definition Questions. Department of Computer Sciences, Universidad de Concepcion, Concepcion, Chile, November, 528–548. DOI: 10.1111/j.1467-8640.2012.00426.x
Features in the Java language 8 (2014). URL: https://javarush.com/groups/posts/1037-osobennosti-java-8--maksimaljhnoe-rukovodstvo-chastjh-1.
Liquibase allows you to perform the following (2022). URL: https://medium.com/search?q=Liquibase.
N Gram (2020). URL: https://stackoverflow.com/questions/18193253/what-exactly-is-an-n-gram.
Raza S., Ding C. (2022). News recommender system: a review of recent progress, challenges, and opportunities. Artif. Intell. Rev., 55, 749–800. DOI: 10.1007/s10462-021-10043-x.
Zuo Y., Zeng J., Gong M., Jiao L. (2016). Tag-aware recommender systems based on deep neural networks. Neurocomputing, 204, 51–60. DOI: 10.1016/j.neucom.2015.10.134.
Lytvyn V., et. al. (2019). Design of a recommendation system based on Collaborative Filtering and machine learning considering personal needs of the user. Eastern-European Journal of Enterprise Technologies, 4(2), 6–28. DOI: 10.15587/1729-4061.2019.175507.
Balush I., Vysotska V., Albota S. (2021). Recommendation System Development Based on Intelligent Search, NLP and Machine Learning Methods. CEUR Workshop Proceedings, 584–617.
Demchuk A., Lytvyn V., Vysotska V., Dilai M. (2020). Methods and Means of Web Content Personalization for Commercial Information Products Distribution. Lecture Notes in Computational Intelligence and Decision Making, Vol. 1020. Springer, Cham. DOI: 10.1007/978-3-030-26474-1_24.
Tulashvili Y., Turbal Y., Abd Alkaleg D., Pasichnyk V., Kunanets N. (2020). The Optimal Tour Problem in Smart Tourism Recommender Systems. In IEEE 15th International Conference on Computer Sciences and Information Technologies (CSIT), Vol. 2, 246–250. DOI: 10.1109/CSIT49958.2020.9322043