Лінгвістичний аналіз текстового комерційного контенту

2015;
: сс. 203 - 227
Автори: 
Берко А.Ю., Висоцька В.А., Чирун Л.В.

Національний університет «Львівська політехніка» 
1 кафедра загальної екології та екоінформаційних систем, 
2 кафедра інформаційних систем та мереж, 
3 кафедра програмного забезпечення

У цій роботі проаналізовано основні проблеми електронної контент-комерції та функціональних сервісів опрацювання комерційного контенту. Запропонована модель дає можливість створити засоби опрацювання інформаційних ресурсів в системах електронної контент-комерції (СЕКК) та реалізувати підсистеми формування, управління та супроводу комерційного контенту. Процес проектування та створення СЕКК за результатами Інтернет-маркетингу є ітеративним і містить у своєму складі низку етапів від аналізу, проектування, розроблення плану до створення прототипу і експериментальних випробувань, починаючи з формування специфікацій, верстання, створення шаблону контенту, формування контенту та його подальше розміщення згідно з структурою сайта. На початкових етапах до визначення функціональних вимог і початку процесу розроблення до процесу залучають кінцевих користувачів за допомогою листків опитування, альтернатив проектування і прототипів різного ступеня готовності. Без значних зусиль збирають цінну інформацію, одночасно викликаючи у користувачів відчуття безпосередньої участі в процесі проектування та завойовуючи їхню довіру. Проаналізовано способи та моделі послідовності опрацювання інформаційних ресурсів в системах електронної контент-комерції та виділено основні закономірності переходу від процесів формування комерційного контенту до його реалізації. Створено формальну модель систем електронної комерції, що дало змогу реалізувати етапи життєвого циклу комерційного контенту. Розроблено формальні моделі опрацювання інформаційних ресурсів у системах електронної контент-комерції, що дало змогу створити узагальнену типову архітектуру системи електронної контент-комерції. Запропоновано узагальнену типову архітектуру системи електронної контент-комерції, що дало змогу реалізувати процеси формування, управління та реалізації комерційного контенту.

1. Baeza-Yates R. Modern Information Retrieval / Ricardo Baeza-Yates, Berthier Rebeiro-Neto // Menlo Parl, California, New York : ACM Press, Addison-Wesley, 1999. Access mode: http://people.ischool.berkeley.edu/~hearst/irbook/print/chap10.pdf.
2. Boiko B. Content Management Bible. — Hoboken, 2004. — 1176 p.
3. Braslavski P.Style-Dependent Document Ranking / P. Braslavski, A. Tselishchev // In Proc. RCDL’2005. Access mode: http://www.rcdl2005.uniyar.ac.ru/ru/RCDL2005/papers/sek7_1_paper.pdf.
4. Brin S. The Anatomy of a Large-Scale Hypertextual Web Search Engine / S. Brin, L. Page // Статья с WWW7. Access mode: http://www-db.stanford.edu/pub/papers/google.pdf.
5. CM Lifecycle Poster / Content Management Professionals. — Режим доступу: http://www.cmprosold.org/resources/poster/.
6. CMIS. Part I — Introduction, General Concepts, Data Model, and Services / EMC, IBM and Microsoft Corporation. —2008. — 76 p.
7. Grefenstette G. Automatic Thesaurus Generation from Raw Text using Knowledge-Poor Techniques / G. Grefenstette // Proceedings of SIGIR, 1995.
8. Hearst M.A. Automatic Acquisition of Hyponyms from Large Text Corpora / M.A. Hearst //Proc. of the 14th International Conference on Computational Linguistics, Nantes, France, 1992. Access mode: http://acl.ldc.upenn.edu/C/C92/C92-2082.pdf.
9. Karlgren J. Recognizing Text Genres with Simple Metrics Using Discriminant Analysis / J. Karlgren, D. Cutting // In Proceedings of the 15th International Conference on Computational Linguistics (COLING), Kyoto, 1994, vol. 2, p. 1071-1075. Access mode: http://www.sics.se/~jussi/Papers/1994_Coling_Kyoto_l/cmplglixcol.ps.
10. Manning C.D. Foundations of Statistical Natural Language Processing / C.D. Manning, H. Schutze // Chapter 5: Collocations. Эл. версия главы.
11. Manning D.C. Introduction to Information Retrieval / Christopher D. Manning, Prabhakar Raghavan, Hinrich Schutze // Cambridge University Press. 2007. Главы будущей книги.
12. Manning C. An Introuction to information retrieval / Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze // Cambridge University Press, Cambridge, England.. 2008, 482 pp, ISBN: 978-0-521-86571-5, Online edition © 2009 Cambridge Up. Access mode: http://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf.
13. Sato S. Automatic collection ofrelated terms from the web / S. Sato, Y. Sasaki // In Proc. 41st ACL, 2003. p. 121–124.
14. Sebastiani F. Machine Learning in Automated Text Categorization / F. Sebastiani // ACM Computing Surveys, Vol. 34, No. 1, March 2002, pp. 1–47.
15. Segalovich I. A fast morphological algorithm with unknown word guessing induced by a dictionary for a web search engine, Access mode: http://company.yandex.ru/articles/iseg-las-vegas.html + обсуждение в форуме.
16. Takkinen J. IRI: Introduktion och IR-systemgrunder (modellering och utvardering) / Juha Takkinen // IISLAB/ADIT/IDA, Linkopings universitet, 2006-01-24. Access mode: https://www.ida.liu.se/~TDDC08/tddc08-ir1.pdf.
17. Zamir O. Web Document Clustering: A Feasibility Demonstration / O. Zamir, O. Etzioni // In Proc. SIGIR’98.
18. Айвазян С.А. Прикладная статистика: Классификация и снижение размерности: Справ. изд. / Под. ред. С.А. Айвазяна. — М.: Финансы и статистика, 1989.
19. Берко А. Системи електронної контент-комерції / А. Берко, В. Висоцька, В. Пасічник. — Л: НУЛП, 2009. — 612 с.
20. Браславский П.И. Интеллектуальные информационные системы / П.И. Браславский. — Режим доступу: http://www.kansas.ru/ai2006/.
21. Браславский П.И. Фасетная организация интернет-каталога и автоматическая жанровая классификация документов / П.И. Браславский, Е.А. Вовк, М.Ю. Маслов // Компьютерная лингвистика и интеллектуальные технологии. Тр. междунар. семинара «Диалог-2002». Т. 2. — М.: Наука, 2002. — С.83-93. Режим доступу:: http://company.yandex.ru/articles/article8.html.
22. Браславский П.И. eXtragon: экспериментальная система для автоматического реферирования веб-документов / П. Брасласвский, И. Колычев // Труды РОМИП-2005. СПб., 2005. С. 40-53. Режим доступу: http://www.romip.narod.ru/romip2005/03_extragon.pdf.
23. Гаврилова Т.А. Извлечение и структурирование знаний для экспертных систем / Т.А. Гаврилова, К.Р. Червинская. — М.: Радио и связь, 1992.
24. Гаврилова Т.А.Базы знаний интеллектуальных систем / Т.А. Гаврилова, В.Ф. Хорошевский. — СПб.: Питер, 2000.
25. Гладкий А.В. Синтаксические структуры естественного языка в автоматизированных системах общения / А.В. Гладкий. — М.: Наука, 1985.
26. Добров Б.Н. Формирование базы терминологических свловосочетаний по текстам предметной области / Б.Н. Добров, Н.В. Лукашевич, С.В. Сыромятников // Электронные библиотеки: Труды конференции RCDL’2003. СПб, 2003. С. 201-210. Режим доступу: http://rcdl2003.spbu.ru.
27. Добрынин В. Теория информационно-логических систем. Информационный поиск. (Методичекие указания к курсу) / В. Добрынин. — СПб., 2002. Режим доступу: http://ir.apmath.spbu.ru/publications/dobrynin_ir_intro/.
28. Іванов В. Контент-аналіз: Методологія і методика дослідження ЗМК / В. Іванов. — Київ, 1994. — 112 с.
29. Иванов С. Статистический анализ документальных информационных потоков / С. Иванов, Н. Круковская // Научно-техническая информация. — 2004. — № 2. — С. 11–14.
30. Искусственный интеллект: Справочник: Кн.1: Системы общения и экспертные системы. — М.: Радио и связь, 1990.
31. Искусственный интеллект: Справочник: Кн.2: Модели и методы. — М.: Радио и связь, 1990.
32. Клифтон Б. Google Analytics / Б. Клифтон. — М: ООО «И.Д.Вильямс», 2009. — 400 с.
33. Коваленко А. Вероятностный морфологический анализатор русского и украинского языков / А. Коваленко. Режим доступу: http://www.keva.ru/stemka/stemka.html.
34. Кукушкина О.В. Определение авторства текста с использованием буквенной и грамматической информации / О.В. Кукушкина, А.А. Поликарпов, Д.В. Хмелёв // Проблемы передачи информации, 2001, т.37, вып.2, с.96-108. Режим доступу: http://www.math.toronto.edu/dkhmelev/PAPERS/published/gramcodes/gramcode....
35. Ландэ Д. Основы моделирования и оценки електронных информационных потоков / Д. Ландэ, В. Фурашев, С. Брайчевский, О. Григорьев. — К.: Інжиніринг, 2006. — 348 с.
36. Леоньтьева Н.Н. Автоматическое понимание текстов: системы, модели, ресурсы / Н.Н. Леоньтьева. — М.: Издательский центр «Академия», 2006.
37. Нейл К. Web-инструмент для выявления плагиата / К. Нейл, Г. Шанмагантан //Открытые системы. 2005. № 01. С. 40-44. Режим доступу: http://www.osp.ru/os/2005/01/040_print.htm.
38. Некрестьянов И. Системы текстового поиска для Веб / И. Некрестьянов, Н. Пантелеева // Программирование. — 2002. — № 28(4). С. 207-225. Режим доступу: http://meta.math.spbu.ru/~nadejda/papers/web-ir/web-ir.html.
39. Осуга С. Обработка знаний / С. Осуга. — М.: Мир, 1989.
40. Пасічник В. Математична лінґвістика / В. Висоцька, В. Пасічник, Ю. Щербина, Т. Шестакевич. — Л: Новий Світ, 2012. — 359 с.
41. Пенроуз Р. Новый ум короля: О компьютерах, мышлении и законах физики / Р. Пенроуз. — М.: УРСС, 2003.
42. Перспективы развития вычислительной техники в 11 кн. Кн. 2. Интеллектуализация ЭВМ. — М.: Высшая школа, 1989.
43. Попов Э.В. Общение с ЭВМ на естественном языке / Э.В. Попов. — М.: Наука, 1982.
44. Попов Э.В. Статические и динамические экспертные системы / Э.В. Попов, И.Б. Фоминых, Е.Б. Кисель, М.Д. Шапот. — М.: Финансы и статистика, 1996.
45. Рао С.Р. Линейные статистические методы и их применения / С.Р. Рао. М.: Наука, 1968.
46. Сегалович И.В. Как работают поисковые системы / И.В. Сегалович // Мир Internet, — 2002. — № 10. Режим доступу: http://www.dialog-21.ru/directions/Segalovich_vorprint.doc.
47. Сокирко А.В. Морфологические модули на сайте www.aot.ru / А.В. Сокирко //Материалы конференции «Диалог-2004». Режим доступу: http://www.dialog-21.ru/Archive/2004/Sokirko.htm.
48. Солтон Д. Динамические библиотечно-информационные системы / Д. Солтон. — М.: Мир, 1979. — 560 с .
49. Факторный, дискриминантный и кластерный анализ: Пер. с англ. — М.: Финансы и статистика, 1989.
50. Федорчук А. Контент-мониторинг информационных потоков / А. Федорчук. — БНАН, Киев,2005.№ 3. Режим доступу: www.nbuv.gov.ua/articles/2005/05fagmip.html.
51. Хан У. Системы автоматического реферирования / У. Хан, И. Мани // Открытые системы, 2000. — № 12. Режим доступу: http://www.osp.ru/os/2000/12/067_print.htm.
52. Хмелев Д. Распознавание автора текста с использованием цепей А.А. Маркова / Д. Хмелев // Вестник МГУ, сер.9: Филология, N 2, 2000, с.115-126. Режим доступу: http://www.rusf.ru/books/analysis/vestnik2000win.htm.
53. Храмцов П. Информационно-поисковые системы Internet / П. Храмцов // Открытые системы. — 1996. — № 3. Режим доступу: http://www.osp.ru/os/1996/03/46_print.htm.

Берко А.Ю. Лінгвістичний аналіз текстового комерційного контенту / Берко А.Ю., Висоцька В.А., Чирун Л.В. // Вісник Національного університету "Львівська політехніка". – 2015. – № ___ : Інформаційні системи та мережі. – С. ___–___. – Бібліографія: 53 назви.