Linguistic analysis of textual commercial content

2015;
: pp. 203 - 227
Authors: 
Andriy Berko, Victoria Vysotska, Lyubomyr Chyrun
  1. General Ecology and Ecoinformation Systems Department, 2Information Systems and Networks Department,
  2. Software Department3, Lviv Polytechnic National University, 12 S. Bandera Str., Lviv, 79013, UKRAINE

In the given article the main problems of electronic content commerce and functional services of commercial content processing are analyzed. The proposed model gives an opportunity to create an instrument of information resources processing in electronic content commerce systems (ECCS) and to implement the subsystem of commercial content formation, management and support. The process of ECCS design and creation as an Internet marketing result is iterative. It contains in its structure a number of stages (from the analysis, design and development of a plan to a prototype construction and experimental tests). The latter process begins with the specifications and layout formation, content template creation, content formation and its subsequent publishing according to the site’s structure. In the initial stages (before setting functional requirements and development process initiation) regular users are involved into the process through poll letters, alternative design and prototyping of varying degrees of readiness. Thus, valuable information is collected without much effort, along with both evoking users’ sense of direct involvement in the design process, as well as winning their trust. The paper analyzes sequence methods and models of information resources processing in electronic content-commerce systems. It also allocates the basic laws of the transition from commercial content formation to its implementation. The formal model of ECCS is created, which allows the implementation in phases of the commercial content lifecycle. The developed formal model of information resources processing in electronic content-commerce systems allows us to create a generalized typical architecture of ECCS. The generalized typical architecture of ECCS is proposed in the paper, which helps implement the processes of commercial content formation, management and realization.

1. Baeza-Yates R. Modern Information Retrieval / Ricardo Baeza-Yates, Berthier Rebeiro-Neto // Menlo Parl, California, New York : ACM Press, Addison-Wesley, 1999. Access mode: http://people.ischool.berkeley.edu/~hearst/irbook/print/chap10.pdf.
2. Boiko B. Content Management Bible. — Hoboken, 2004. — 1176 p.
3. Braslavski P.Style-Dependent Document Ranking / P. Braslavski, A. Tselishchev // In Proc. RCDL’2005. Access mode: http://www.rcdl2005.uniyar.ac.ru/ru/RCDL2005/papers/sek7_1_paper.pdf.
4. Brin S. The Anatomy of a Large-Scale Hypertextual Web Search Engine / S. Brin, L. Page // Статья с WWW7. Access mode: http://www-db.stanford.edu/pub/papers/google.pdf.
5. CM Lifecycle Poster / Content Management Professionals. — Режим доступу: http://www.cmprosold.org/resources/poster/.
6. CMIS. Part I — Introduction, General Concepts, Data Model, and Services / EMC, IBM and Microsoft Corporation. —2008. — 76 p.
7. Grefenstette G. Automatic Thesaurus Generation from Raw Text using Knowledge-Poor Techniques / G. Grefenstette // Proceedings of SIGIR, 1995.
8. Hearst M.A. Automatic Acquisition of Hyponyms from Large Text Corpora / M.A. Hearst //Proc. of the 14th International Conference on Computational Linguistics, Nantes, France, 1992. Access mode: http://acl.ldc.upenn.edu/C/C92/C92-2082.pdf.
9. Karlgren J. Recognizing Text Genres with Simple Metrics Using Discriminant Analysis / J. Karlgren, D. Cutting // In Proceedings of the 15th International Conference on Computational Linguistics (COLING), Kyoto, 1994, vol. 2, p. 1071-1075. Access mode: http://www.sics.se/~jussi/Papers/1994_Coling_Kyoto_l/cmplglixcol.ps.
10. Manning C.D. Foundations of Statistical Natural Language Processing / C.D. Manning, H. Schutze // Chapter 5: Collocations. Эл. версия главы.
11. Manning D.C. Introduction to Information Retrieval / Christopher D. Manning, Prabhakar Raghavan, Hinrich Schutze // Cambridge University Press. 2007. Главы будущей книги.
12. Manning C. An Introuction to information retrieval / Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze // Cambridge University Press, Cambridge, England.. 2008, 482 pp, ISBN: 978-0-521-86571-5, Online edition © 2009 Cambridge Up. Access mode: http://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf.
13. Sato S. Automatic collection ofrelated terms from the web / S. Sato, Y. Sasaki // In Proc. 41st ACL, 2003. p. 121–124.
14. Sebastiani F. Machine Learning in Automated Text Categorization / F. Sebastiani // ACM Computing Surveys, Vol. 34, No. 1, March 2002, pp. 1–47.
15. Segalovich I. A fast morphological algorithm with unknown word guessing induced by a dictionary for a web search engine, Access mode: http://company.yandex.ru/articles/iseg-las-vegas.html + обсуждение в форуме.
16. Takkinen J. IRI: Introduktion och IR-systemgrunder (modellering och utvardering) / Juha Takkinen // IISLAB/ADIT/IDA, Linkopings universitet, 2006-01-24. Access mode: https://www.ida.liu.se/~TDDC08/tddc08-ir1.pdf.
17. Zamir O. Web Document Clustering: A Feasibility Demonstration / O. Zamir, O. Etzioni // In Proc. SIGIR’98.
18. Айвазян С.А. Прикладная статистика: Классификация и снижение размерности: Справ. изд. / Под. ред. С.А. Айвазяна. — М.: Финансы и статистика, 1989.
19. Берко А. Системи електронної контент-комерції / А. Берко, В. Висоцька, В. Пасічник. — Л: НУЛП, 2009. — 612 с.
20. Браславский П.И. Интеллектуальные информационные системы / П.И. Браславский. — Режим доступу: http://www.kansas.ru/ai2006/.
21. Браславский П.И. Фасетная организация интернет-каталога и автоматическая жанровая классификация документов / П.И. Браславский, Е.А. Вовк, М.Ю. Маслов // Компьютерная лингвистика и интеллектуальные технологии. Тр. междунар. семинара «Диалог-2002». Т. 2. — М.: Наука, 2002. — С.83-93. Режим доступу:: http://company.yandex.ru/articles/article8.html.
22. Браславский П.И. eXtragon: экспериментальная система для автоматического реферирования веб-документов / П. Брасласвский, И. Колычев // Труды РОМИП-2005. СПб., 2005. С. 40-53. Режим доступу: http://www.romip.narod.ru/romip2005/03_extragon.pdf.
23. Гаврилова Т.А. Извлечение и структурирование знаний для экспертных систем / Т.А. Гаврилова, К.Р. Червинская. — М.: Радио и связь, 1992.
24. Гаврилова Т.А.Базы знаний интеллектуальных систем / Т.А. Гаврилова, В.Ф. Хорошевский. — СПб.: Питер, 2000.
25. Гладкий А.В. Синтаксические структуры естественного языка в автоматизированных системах общения / А.В. Гладкий. — М.: Наука, 1985.
26. Добров Б.Н. Формирование базы терминологических свловосочетаний по текстам предметной области / Б.Н. Добров, Н.В. Лукашевич, С.В. Сыромятников // Электронные библиотеки: Труды конференции RCDL’2003. СПб, 2003. С. 201-210. Режим доступу: http://rcdl2003.spbu.ru.
27. Добрынин В. Теория информационно-логических систем. Информационный поиск. (Методичекие указания к курсу) / В. Добрынин. — СПб., 2002. Режим доступу: http://ir.apmath.spbu.ru/publications/dobrynin_ir_intro/.
28. Іванов В. Контент-аналіз: Методологія і методика дослідження ЗМК / В. Іванов. — Київ, 1994. — 112 с.
29. Иванов С. Статистический анализ документальных информационных потоков / С. Иванов, Н. Круковская // Научно-техническая информация. — 2004. — № 2. — С. 11–14.
30. Искусственный интеллект: Справочник: Кн.1: Системы общения и экспертные системы. — М.: Радио и связь, 1990.
31. Искусственный интеллект: Справочник: Кн.2: Модели и методы. — М.: Радио и связь, 1990.
32. Клифтон Б. Google Analytics / Б. Клифтон. — М: ООО «И.Д.Вильямс», 2009. — 400 с.
33. Коваленко А. Вероятностный морфологический анализатор русского и украинского языков / А. Коваленко. Режим доступу: http://www.keva.ru/stemka/stemka.html.
34. Кукушкина О.В. Определение авторства текста с использованием буквенной и грамматической информации / О.В. Кукушкина, А.А. Поликарпов, Д.В. Хмелёв // Проблемы передачи информации, 2001, т.37, вып.2, с.96-108. Режим доступу: http://www.math.toronto.edu/dkhmelev/PAPERS/published/gramcodes/gramcode....
35. Ландэ Д. Основы моделирования и оценки електронных информационных потоков / Д. Ландэ, В. Фурашев, С. Брайчевский, О. Григорьев. — К.: Інжиніринг, 2006. — 348 с.
36. Леоньтьева Н.Н. Автоматическое понимание текстов: системы, модели, ресурсы / Н.Н. Леоньтьева. — М.: Издательский центр «Академия», 2006.
37. Нейл К. Web-инструмент для выявления плагиата / К. Нейл, Г. Шанмагантан //Открытые системы. 2005. № 01. С. 40-44. Режим доступу: http://www.osp.ru/os/2005/01/040_print.htm.
38. Некрестьянов И. Системы текстового поиска для Веб / И. Некрестьянов, Н. Пантелеева // Программирование. — 2002. — № 28(4). С. 207-225. Режим доступу: http://meta.math.spbu.ru/~nadejda/papers/web-ir/web-ir.html.
39. Осуга С. Обработка знаний / С. Осуга. — М.: Мир, 1989.
40. Пасічник В. Математична лінґвістика / В. Висоцька, В. Пасічник, Ю. Щербина, Т. Шестакевич. — Л: Новий Світ, 2012. — 359 с.
41. Пенроуз Р. Новый ум короля: О компьютерах, мышлении и законах физики / Р. Пенроуз. — М.: УРСС, 2003.
42. Перспективы развития вычислительной техники в 11 кн. Кн. 2. Интеллектуализация ЭВМ. — М.: Высшая школа, 1989.
43. Попов Э.В. Общение с ЭВМ на естественном языке / Э.В. Попов. — М.: Наука, 1982.
44. Попов Э.В. Статические и динамические экспертные системы / Э.В. Попов, И.Б. Фоминых, Е.Б. Кисель, М.Д. Шапот. — М.: Финансы и статистика, 1996.
45. Рао С.Р. Линейные статистические методы и их применения / С.Р. Рао. М.: Наука, 1968.
46. Сегалович И.В. Как работают поисковые системы / И.В. Сегалович // Мир Internet, — 2002. — № 10. Режим доступу: http://www.dialog-21.ru/directions/Segalovich_vorprint.doc.
47. Сокирко А.В. Морфологические модули на сайте www.aot.ru / А.В. Сокирко //Материалы конференции «Диалог-2004». Режим доступу: http://www.dialog-21.ru/Archive/2004/Sokirko.htm.
48. Солтон Д. Динамические библиотечно-информационные системы / Д. Солтон. — М.: Мир, 1979. — 560 с .
49. Факторный, дискриминантный и кластерный анализ: Пер. с англ. — М.: Финансы и статистика, 1989.
50. Федорчук А. Контент-мониторинг информационных потоков / А. Федорчук. — БНАН, Киев,2005.№ 3. Режим доступу: www.nbuv.gov.ua/articles/2005/05fagmip.html.
51. Хан У. Системы автоматического реферирования / У. Хан, И. Мани // Открытые системы, 2000. — № 12. Режим доступу: http://www.osp.ru/os/2000/12/067_print.htm.
52. Хмелев Д. Распознавание автора текста с использованием цепей А.А. Маркова / Д. Хмелев // Вестник МГУ, сер.9: Филология, N 2, 2000, с.115-126. Режим доступу: http://www.rusf.ru/books/analysis/vestnik2000win.htm.
53. Храмцов П. Информационно-поисковые системы Internet / П. Храмцов // Открытые системы. — 1996. — № 3. Режим доступу: http://www.osp.ru/os/1996/03/46_print.htm.

Берко А.Ю. Лінгвістичний аналіз текстового комерційного контенту / Берко А.Ю., Висоцька В.А., Чирун Л.В. // Вісник Національного університету "Львівська політехніка". – 2015. – № ___ : Інформаційні системи та мережі. – С. ___–___. – Бібліографія: 53 назви.