The defining of sample size for statistical analysis of texts

2015;
: pp. 293 - 300
Authors: 
Ihor Kulchytskyy

Applied Linguistics Department, Lviv Polytechnic National University, 12 S. Bandera Str., Lviv, 79013, UKRAINE

The article is dedicated to one of the most important areas of quantitative studies of language and speech that is the study of information and statistical properties of text. An attempt was made to establish Cheremshyna’s literary works percentage sufficient to analyze relative frequencies of characters in his works and to investigate the stability of these frequencies. A number of conclusions were made about the size of text passages which may form text-sample for statistical surveys.

1. Алферов А. П. Основы криптографии. Учебное пособие, 2-е изд., испр. и доп. / А. П. Алферов, А. Ю. Зубов, А. С. Кузьмин, А. В. Черемушкин .— М: Гелиос АРВ, 2002 .— 480 с.
2. Архипова О. О. Частотний аналіз використання букв української мови / О. О. Архипова, В. М.Журавльов [Електронний ресурс] .— Режим доступу : http://kudin.net/r/index.php/ukr-frequency-analysis
3. Бук Соломія Лінгвостатистичний опис «Не спитавши броду» Івана Франка / Соломія Бук [Електронний ресурс] .— Режим доступу : http://www.lnu.edu.ua/faculty/ Philol/www/visnyk/55_2011/55_2011_Buk.pdf
4. Бук Соломія Сучасні методи дослідження мови письменника у слов’янознавстві / Соломія Бук [Електронний ресурс] .— Режим доступу : http://www.lnu.edu.ua/page/n61/010.pdf
5. Верхозин С. С. О статусе количественных методов в лингвистике / С. С. Верхозин [Електронний ресурс] .— Режим доступу : http://cyberleninka.ru/article/n/o-statuse-kolichestvennyh-metodov-v-lin...
6. Гладкий, А. В. «Математические методы изучения естественных языков», Математическая логика, теория алгоритмов и теория множеств, Сборник работ. Посвящается академику Петру Сергеевичу Новикову к его семидесятилетию, Тр. МИАН СССР, 133, 1973, 95–108 [Електронний ресурс] .— Режим доступу : http://www.mathnet.ru/links/ 3ff1f6b395ed41df319615fb89072f40/ tm2737.pdf
7. Головин Б. Н. О вероятностно-статистическом изучении стилевой дифференциации языка / Б. Н. Головин .— Москва: Наука, 1988. — 258 с.
8. Кригін М. Ю. , Широков В. А. Дослідження інформаційно-статистичних властивостей українського тексту / М. Ю. Кригін, В. А. Широков // Математические машины и системы. — ІПММС НАНУ, 2000. — N 1. — С. 120–127.
9. Кульчицький І. М. Технічні аспекти опрацювання комп’ютером природномовної інформації / І. М. Кульчицький // Вісник Національного університету «Львівська політехніка»: Інформаційні системи та мережі. — Львів: Видавництво НУ «Львівська політехніка», 2014. — № 783. — С. 344-353.
10. Родионова Е. С. Методы атрибуции художественных текстов / Е. С. Родионова [Електронний ресурс] .— Режим доступу : http://epir.ru/pragmat!/projects/corneille/files/ Metody_atributsii.pdf
11. Ружевич Н. А. Математична статистика: Навч.посібник для студ. базового напряму Прикладна математика / Н. А. Ружевич : Національний ун-т Львівська політехніка .— Л. : Видавництво Національного ун-ту Львівська політехніка, 2001 .— 167с.
12. Статистичні параметри стилів / за ред. Перебийніс В.С. — Київ: Наукова Думка, 1967. — 260 с.
13. Фрумкина Р. М. Роль статистических методов в современных лингвистических исследованиях // Шаумян, С. К. Математическая лингвистика / ответственный редактор С. К. Шаумян .— Москва : Наука, 1973 .— С. 156-183
14. Хмелёв Д. В. Распознавание автора текста с использованием цепей А.А. Маркова / Д. В. Хмелёв .— М.: Вестник МГУ, 2000 .— сер.9: филология, № 2 .— С.115-126.
15. Черемшина Марко. Твори: у 3 т. / Повне видання за ред.. Є. Пеленського .— Львів: Ізмарагд, 1937 .— Т. 1: 206 с.— Т. 2.: 245 с.— Т. 3.: 231 с.
16. Широков В. А. Інформаційна теорія лексикографічних систем / В. А. Широков .— К.: Довіра, 1998 .— 331 с.
17. Ihor Kulchytskyy Idiolect of Marko Cheremshyna: quantitative aspect / Kulchytskyy Ihor, Sozanska Khrystyna // Комп’ютерні науки та інформаційні технології: Матеріали IX Міжнародної конференції CSIT 2014 .— Львів: Видавництво Львівської політехніки, 2014 .— с. 143-145.

Кульчицький І.М. Вибір розміру вибірки для статистичних опрацювань текстів / Кульчицький І.М. // Вісник Національного університету "Львівська політехніка". – 2015. – № ___ : Інформаційні системи та мережі. – С. ___–___. – Бібліографія: 17 назв.