computational linguistics

Проектування системи автоматизованого генерування віршованих творів

 Розглянуто особливості проектування системи автоматизованого генерування віршованих творів, що відкриває нові можливості художнього мовлення та сфери шоу-бізнесу, насамперед підготовки віршів і пісень. Доволі часто тексти пісень без особливого змісту стають успішними через відсутність складних сюжетів, а також через ненав'язливість і легкість їхнього сприйняття слухачами. Проаналізовано відомі літературні джерела та наявні програмні продукти, які можуть генерувати віршовані твори, поєднуючи різні методи та алгоритми.

Статистичний розподіл і флуктуації довжин речень в українських, російських і англійських корпусах

Вивчено розподіли частот речень за їхньою довжиною для українського, російсь- кого та англійського корпусів і з’ясовано середні довжини речень в одиницях знаків, літер і слів. Показано, що хвости статистичних розподілів задовільно описуються експоненційною або близькими до неї функціями, що узгоджуються зі стохастичним характером довжини речень. Доведено, що залежність флуктуацій частоти речень різних довжин від середніх значень цієї частоти визначається степеневим законом Тейлора.