опрацювання природної мови

Розпізнавання багатослівних конструкцій

Розглянуто проблему багатослівних конструкцій, яка відіграє дуже важливу роль у технології обробки природної мови. Багатослівні конструкції – це вирази, які складаються з щонайменше двох слів і можуть бути синтаксично і/або семантично ідіосинкратичними. Це зокрема складені іменники, ідіоми і фразові дієслова. У цій роботі досліджено сучасні підходи до класифікації багатослівних конструкцій, їхньої ідентифікації та видобування з текстів.

Граматична корекція речень з використанням графу взаємовиключних гіпотез

A method for automatic correction of Ukrainian sentences is introduced. The method is based on dependency grammar and utilizes mutually exclusive hypothesis graph for word sense disambiguation. 37 % of ambiguous sentences which were correctly corrected as opposed to 14 % corrected by spell checker.