видобування багатослівних конструкцій

Розпізнавання багатослівних конструкцій

Розглянуто проблему багатослівних конструкцій, яка відіграє дуже важливу роль у технології обробки природної мови. Багатослівні конструкції – це вирази, які складаються з щонайменше двох слів і можуть бути синтаксично і/або семантично ідіосинкратичними. Це зокрема складені іменники, ідіоми і фразові дієслова. У цій роботі досліджено сучасні підходи до класифікації багатослівних конструкцій, їхньої ідентифікації та видобування з текстів.