видобування даних

Анотування текстів для здійснення автоматичного розпізнавання іменованих сутностей

Описано створення анотованого корпусу іменованих сутностей для української мови.

This paper describes the process of creating an annotated corpus of named entities for Ukrainian language.

Creation of the Annotated Text Corpus for Automatic Recognition of Semantic Relations Within Named Entities

Описано загальний алгоритм створення та анотування корпусу медичних текстів українською мовою, для їх подальшого використання в системах видобування зв’язків. Анотування даних проводилося за допомогою сиcтеми Gate (Загальна архітектура обробки текстів).