parsing

Парсинг тексту термінологічних словників

Окреслено коло завдань, підходів і етапів розроблення технології парсинга тексту
багатомовного тлумачного термінологічного словника. Дослідження проведено для
“Словника української біологічної термінології”. Серед усього словникового розмаїття
цей словник обрано тому, що термінологічні словники надають лексико-семантичну
базу для подальшого створення систем інтелектуального опрацювання фахових текстів,
у яких подається інформація з тих чи інших предметних галузей. Ця термінографічна

Метод лінгвістичного аналізу україномовного комерційного контенту

Розв’язано науково-практичну задачу автоматичного виявлення значущих ключових слів та рубрикації україномовного контенту в інтернет-системах на основі методу лінгвістичного аналізу текстової інформації. Наведено теоретичне та експериментальне обґрунтування методу лінгвістичного аналізу україномовного контенту з використанням стемінгу Портера.

Метод формального визначення якості допису на спеціалізованих сайтах

Post quality assessing algorithm based on the set of chosen parameters is considered in the article. To solve the problem the following next instruments will be used: Java library called Jsoup for HTML-code parsing, and Matlab tools for building the decision tree for post quality assessing.

Порівняльний аналіз методів синтаксичного розбору текстів

Описано деякі алгоритми синтаксичного аналізу. Також порівняно продуктивність роботи обраних алгоритмів.