Парсинг тексту термінологічних словників

2019;
: сс. 90-100
1
Національний університет “Львівська політехніка”

Окреслено коло завдань, підходів і етапів розроблення технології парсинга тексту
багатомовного тлумачного термінологічного словника. Дослідження проведено для
“Словника української біологічної термінології”. Серед усього словникового розмаїття
цей словник обрано тому, що термінологічні словники надають лексико-семантичну
базу для подальшого створення систем інтелектуального опрацювання фахових текстів,
у яких подається інформація з тих чи інших предметних галузей. Ця термінографічна
праця обіймає нормативну загальнонаукову та широковживану термінологію біоло-
гічних наук, зафіксовану в сучасних енциклопедичних, загальномовних та спеціальних
словниках, у науковій, науково-популярній, навчальній та інформативно-реферативній
літературі. Дослідивши обраний словник, ми зможемо узагальнити модель його
лексикографічної системи на інші предметні галузі, що створить передумови для
формування цілісного багатогалузевого цифрового лексикографічного простору. Робота
зі словниками, переведеними у комп’ютерні текстові формати, є дуже неефективною і
потребує конвертування їх у формати лексикографічних баз даних, що є спеціальним
завданням, не відомим класичній лексикографії. Це і складає зміст терміна “парсинг
словників”. У процесі роботи побудовано модель лексикографічної системи, яку
покладено в основу XML. Подальша робота із перетворення паперової версії словника
на онлайн-систему будується на XML-файлі. Проаналізовано поліграфічне оформлення,
організацію і структуру друкованого тексту словника з метою ідентифікації елементів
концептуальної моделі Л-системи СУБТ. На основі концептуальної моделі побудовано
структуру XML-документа, який пропонується використовувати як посередника між
паперовою версією словника та його реалізацією як онлайнової лексикографічної
системи. Надалі планується побудова універсальної процедури парсингу з
удосконаленням структури XML-документа.

1. Широков В. А. (2018). Эволюция как универсальный естественный закон (Пролегомены к будущей общей теории эволюции). Ч. IIІ. Бионика интеллекта. № 1 (90).

2. Olga Karpova. (2009). Lexicography and Terminology: A Worldwide Outlook. Cambridge: Cambridge Scholars Publishing.

3. PDF-конвертер. From: http://pdf2doc.com/.

4. Словник металургійних термінів (грузинсько-російсько-українсько-англо-німецько-французький). (2011). І том. Тбілісі.

5. Словник металургійних термінів (грузинсько-російсько-українсько-англо-німецько-французький). (2011). ІI том. Тбілісі.

6. Словник металургійних термінів (українсько-грузинсько-російсько-англійсько-німецько-французький). (2014). I том. Київ.

7. Словник металургійних термінів (українсько-грузинсько-російсько-англійсько-німецько-французький.

8. Словник української біологічної термінології. (2012). Київ : КММ.

9. Термінологічний українсько-російсько-англійський словник-довідник зі зварювання. Науково-технічна термінологія. (2013). Київ : Український мовно-інформаційний фонд. Серія: Словники України. [Електронний ресурс. CD]

10. Широков В. А. (Eds.) (2008). Український-російський, Російсько-український словник із зварювання. Київ. [Електронний ресурс. CD].

11. Широков В. А. (Eds.) (2018). Українсько-російсько-англійський словник зі зварювання.Київ. [Електронний ресурс. CD].

12. Широков В.А. (Eds.) (2011). Комп’ютерна лексикографія. Київ : Наук. думка.