Автоматизація визначення функцій і продуктивності термінів у терміносистемах

Партико З. Автоматизація визначення функцій і продуктивності термінів у терміносистемах / Зіновій Партико // Вісник Нац. ун-ту «Львівська політехніка». Серія «Проблеми української термінології». – 2017. – № 869. – С. 47–49.

1
Житомирський державний університет ім. І. Франка

Сутність проблеми полягає в складності аналізу терміносистем великого обсягу, що містять сотні чи тисячі термінів. Щоб розв’язати цю проблему доцільно використати метод сітьового* аналізу, запропонований Е. Ф. Скороходьком. Метод передбачає подання терміносистеми у формі матриці, виокремивши початкові, похідні й кінцеві терміни, а також визначивши їхню продуктивність. За умови коректного представлення у словнику вихідних даних (тобто відповідно до прийнятого формату) метод може бути доволі просто автоматизовано. Подано приклад формату розробленого словника, а також способи його формалізованого аналізу.

Сутність проблеми. Сутність досліджуваної проблеми полягає в тому, що, укладаючи традиційними методами терміносистеми, зазвичай важко визначити, продуктивність термінів у ній, а, отже, встановити функції цих термінів.

Аналіз останніх досліджень і публікацій. Існує низка відомих традиційних методів, які дають змогу визначати продуктивність і функції термінів у терміносистемах, проте такі методи передбачають ручні операції, а тому охоплюють унаслідок цього порівняно невелику кількість (кілька десятків, сотню) термінів. На такі дослідження витрачають значний час.

Українським дослідником Е. Ф. Скороходьком свого часу було запропоновано сітьовий метод дослідження продуктивності й функцій термінів у терміносистемах, який ґрунтується на моделюванні терміносистеми за допомогою орієнтованого графа [3; 4]. Уважаємо, що такий метод (за умови коректного представлення вихідних даних) дає змогу якісно описати аналізовану терміносистему й провести її якісний аналіз.

Виокремлення нерозв’язаних раніше частин загальної проблеми. Нерозв’язана раніше частина проблеми полягає в тому, що вказаний сітьовий аналіз терміносистем не було автоматизовано. Автоматизація цього методу може дати змогу отримати значний ефект під час аналізу терміносистем, а також отримати в процесі його проведення об’єктивні дані, до того ж за будь-якої величини терміносистеми.

Формулювання мети статті. Мета статті полягає, по-перше, у тому, щоб показати способи формалізації методу сітьового аналізу терміносистем, а, по-друге, у спробі організувати створення для цього під егідою Технічного комітету стандартизації науково-технічної термінології відповідних програмних засобів.

Виклад основного матеріалу дослідження. Як відомо, у терміносистемі кожен термін виконує певні функції, а також залежно від цього має певну продуктивність. Тут під функціями маємо на увазі те, яким він є:

– початковим (у його означенні нема жодного заголовкового терміна укладеної терміносистеми, але його використовують в означеннях інших термінів цієї терміносистеми);

– похідним (він має в означенні заголовкові терміни цієї терміносистеми і його використовують в означеннях інших термінів),

– кінцевим (він має в означенні заголовкові терміни терміносистеми, але в означеннях інших термінів його не використовують).

Продуктивність указує, у скількох означеннях (в абсолютних одиницях чи відсотках) було використано певний термін. Дані про функції та продуктивність термінів дають змогу ефективніше конструювати створювані терміносистеми (виявляти терміни, що стоять поза межами терміносистеми; виявляти групи не взаємопов’язаних термінів; серед термінів-синонімів виявляти найменш продуктивні тощо). Тобто, такі дані дають змогу перетворювати термінологію (неупорядковану множину термінів) на терміносистему.

Укладаючи термінологічні словники, для визначення функцій і продуктивності термінів доцільно використовувати таку технологію:

1.  Підготувати термінологічний словник за допомогою текстового редактора у форматі docrtf тощо. Кожен запис такого словника повинен мати заголовковий термін та його означення (розділювачем, як це традиційно є в словниках, може бути тире).

Передбачається, що означення термінів повинні відповідати вимогам формальної логіки до означень [1, с. 165–175].

2.  В означеннях термінів у ручному режимі треба виокремлювати шрифтом (товстим, курсивом, підкресленням тощо) ті терміни, які в цьому словнику використовують як заголовкові.

3.  За допомогою будь-якої програми для роботи з електронними таблицями, наприклад Exel, збудувати матрицю N × N , де N – кількість заголовкових термінів у словнику. У такій таблиці рядки будуть задавати заголовкові терміни, а стовпці – ті терміни, які використовують у їхніх означеннях.

4.  На перехресті рядків і стовпців у комірках указати, в означеннях яких термінів є інші заголовкові терміни. Цю операцію можна виконувати як у ручному, так і в автоматизованому режимах.

Щоб виконати цю операцію в автоматизованому режимі для ідентифікування термінів на їхні закінчення треба накладати маски (зазвичай, на три знаки)1.

Для автоматизованого виконання цієї операції потрібно розробити спеціальні програмні засоби. Складність створення таких засобів відповідає складності дипломної роботи для магістрів, що навчаються за однією зі спеціальностей напряму «Програмування».

5.  Вирахувати, які терміни є початковими, похідними, кінцевими, а також їхню продуктивність (функції та продуктивність можуть бути представлені у формі таблиці, в якій в алфавітному порядку для кожного терміна вказано ці його характеристики).

6.  За допомогою наявних пакетів програм, призначених для візуалізації даних, представити отримані результати у формі сітьового графа.

У рамках викладеної технології (п. 1 і 2) нами було укладено словник видавничих термінів [2] фрагмент якого подаємо (курсивом в означеннях виокремлено терміни, які в цьому словномку зутрічаються як заголовкові):

Видання – 1. Окреме самостійне повідомлення чи їх множина, які ЗМІ: а) відредагувалисконструювали й зафіксували методами друкування, тиснення на папері чи копіювання на електронні або цифрові носії інформації; б) доповнили вихідними відомостями; в) опублікували/оприлюднили чи планують до опублікування/оприлюднення. 2. Поліграфічна одиниця видання найвищого рівня, яка складається з розділів, доповнена вихідними відомостями і становить окрему самостійну одиницю видавничої продукції.

Повідомлення – інформація, зафіксована на носії інформації, яку відправник інформації (зокрема авторжурналіст) призначає для передачі іншій людині чи групі людей – отримувачам (реципієнтам, тобто читачамслухачамглядачам). Вербальні повідомлення інваріантні щодо мови. Фіксуючи повідомлення конкретною мовою, автор перетворює його в текст. Види: вербальні (словесні) й невербальні (наприклад, графічні, аудіальні, відео).

Інформація – розпізнаний кібернетичною системою (людиною) сигнал (чи комплекс сигналів – образ), який змінює її стан, зменшуючи кількість варіантів вибору нею чергової дії (команди).

Укладена видавнича терміносистема містить понад 800 заголовкових термінів. Проте подальші дослідження цієї терміносистеми загальмовано через відсутність згаданих вище програмних засобів.

Висновки й перспективи подальших досліджень. Ураховуючи викладене, уважаємо за доцільне ініціювати в рамках НУ «Львівська політехніка» під егідою Технічного комітету стандартизації науково-технічної термінології створення згаданих раніше програмних засобів, які могли б стати корисними для дослідження терміносистем української мови в нашій державі. Такі програмні засоби, доцільно було б поширювати на безоплатній основі.

*  мережевого (тут і далі треба вживати цей термін) – ред.

1  Для автоматизованого виконання цієї операції потрібно розробити спеціальні програмові засоби. Складність створення таких засобів відповідає складності дипломної праці для магістрів, що навчаються за однією зі спеціальностей напряму «Програмування».

1. Конверський А. Є. Логіка (традиційна та сучасна) : підручник / А. Є. Конверський. – К. : Центр навчальної літератури, 2004. – 536 с. 2. Партико З. В. Словник видавничих термінів / З. В. Партико. – Запоріжжя : КПУ, 2013. – 68 с. 3. Скороходько Э. Ф. Семантические сети и автоматическая обработка текста / Э. Ф. Скороходько. – К. : Наук. думка, 1983. – 218 с. 4. Скороходько Е. Ф. Термін у науковому тексті (до створення терміноцентричної теорії наукового дискурсу) / Е. Ф. Скороходько. – К. : Логос, 2006. – 98 с