Проблемні аспекти локалізації окремих термінів з прикладної лінгвістики

1
Національний університет «Львівська політехніка»
2
Національний університет «Львівська політехніка»
3
Національний університет «Львівська політехніка»

У статті розглянуто проблеми правильної передачі українською мовою термінів parsing і stemming, вживання яких на сьогоднішній день не обмежується тільки прикладною лінгвістикою. Запропоновано власне українські відповідники, які, на думку авторів, вірно передають значення англійських термінів.

Будь-яка терміносистема – це складова частина літературної норми і бере безпосередню участь у її формуванні [9]. Відомо, що близько 90% нових слів, що з’являються в мові, – це терміни» [7]. У сучасну добу чи не щодня вчені та дослідники роблять відкриття, створюють нові технології. Кожен винахід чи новинка породжує потребу в словах на їх позначення, на опис їхніх функцій та можливостей. Так виникають нові терміни, для кожного з яких важливу роль відіграє ступінь його засвоюваності, його милозвучність, прозорість тощо. Позаяк наукова сфера має міжнародний характер, то відсоток запозичень у терміносистемах постійно зростає внаслідок формування глобального інформаційного простору, суспільних та економічних процесів, спрямованих на світову інтеграцію [7].

Однак застереження викликає факт, що серед запозичень у сучасній українській термінології, та й у мові загалом, переважають англіцизми. З одного боку, це є відображенням того, що саме англомовні країни ведуть перед у науково-технічному поступі. З іншого боку, неконтрольоване включення до складу української мови іншомовних термінів призводить до її засмічення. Чого лише варті іміджмейкери, спічрайтери, менеджери паблікрілейшнз, спінлікарі. Словам іншомовного походження часто віддають перевагу без жодних вагомих підстав.

Мета цього дослідження – проаналізувати доцільність вжитку окремих англіцизмів у терміносистемі прикладної лінгвістики та запропонувати альтернативні терміни, які б відповідали чинним нормам термінотворення в Україні. Актуальність теми обумовлена тим, що термінологія прикладної лінгвістики в Україні в багатьох її напрямах ще неусталена [17]. Удосконалення української термінології цієї галузі важливе ще й тим, що вона безпосередньо пов’язана з використанням комп’ютера, який – один з основних комунікативних засобів сьогодення і неявно впливає на мовленєву культуру суспільства, особливо представників його молодшої генерації.

Про проблеми української термінології йде мова в наукових збірниках «Лексикографічний бюлетень», матеріалах українських та міжнародних наукових конференцій тощо [5; 8; 12]. Найвагоміші з цієї тематики – дві міжнародні конференції, що відбуваються регулярно раз на два роки: «Проблеми української термінології СловоСвіт» у Львові та «Українська термінологія і сучасність» у Києві. Остання, щоправда, порушила регулярність свого проведення, але сподіватимемось, що все повернеться у свої береги. Однак постійна поява нових термінів зумовлює неперервність у роботі над удосконаленням терміносистем.

Формування науково-технічної термінології, як і лексика мови загалом, йде двома шляхами: словотвір та запозичення.

До продуктивних способів творення термінів належить суфіксація, напр.: -анн(я) [-нн(я)]депонування, розжарювання; -ість: платоспроможність, селективність, теплобарвність-ачвмикач, заломлювач; -ств(о): банкрутство, законодавство; -аці(я): індексація, ревальвація та ін. Багато термінів із нульовим суфіксом, напр: обіг, примус, вклад, оборот, актив, пасив, перезаряд, випар, осад. Інші способи творення –префіксальний та префіксально-суфіксальний:піддіапазон, ретрансляція, іммобілізація, дисбаланс, відосередник; осново- та словоскладання: ампер-секунда, тест-матриця; абревіація: лавсан, піар, рація, біоніка. Виділяють також неморфологічний спосіб словотворення, коли новий термін виникає в результаті розщеплення багатозначного слова й утворення омоніма.

Стосовно запозичень, то терміни іншомовного походження – природна річ у мові, адже зараз наука має глобальний характер. На захист запозичень у науково-технічній термінології стають учені з конкретних галузей та мовознавці. До запозичень можна вдаватися, якщо: 1) їх не вдається замінити засобами української мови; 2) вони стійко ввійшли до складу української лексики; 3) потенційні еквіваленти мають іншу семантичну структуру, і саме відповідний англіцизм (для прикладу) має точніше значення. Надмірне заперечення запозичень може призвести до ізоляції національної науки та побудувати нові перешкоди обміну досвідом між дослідниками, що розмовляють різними мовами [6].

Доволі часто запозичений та український терміни функціюють паралельно. На думку мовознавців і згідно з ДСТУ 3966-2009 Термінологічна робота. Засади і правила розроблення стандартів на терміни та визначення понять [4], у такому разі перевагу варто віддавати саме українському еквіваленту (наприклад, принтер – друкаркаінцидент – випадокуправління – керуванняпідйом – узвіз тощо).

Подібні тенденції спостерігаємо і в інших країнах. Наприклад, завдяки зусиллям Міністра транспорту Німеччини Петера Рамзауера в стінах відомства відбуваються «попередні обговорення», а не «брифінги», «збирання ідей», а не «брейнстормінг». Річ у тому, що міністр транспорту Петер Рамзауер свого часу заборонив вживати у своєму відомстві англійські поняття. Як повідомляється, навіть складено список англійських висловів, замість яких треба вживати тільки німецький відповідник. Проте запозичення, що «прижилися», продовжують функціювати.

Також чехи для більшості іншомовних понять завжди намагалися запропонувати національні термінологічні еквіваленти. Наприклад, у чехів не театр, а «дівадло» (divadlo), не бінокль, а «далекоглед» (dalekohled), не домкрат, а «звєдак» (zvedák), не ліфт, а «витаг» (výtah). Однак глобалізація в поєднанні зі зростанням ролі англійської мови як засобу міжнародного спілкування змушує й чеських науковців сходити з консервативних позицій [16].

Отже, ще на етапі створення нової технології, обговорення відкриття чи нового абстрактного поняття, керуючись чинними нормами термінотворення та нормами мови, треба формувати стратегії для створення українського еквівалента, а не говорити про неспроможність української мови забезпечити ефективне спілкування у царині науки та техніки. Саме термінологічні стандарти є ефективним інструментом розробляння та перекладання фахових текстів [2].

Розгляньмо два терміни, які застосовують при описі процедур опрацювання природномовної інформації: парсінг та стемінг.

Під час аналізу керуватимемось положеннями ДСТУ 3966-2009 [4], дотримання яких покликане полегшувати розуміння науково-технічних текстів, оптимізувати процес гармонізації й удосконалювання української науково-технічної термінології та дає змогу творити українську термінологію, що відповідатиме нормам сучасної української літературної мови.

Вищевказані терміни все надійніше входять у науковий вжиток, правда у авторів склалося враження, що ці терміни, незважаючи на своє англійське походження, в українську термінологію увійшли традиційним для останніх десятиліть шляхом – адаптацією російського варіанту, хоча, як показує практика (достатньо проаналізувати російську термінологію комп’ютерної галузі), термінотворення у Росії, м’яко кажучи, залишає бажати кращого. Та й шлях запозичення термінів через мову-посередника – хибний [3]. Показовим є і той факт, що біля цих термінів зазвичай поряд подають англійський оригінал. Автори ніби уточнюють терміни:

●  парсінг (parsing) – синтаксичний аналіз тексту, який автоматично проводиться за спеціальною програмою (парсером);

●  стемінг (stemming) – процес визначення основи слова» [11].

Чи в такому разі йдеться про повноцінний термін з усіма характерними ознаками як от належність до певної термінологічної системи, наявність визначення, однозначність у межах однієї терміносистеми, точність, стилістична нейтральність, відсутність синонімів та омонімів у межах однієї терміносистеми, відсутність експресивності, образності, суб’єктивно-оцінних відтінків?

Відповідно до ДСТУ 3966-2009 [4] в частині загальних (міжнародних) вимог до термінів і визначень понять треба чітко розрізняти фундаментальні поняття – предмету, процесу, властивості та засоби позначання понять процесу й наслідку процесу.

Добираючи терміни для укладання документації, треба віддавати перевагу термінам українського походження перед запозиченими. Якщо запозичення вважається доцільним, іншомовні терміни треба адаптувати до законів української мови. Зокрема, запозичаючи назву процесу, треба, насамперед, від іншомовного слова утворити українське дієслово недоконаного виду, а далі – усі необхідні похідні слова, наприклад так, як відбулося з похідними від запозиченого слова форма: процес – формуватиформуваннясформуватисформування; наслідок – формованняформація тощо. Не можна стандартувати іншомовні іменники на позначення дії, що закінчуються на -иія-інґ-мент та ін., які не даватимуть змоги розрізняти поняття дії і події і тим руйнуватимуть структуру української мови. При цьому такими іменниками можна позначати наслідки дії, об’єкти та суб’єкти, наприклад: процес – публікуваннясляб(інґ)уваннясортування; об’єкт – публікаціяслябслябінг [10].

У разі застосування адаптації форми запозиченого слова до норм української мови для поданих вище термінів одержуємо парс(инг)ування та стем(інг)ування, а відповідні дієслова мали б форми парсувати та стемувати. Цей шлях має очевидні недоліки, оскільки навіть у адаптованій формі ці відповідники є запозиченнями.

Для того, щоб запропонувати власне українські еквіваленти до обговорюваних англійських термінів, спочатку треба проаналізувати семантичну структуру цих термінів англійською мовою та виділити основні семантичні ознаки.

Словник Merriam-Webster подає такі значення дієслова toparse [18]:

Перехідне дієслово:

1 a) to resolve (as a sentence) into component parts of speech and describe them grammatically; b) to describe grammatically by stating the part of speech and explaining the inflection and syntactical relationships.

2 to examine in a minute way; analyze critically.

Неперехідне дієслово:

1 to give a grammatical description of a word or a group of words.

2 to admit of being parsed.

Ключовим для нас буде значення 1а), передане англійськими дієсловами resolve (розкладати (на складові частини); розпадатися, розкладатися (на складові частини) та describe (описувати, характеризувати). Значення 1b) відповідає українському розбирати (слово).

Подібне визначення подає Оксфордський електронний словник [19] –to resolve (a sentence) into its component parts and describe their syntacticroles та Webopedia [21] –to divide language into small components that can be analyzed.

Для зіставлення розглянемо визначення, пропоноване електронним словником та енциклопедичним ресурсом Farlex [20]:

Перехідне дієслово:

1. to break (a sentence) down into its component parts of speech with an explanation of the form, function, and syntactical relationship of each part.

2. to describe (a word) by stating its part of speech, form, and syntactical relationships in a sentence.

3. a. to examine closely or subject to detailed analysis, especially by breaking up into components. b. to make sense of; comprehend. 4. to analyze or separate (input, for example) into more easily processed components.

Неперехідне дієслово:

to admit of being parsed.

Тут ключовим буде значення break (розбивати на менші частини) та explain (пояснювати).

Таким чином, мова йде про процес, визначення якого англійською мовою дається за допомогою таких дієслів як розкладатирозбивати на відповідні складові та описуватипояснюватихарактеризувати, тобто, іншими словами, розбирати.

Тепер проаналізуємо значення слова розбирати, запропоноване Словником української мови [14]. Значенню слова parse відповідають значення 2 (розкладати що-небудь на складові частини, деталі…) та значення 4 (піддавати аналізові що-небудь…).

З іншого боку, parsing подають як синтаксичний аналіз – словосполучення, що складається із запозичень. Отже, розглянемо можливі синоніми до слова аналізувати, зокрема варіанти, пропоновані Словником синонімів української мови [13]:

АНАЛІЗУВАТИ (розчленовувати ціле на складові частини, піддавати критичній оцінці …), РОЗГЛЯДАТИ, РОЗБИРАТИ… [13].

Цікаво, що серед результатів пошуку в електронному тлумачному словнику української мови E-slovnik для слова розбір читаємо «у програмуванні – синтаксичний аналіз оператора (речення) формальної мови» [15].

Таким чином, з огляду на вищеподану інформацію, пропонуємо вживати розбір як український відповідник терміна parsingрозбирати/здійснювати розбір замість проводити парсингрозбирач замість парсера і як альтернативу до синтаксичного аналізатора. Враховуючи відсутність семантичних зв’язків між значеннями термінів, тотожних за планом вираження з переліченими, говоримо про їх омонімію. Отже, запропоновані терміни треба вводити до словників як окремі словникові статті.

Запропоноване похідне слово розбір є результатом розщеплення багатозначного слова, тобто утворене лексико-семантичним шляхом. Словотвірне значення таких похідних слів виражається в контексті через співвідношення омонімії. Лексико-семантичний спосіб переважно застосовують для утворення іменників.

Тепер проаналізуємо англійський відповідник на позначення процесу зведення слів до основи stemming. Український еквівалент стемінг не входить до офіційних словників лінгвістичної термінології, однак ним широко послуговуються в процесі викладення матеріалів з обробки природних мов.

Ресурс Вікіпедія подає визначення стемінгу українською мовою як «процесу скорочення слова до основи шляхом відкидання допоміжних частин, таких як закінчення чи суфікс», вказуючи англійський відповідник у дужках і позначаючи версію подання матеріалу як «неперевірену» (http://uk.wikipedia.org). У [11] читаємо: «стемінг (stemming) – процес визначення основи слова».

За визначенням Словника лінгвістичних термінів: основа – це частина слова, яка є носієм його лексичного значення і залишається в слові після відокремлення закінчення і формотворчого суфікса: вод-а, підводн-ий [1].

Таким чином, результатом процесу, що позначається англійським словом stemming, є основа слова. Спробуємо застосувати афіксальний спосіб для створення власне українського еквівалента до слова stemming. Можливим ланцюжком словотвору є іменник → дієслово → іменник. Дієслова від іменників утворюються шляхом додавання суфіксів -ат- (-ят-), -ит-, -уват- (-юват-)відміна → відмінюватиробітник → робітникуватифільм → фільмувати, і на сьогоднішній день така модель словотвору є продуктивною. Відкидаючи від слова основа закінчення -а (твірна основа основ-) і додаючи словотворчий формант -уват-, одержимо основувáти у значенні виділяти основу слова як український відповідник до англійського дієслова tostem.

Наступним кроком буде утворення іменника на позначення процесу виділення основ слів від дієслова основувáти. Для утворення іменників від дієслів із голосним основи а (я) використаємо формант -анн(я) [-нн(я)] і одержимо основувáння.

Підводячи підсумки, скажемо: для створення українських еквівалентів термінів parsing – розбір та stemming – основува́ння, ми застосували морфологічні та неморфологічні способи словотвору. Відповідник розбір виник у результаті розщеплення значення вже існуючого слова й утворення омоніма, а його похідні стали результатом застосування суфіксального способу словотвору. Для створення українського еквівалента до дієслова tostem та його похідних застосували афіксальний словотвірний ланцюжок іменник → дієслово → іменник із твірною основою основ-.

1. Ганич Д. І. Словник лінгвістичних термінів / Д. І. Ганич, І. С. Олійник. – К. : Вища шк., 1985. – 360 с. 2. Гінзбург М. Термінологічні стандарти як дієвий інструмент поліпшення якості фахових текстів / М. Д. Гінзбург // Сборник научных трудов по лексикографии «Слово и словарь = Vocabulum et vocabularium», 2011. – С. 136–140. 3. Д’яков А. С. Основи термінотворення: Семант. та соціолінґвіст. аспекти / Д’яков А. С., Кияк Т. Р., Куделько З. Б. – К. : Вид. дім «KM Academia», 2000. – 218 с. 4. ДСТУ 3966-2009. Термінологічна робота. Засади і правила розроблення стандартів на терміни і визначення понять. – К. : Держстандарт України, 2009. – 36 с. 5. Іващенко В. Л. Історіографія термінознавства: метамова і структурні підрозділи / В. Л. Іващенко // Термінологічний вісник : зб. наук. праць / Відп. ред. В. Л. Іващенко. – К. : Інститут української мови НАНУ, 2013. – Вип. 2 (1). – С. 5–21. 6. Іващишин О. Проблема доцільності використання запозичень та інтернаціоналізмів у науково-технічній термінології / О. Іващишин // Проблеми української науково-технічної термінології : тези I Міжнарод. наук. конф. – Л., 1992. – С. 114–116. 7. Козловець І. Роль запозичень у формуванні української фінансово-кредитної системи / І. Козловець // Лінгвістичні студії: зб. наук. праць. – Д., 2003. – Вип. II. – С. 467. 8. Кульчицька Т. Українська лексикографія XIII–XX століття, бібліографічний покажчик / Кульчицький Т. – Л. : Львівська наукова бібліотека ім. В. Стефаника, 1999. – 359 с. 9. Кульчицький Ігор Проблемні аспекти локалізації окремих термінів з інформатики / Ігор Кульчицький, Богдан Філь // Вісник Нац. ун-ту «Львівська політехніка». Серія «Проблеми української термінології» – 2012. – № 733. – С. 196–200. 10. Про затвердження Рекомендацій щодо вживання термінів та визначень з безпеки руху поїздів. Наказ № 464 від 03.06.2004. Міністерство транспорту України [Електронний ресурс]. – Режим доступу : http://ukraine.uapravo.net/data/akt748/ page1.htm. 11. Рамський Ю. С., Рєзіна О. В. Формування інформаційно-пошукових та дослідницьких умінь майбутніх учителів інформатики та математики [Електронний ресурс]. – Режим доступу : http://www.ii.npu.edu.ua/2009-11-27-11-40-37/103-19/909-2009-11-27-12-10.... 12. Рицар Б. Технічному комітетові стандартизації науково-технічної термінології – 20 років: діяльність у фактах та цифрах / Богдан Рицар, Роман Мисак, Ольга Мацейовська // Вісник Нац. ун-ту «Львівська політехніка». Серія «Проблеми української термінології» – 2012. – № 733. – С. 239–254. 13. Словник синонімів української мови : в 2-х т. / А. А. Бурячок, Г. М. Гнатюк, С. І. Головащук та ін. – К. : Наук. думка, 2001. – т. 1, с. 6. 14. Словник української мови, тт. 1–11. – К. : Наук. думка, 1970–1980.– Т. 8, 1977. – С. 606. 15. Тлумачний словник української мови E-slovnik [Електронний ресурс]. – Режим доступу : http://eslovnik.com. 16. Шатилов М. Даєш англіцизмам доби Інтернету статус літературної лексики! Приклад Чехії / М. Шатилов [Електронний ресурс]. Режим доступу: http://www.dw.de/ даєш-англі-цизмам-доби-інтернету-статус-літературної-лексики-приклад-чехії/a-15296387?maca=ukr-rss-MetaUA-ukr-Otdyh_Kultura-3052-xml-mrss. 17. Широков В. А. Корпусна лінгвістика / В. А. Широков, О. В. Бугаков, Т. О. Грязнухіна та ін. – К. : Довіра, 2005. – 471 с. 18. Merriam-Webster Online: Dictionaryand Thesaurus [Електронний ресурс]. – Режим доступу : http://www.merriam-webster.com/ [Merriam-Webster]. 19. Oxford Dictionaries. Languagematters [Електронний ресурс]. – Режим доступу : http://www.oxforddictionaries.com [OxfordDictionaries]. 20. The Free Dictionary: Dictionary, Encyclopedia and Thesaurus [Електронний ресурс]. – Режим доступу : http://www.thefreedictionary.com/ parsing [Farlex]. 21. Webopedia: Online TechDictionary for IT Professionals [Електронний ресурс]. – Режим доступу : http://www.webopedia. com/TERM/P/parse.html.

Кульчицький І. Проблемні аспекти локалізації окремих термінів з прикладної лінгвістики / Ігор Кульчицький, Маріанна Маляр, Богдан Філь // Вісник Нац. ун-ту «Львівська політехніка». Серія «Проблеми української термінології». – 2014. – № 791. – С. 122–126.