У статті досліджено інформаційні системи для роботи з текстовими корпусами, зокрема їх застосування для лінгвістичного аналізу та управління великими текстовими даними. Проана- лізовано інформаційні системи для підтримки текстових корпусів, проведено їх класифікацію та досліджено поступ функціональних можливостей. Основну увагу зосереджено на порівнянні двох найпоширеніших систем, котрі можна виділити за функціоналом як корпусні менеджери: «AntConc» і «Sketch Engine». Оцінено їх за ключовими критеріями: створення корпусів текстів, опрацювання текстів, розмітка, збереження та експорт, аналіз і візуалізація даних, інтуїтивність інтерфейсу, підтримка української мови, а також наявність відкритої ліцензії. Метою дослі- дження було провести порівняльний аналіз цих систем з використанням методу аналізу ієрархій для визначення їх сильних та слабких сторін у різних умовах використання. Виявлено, що «Sketch Engine» забезпечує розширені можливості для створення й управління великими кор- пусами, розмітки та візуалізації даних, що робить його кращим вибором для великих дослід- ницьких проєктів. Водночас «AntConc» є більш доступною та ефективною системою для індиві- дуальних або малих досліджень завдяки простоті, відсутності ліцензійних витрат і підтримці специфічних параметрів для аналізу текстів. Результати дослідження можуть бути корисними для корпусних та прикладних лінгвістів під час вибору систем для створення і роботи з текстовими корпусами. Висновки сприятимуть ухваленню рішень щодо вибору відповідних інструментів залежно від конкретних потреб дослідження, обсягу роботи та бюджетних обме- жень. Окрім того, результати дослідження можуть бути застосовані для вдосконалення існуючих та розробки нових інформаційних систем для забезпечення підтримки корпусів у подальших наукових проєктах авторів.
- Abdullayeva, O. (2020). Programs used to create the language corpus and their principles. ACADEMICIA: An International Multidisciplinary Research Journal. 10. 1778. https://doi.org/10.5958/2249- 7137.2020.00749.1.
- Anthony, L. (2013). A critical look at software tools in corpus linguistics. Linguistic Research. 30. 141– 161. https://doi.org/10.17250/khisli.30.2.201308.001.
- Anthony, L. (2023). AntConc (Version 4.2.4) [Computer Software]. Tokyo, Japan: Waseda University. Available from https://www.laurenceanthony.net/software.
- Anthony, L. (2023). Corpus AI: Integrating Large Language Models (LLMs) into a Corpus Analysis Toolkit. Presentation given at the 49th Annual Conference of the Japan Association for English Corpus Studies, Kansai University, Osaka, Japan. URL: https://osf.io/srtyd/.
- Baroni, M., Kilgarriff, A., Pomikálek, J., & Rychlý, P. (2006). WebBootCaT: a Web Tool for Instant Corpora. Proceedings of the 12th EURALEX International Congress. URL: https://www.researchgate.net/publication/ 242220785_WebBootCaT_a_web_tool_for_instant_corpora
- Bayón, Candelas. (2024). Specialized terminology, instrumental competence, and corpus management tools / Terminología especializada, competencia instrumental y herramientas de gestión de corpus. FITISPos International Journal. 11. 220-–238. https://doi.org/10.37536/FITISPos-IJ.2024.11.1.402.
- Chaplynskyi, D. (2023). Introducing UberText 2.0: A Corpus of Modern Ukrainian at Scale. Proceedings of the Second Ukrainian Natural Language Processing Workshop, 1–10, Dubrovnik. Association for Computational Linguistics. https://doi.org/10.18653/v1/2023.unlp-1.1
- Jusoh W. et al. (2024). Exploring corpus linguistics via computational tool analysis: key finding review. Indonesian Journal of Electrical Engineering and Computer Science. 34. 1052. http://doi.org/10.11591/ ijeecs.v34.i2.pp1052-1062.
- Капранов, Я. В. (2021). Корпусний менеджер AntConc та його можливості для визначення частоти ключових слів різних мов. Інженерія знань як фактор міжкультурної кооперації України з Японією, КНР і Республікою Корея: матеріали ІІ міжнародної науковопрактичної відеоконференції, 1-2 грудня 2021 року (с. 100-102). Видавничий центр КНЛУ. URL: http://rep.knlu.edu.ua/xmlui/bitstream/handle/787878787/2980/ Капранов%20Я.%20В.%20Корпусний%20менеджер%20AntConc%20та%20його%20можливості%20для%20ви значення%20частоти%20ключових%20слів%20різних%20мов.pdf.
- Khairas, Eri. (2019). Using Antconc Software As English Learning Media: The Students’ Perception.Epigram. 16. 189–194. http://dx.doi.org/10.32722/epi.v16i2.2234.
- Kocincová, Lucia & Jakubíček, Miloš & Kovář, Vojtěch & Baisa, Vít. (2015). Interactive Visualizations of Corpus Data in Sketch Engine. Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015. 17–22. URL: https://www.researchgate.net/publication/280566089_Interactive_Visualizations_ of_Corpus_Data_in_Sketch_Engine.
- Коциба Н. (2013). Лабораторія української. URL https://mova.institute/.
- Kovář, Vojtěch & Baisa, Vít & Jakubíček, Miloš. (2016). Sketch Engine for Bilingual Lexicography. International Journal of Lexicography. Volume 29, Issue 3, September 2016, Pages 339–352, https://doi.org/10.1093/ijl/ecw029.
- Козак І., Кунанець Н. (2024). Проблеми розроблення текстових корпусів засобами інформаційних систем і шляхи їх вирішення. Науковий вісник НЛТУ України, 34(2), 101-108. https://doi.org/10.36930/40340213
- Lexical Computing CZ s.r.o. (2023). SketchEngine [Computer Software]. Available from https://www.sketchengine.eu/.
- Mu, E., Pereyra-Rojas, M. (2017). Understanding the Analytic Hierarchy Process. In: Practical Decision Making. SpringerBriefs in Operations Research. Springer, Cham. https://doi.org/10.1007/978-3-319-33861-3_2.
- Шведова М., Валденфельс Р., Старко В. (2019). Генеральний регіонально анотований корпус української мови (ГРАК). URL: https://uacorpus.org/Kyiv/ua.