Розглянуто актуальну проблему кластеризації онтологій для оптимізації операцій
інтелектуального опрацювання даних в умовах невизначеності, зумовленої неточністю
або неповнотою даних про предметну область. Кластеризація онтологій – це процес
автоматичного розділення множини онтологій на групи (кластери) на основі ступеня
їхньої подібності. Для розв’язування задачі кластеризації необхідно задати міри
близькості онтологій, вибрати або розробити алгоритм кластеризації та виконати
змістовну інтерпретацію результатів кластеризації.
Для кластеризації онтологій в умовах невизначеності запропоновано застосувати
стохастичний ігровий метод. Повторювальна стохастична гра полягає у реалізації
керованого випадкового процесу вибору кластерів онтологій. Для цього закріплені за
онтологіями інтелектуальні агенти випадково, одночасно і незалежно вибирають один із
кластерів у дискретні моменти часу. Для агентів, що обрали один кластер, обчислюють
поточну міру подібності онтологій, яка може враховувати близькість концептів,
атрибутів та відношень між концептами. Цю міру використовують для адаптивного
перерахунку змішаних стратегій гравців. Збільшуються імовірності вибору тих
кластерів, поточний склад яких призвів до зростання міри подібності онтологій. У ході
повторювальної гри агенти сформують вектори змішаних стратегій, які забезпечать
максимізацію усереднених мір подібності розділених на кластери онтологій.
Для розв'язування задачі ігрової кластеризації онтологій розроблено адаптивний
марківський рекурентний метод на основі стохастичної апроксимації модифікованої
умови доповняльної нежорсткості, справедливої у точках рівноваги за Нешем.
Запропонований ігровий метод має фільтрувальні властивості щодо викидів у вхідних
даних і практично не залежить від закону розподілу випадкових завад.
Комп'ютерне моделювання підтвердило можливість застосування моделі
стохастичної гри для кластеризації онтологій із врахуванням факторів невизначеності.
Збіжність ігрового методу забезпечується дотриманням фундаментальних умов та
обмежень стохастичної оптимізації. Достовірність експериментальних досліджень
підтверджується повторюваністю отриманих результатів для різних послідовностей
випадкових величин.
Результати роботи доцільно використати для розв'язування задач інте-
лектуального аналізу даних, усунення дублювання інформації в базах знань, зменшення
невизначеності у межах кластера онтологій, виявлення новизни інформації, організації
високорівневої семантичної взаємодії між агентами під час розв’язування ними спільної
задачі.
1. Wooldridge, M. (2009). An Introduction to Multiagent Systems. United Kingdom: John Wiley & Sons.
2. Рогушина, Ю. В. (2018). Теоретичні засади застосування онтологій для систематизації ресурсів WEB. Проблеми програмування, 2–3, 197–203.
3. Hashemi, P., Khadivar, A., Shamizanjani, M. (2018). Developing a domain ontology for knowledge management technologies. Online Information Review, 42 (1), 28–44.
4. Довгий, С. О., Велічко, В. Ю., Глоба, Л. С. та ін. (2013). Комп’ютерні онтології та їх використання у навчальному процесі. Теорія і практика: Монографія. – К.: Інститут обдарованої дитини.
5. Буров, Є. В., Пасічник, В. В. (2015). Програмні системи на базі онтологічних моделей задач. Вісник Нац. ун-ту “Львівська політехніка”. Серія: “Інформаційні системи та мережі”, 829, 36–57.
6. Berko, A., Alieksieiev, V. (2018) A method to solve uncertainty problem for Big Data sources. Proceedings of the 2018 IEEE 2nd International Conference on Data Stream Mining and Processing (DSMP). Lviv, Ukraine, August 21–25, 32–37.
7. Mirkin, B.G. (2005). Clustering for Data Mining. A Data Recovery Approach. CRC Press.
8. Batet, M. (2011). Ontology-based semantic clustering. AI Communications, 24 (3), 291–292.
9. Зайченко, Ю. П., Гончар, М. А. (2007) Нечеткие методы кластерного анализа в задачах автоматической классификации в экономике. Вісник НТУ України “Київський політехнічний інститут”. Серія: “Інформатика, управління та обчислювальна техніка”, 47, 198–206.
10. Бодянский, Е. В., Колчигин, Б. В., Волкова, В. В., Плисс, И. П. (2013). Адаптивная нечеткая кластеризация данных на основе метода Густафсона-Кесселя. Управляющие системы и машины, 2, 40–46.
11. Литвин, В. В., Висоцька, В. А., Досин, Д. Г., Гірняк, М. Г. (2015). Розроблення методів та засобів побудови інтелектуальних систем опрацювання інформаційних ресурсів з використанням онтологічного підходу // Вісник Нац. ун-ту”Львівська політехніка”. Серія: “Інформаційні системи та мережі”, 832, 295–314.
12. Aleman, Y., Somodevilla, M. J. (2017). A proposal for domain ontological learning. Research in Computing Science, 133, 63-70.
13. Литвин, В. В. (2011). Інтелектуальні агенти пошуку релевантних прецедентів на основі адаптивних онтологій. Математичні машини і системи, 3, 66–72.
14. Овдій, О. М., Проскуріна, Г. Ю. (2004). Онтології у контексті інтеграції інформації: представлення, методи та інструменти побудови. Проблеми програмування, 2–3, 353–365.
15. Чистякова, И. С. (2014). Инженерия онтологий. Інженерія програмного забезпечення, 4 (20), 53–68.
16. Slimani, T. (2015). Ontology Development: A Comparing Study on Tools, Languages and Formalisms. Indian Journal of Science and Technology, 8 (24), 1–12.
17. Крюков, К. В., Панкова, Л. А., Пронина, В. А., Суховеров, В. С., Шипилина, Л. Б. (2010). Меры семантической близости в онтологии. Проблемы управления, 5, 2–14.
18. Neyman, A., Sorin, S. (2012). Stochastic Games and Applications. Springer Science & Business Media.
19. Назин, А. В., Позняк, А. С. (1986). Адаптивный выбор вариантов: Рекуррентные алгоритмы. Москва: Наука.
20. Petrosjan, L. A., Mazalov, V. V. (2007). Game Theory and Application. New York: Nova Science Publishers.
21. Neogy, S. K., Bapat, Ravindra B., Dubey, Dipti. (2018). Mathematical Programming and Game Theory. Springer.
22. Kushner, H., Yin, G. G. (2013). Stochastic Approximation and Recursive Algorithms and Applications. Springer Science & Business Media.