У цій статті аналізуються три найпоширеніші підходи до реалізації архітектури ГНМ у хмарних сервісах AWS для оцінки ризиків у сфері страхування. Стаття поділена на кілька розділів, перший з яких містить огляд 3 підходів до архітектури ГНМ, другий описує передумови для впровадження, і, нарешті, впровадження та порівняння всіх підходів для вибору найкращого.
У першому розділі представлено три архітектурні підходи до впровадження ГНМ, а саме: Графові Мережі Згортки (ГМЗ), Графові Мережі Уваги (ГМУ) і GraphSAGE (Графові збір та агрегація). Архітектури описані з акцентом на математичні формулювання. На завершення розділу вирішено продовжити подальше впровадження всіх трьох моделей в інфраструктуру AWS і проаналізувати результати на тих самих графових даних, щоб вибрати найкращий варіант для оцінки ризику для страхової компанії.
Далі стаття продовжує вибір інструментів і підготовку даних для їх подальшого використання в цілях навчання та тестування ГНМ. Після аналізу варіантів використання вирішено зосередитися лише на страхуванні фізичних осіб. Основна мета полягає в аналізі унікальних властивостей кожної людини, які можуть впливати на ризик її страхування, а також на її зв’язки з іншими особами. Основними інструментами для використання є NeptuneDB для зберігання графів і Sagemaker для розгортання та навчання моделі. Стаття також зосереджена на виборі відповідного інструменту для реалізації, порівнюючи два найбільш використовувані фреймворки Python PyTorch PyG і Deep Graph Library (DGL), при цьому пріоритет надається
PyG.
Далі описано процес впровадження всіх трьох підходів, спочатку ГМЗ, потім ГМУ і, нарешті, GraphSage. Потім моделі піддаються навчанню та тестуваннюз подальшим аналізом вихідних даних. З огляду на результати аналізу, ГМУ і GraphSage забезпечують найбільш точні результати, зберігаючи точність під час тестування. Однак, враховуючи статистичні дані обох моделей, виявлено, що GraphSage має більшу різницю між ймовірностями ризиків та додаткові відомості завдяки аналізу важливості особливостей даних, що робить його найкращим для сценарію використання оцінки ризику.
На завершення статті зазначено, що з усіх трьох проаналізованих архітектур найбільш придатною для завдання оцінки ризику є GraphSAGE з невеликою перевагою цієї моделі над ГМУ, відповідно її вирішено використати для подальшого аналізу та вдосконалення. Крім того, у статті згадується кілька кроків для потенційного майбутнього вдосконалення моделей, а також зосереджено увагу на тестуванні та навчанні на більшому наборі даних, щоб зробити його більш застосовним для реальних програм.
- Санчез-Ленделінг, та ін. (2021), Лагідний вступ до графових нейронних мереж, Distill. DOI: https://doi.org/10.23915/distill.00033
- Узаір, A. Б., Танг, H., Ґуілу, В., Мар’ян, С., Хуссейн, A. (2023). Глибоке навчання з графовими згортковими мережами: Огляд та останні застосування в обчислювальному інтелекті. Міжнародний журнал інтелектуальних систем. DOI: https://doi.org/10.1155/2023/8342104
- Кіпф, T. Н., Welling, M. (2016) Напівконтрольована класифікація з графовими згортковими мережами. arXiv препринт: arXiv:1609.02907 DOI: https://doi.org/10.48550/arXiv.1609.02907.
- Велічковіч, П., Кукурулл, Ґ., Казанова, A., Ромеро, A., Ліо, П., Бенґіо, Й. (2017) Графові мережі уваги. arXiv препринт arXiv:1710.10903v3. DOI: https://doi.org/10.48550/arXiv.1710.10903.
- Тотаро, С., Хуссейн, A., Скардапане, С. (2020). Непараметричний софтмакс для покращення нейронової уваги при прогнозуванні часових рядів. Нейрокомп’ютинг, 381, 177–185. DOI: https://doi.org/10.1016/j.neucom.2019.10.084
- Зенґ, Х., Жан, М., Чіа, Й., Срівастава, А., Малевіч, A., Каннан, Р., Прасанна, В., Джін, Л., Чен, Р. (2022). Відокремлення глибини та оцінки графових нейронних мереж. arXiv препринт arXiv: 2201.07858v1. DOI: http://arxiv.org/abs/2201.07858v1
- Лю, T., Чен, Й., Лі, Д., Ву, К., Жу, Й., Хі, Й., Пен, Й., Чен, Х., Ґуо, Ж. (2021). BGL: GPU-ефективне навчання GNN шляхом оптимізації введення-виведення та попередньої обробки графових даних. arXiv препринт arXiv: 2112.08541. DOI: https://doi.org/10.48550/arXiv.2112.08541
- Тіан, Й. (2022). Світ графових баз даних з точки зору індустрії. arXiv препринт: arXiv :2211.13170.DOI: https://doi.org/10.48550/arXiv.2211.13170
- Ван, З., Йоанідіс, В. (2022). Як AWS використовує графові нейронні мережі для задоволення потреб клієнта. Amazon Science. https://www.amazon.science/blog/how-aws-uses-graph-neural-networks-to-meet- customer-needs
- Жан, З. (2018). Вдосконалений Оптимізатор АДАМ для глибоких нейронних мереж. 2018 IEEE/ACM 26-ий Міжнародний Симпозіум по якості послуг (IWQoS). DOI: 10.1109/IWQoS.2018.8624183.
- Кордоньєр, Х., Лукас, A., Джаґґі, М. (2021). Увага до багатьох вершин: співпраця замість об’єднання. arXiv препринт arXiv:2006.16362. DOI: https://doi.org/10.48550/arXiv.2006.16362
- Шу, Д., Руан, К., Корпеоґлу, E., Кумар, С., Ашан, K. (2020). Навчання індуктивного представлення на часових графах. arXiv препринт arXiv:2002.07962. DOI: https://doi.org/10.48550/arXiv.2002.07962