Багатошарові нейронні мережі – як детерміновані системи

1
Львівський національний університет імені Івана Франка
2
Інститут технічного машинобудування Державної вищої школи технологій та економіки в Ярославі
3
Львівський національний університет імені Івана Франка
4
Львівський національний університет імені Івана Франка
5
Львівський національний університет імені Івана Франка
6
Українська академія друкарства
7
Львівський національний університет імені Івана Франка
8
Львівський національний університет імені Івана Франка

В роботі проведено дослідження впливу швидкості навчання (η) на процес навчання багатошарової нейронної мережі. Програма для багатошарової нейронної мережі була написана на мові Python. Швидкість навчання розглядалась як постійна величина і визначалась її оптимальна величина при якій досягалось найкраще навчання. Для аналізу впливу швидкості навчання використовувалась логістична функція, яка описує процес навчання. Показано, що функція похибки навчання характеризується біфуркаційними процесами, які приводять до хаотичного стану при η>0,8. Визначено оптимальне значення швидкості навчання, яке визначає появу процесу подвоєння кількості локальних мінімумів, і становить для трьох шарової нейронної мережі з 4 нейронами в кожному шарі η=0,62. Збільшення кількості прихованих шарів (3÷30), та кількості нейронів в кожному шарі (4÷150) не приводить до кардинальної зміни діаграми логістичної функції (xn,η), а отже і оптимальної величини швидкості навчання.

 

  1. O. Rudenko and E. Bodianskyy, Artificial neural networks. Kharkiv, Ukraine: SMIT Company, 2006. (Ukrainian)
  2. S. Subotin, Neural networks: theory and practice Zhytomyr, Ukraine: Publisher О. О. Evenok, 2020. (Ukrainian)
  3.  V. Kruglov and V. Borisov Artificial neural networks. Theory and practice. Moscow, Russia: Hotline - Telecom, 2001. (Russian)
  4.  S. Subotin and A. Olijnyk Neural networks: tutorial Zaporizhzhia, Ukraine: ZNTU, 2014. (Ukrainian)
  5.  Yurij Olenych, Sergiy Sveleba, Ivan Katerynchuk, Ivan Kunio, and Ivan Karpa, “Features of deep study neural network” https://openreviewhub.org/lea /paper-2019/features-deep-study-neural-network#
  6.  Yu Taranenko, “Information entropy of chaos”,  https:// habr.com/ru/post/447874/
  7.  A. Kuznetsov, Dynamical systems and bifurcations. Saratov, Russia:  LLC Publishing Center "Science", 2015. (Russian)