Проаналізовано загальну архітектуру системи соціалізації груп користувачів за подібними інтересами та функціональні вимоги до неї. Для опрацювання великої частини інформації систему реалізовано із використанням методів нечіткого пошуку текстової інформації та машинного навчання. Зокрема, застосовано алгоритми N-грам, розширення вибірки та структурованої моделі Noisy Channel. Особливістю інтелектуальної системи є опрацювання тексту, аналіз слів у тексті та формування оцінок. Реалізація згорткової нейронної мережі призначена для визначення справжності користувачів на основі аналізу фотографій із обличчям. Використання алгоритмів нечіткого пошуку дає змогу виконувати опрацювання текстових даних різних обсягів для аналізу інформації про кожного користувача, формування певного рейтингу користувача, порівняння цього користувача з іншими користувачами для спрощення подальшої соціалізації користувачів, інтереси яких збігаються найбільше. Під час експериментальної апробації порівняно точність функціонування розробленої інтелектуальної системи через визначення відсотка подібності поточних користувачів за допомогою алгоритмів N-грам та їх поєднання. Одночасне виконання цих алгоритмів є приблизно на 15 % ефективнішим і точнішим від алгоритму N-грам і на 10 % від інших відомих алгоритмів. Проаналізовано також роботу алгоритму лінійного пошуку тегів у словнику та алгоритму Noisy Channel із використанням BK-дерева. Завдяки цьому вдалося досягти значної переваги в роботі алгоритму, оскільки замість лінійної залежності часу пошуку отримано логарифмічну залежність. Також порівняно роботу синхронних та асинхронних методів системи. На початку роботи відмінність не дуже відчутна, але у міру зростання кількості запитів система навантажується і відмінності стають відчутнішими.
