нейронні мережі

TIGER-DFT: Time-Domain Speech Separation Using Trainable Complex Encoder-Decoder Layers

This article presents a time-domain speech separation model TIGER-DFT based on a TIGER core for separation part with encoder-decoder layers that mimics a windowed Discrete Fourier transformation. Our proposed model has achieved a separation performance of 7.72 dB in SI-SDR and 9.65 dB in SI-SDRi for noise Libri2Mix dataset outperformed original TIGER model for 0.4 dB for both metrics.

Adaptive Optimization of Training Datasets for Neural Network Image Classification

This paper considers the problem of adaptive optimization of the training dataset for neural networks in image classification tasks. It has been shown that using the full training dataset is not the best solution. Different training samples have different value for the model. Some samples are representative, some are important for class boundaries, some preserve diversity, and some may be noisy or suspicious. A method for adaptive formation of the active training subset has been proposed. Unlike traditional methods, the proposed approach evaluates the role of each sample during training.

Розпізнавання облич на основі аналізу модальних даних та машинного навчання

У статті розглянуто методи та засоби розпізнавання облич у відеопотоці даних із використанням елементів машинного навчання. Системи розпізнавання облич широко застосовуються у відеоспостереженні, системах контролю доступу, біометричній ідентифікації та інтелектуальних інформаційних системах. Проаналізовано основні підходи до ідентифікації осіб на основі методів комп’ютерного зору, зокрема методу головних компонент (PCA), метод локальних бінарних шаблонів та методу лінійного дискримінантного аналізу (LDA, Fisherfaces). Описано принципи формування ознак облич та алгоритми їх класифікації.

Методи та засоби штучного інтелекту в системах протезування

У статті досліджено сучасні підходи до застосування моделей штучного інтелекту (ШІ) в системах протезування з позиції інформаційних технологій. Метою роботи є системний аналіз і порівняльна оцінка сучасних моделей ШІ, що використовуються в протезуванні, з акцентом на алгоритмічні підходи до керування, методи опрацювання біосигналів та інтеграцію інтелек-туальних рішень у протезні пристрої реального часу. Проаналізовано еволюцію методів керування протезами – від класичних детермінованих схем до адаптивних алгоритмів машинного навчання та глибоких нейронних мереж.

Динамічна маршрутизація безпілотних літальних апаратів: стан досліджень та перспективи

У статті представлено інтегрований фреймворк для динамічної маршрутизації безпілотних літальних апаратів, що функціонують у складних, невизначених і швидкозмінних середовищах. Після огляду класичних детермінованих, вибіркових, біоінспірованих, методів машинного навчання та гібридних підходів до планування траєкторій критично проаналізовано їхні обмеження щодо можливостей перепланування в режимі реального часу, енергоефективності та масштабованості до місії з використанням кількох безпілотних літальних апаратів.

Індексація баз даних з використанням алгоритмів глибинного навчання

Автоматизація індексації в базах даних є ключовим напрямом розвитку сучасних систем управління базами даних, що дозволяє підвищити швидкодію, масштабованість і релевантність пошуку в умовах великих обсягів інформації. У статті досліджено застосування алгоритмів глибинного навчання для побудови та оптимізації векторних індексів, здатних автоматично адаптуватися до змін структури даних і запитів. Проведено експериментальне порівняння традиційних методів індексації (B-Tree, GIN у PostgreSQL) з векторною індексацією, реалізованою на основі моделей Sentence-BERT у системах FAISS і Milvus.

ПРОГНОЗУВАННЯ ЕМОЦІЙНОГО СТАНУ ОСОБИ НА ОСНОВІ ТЕКСТОВИХ ДАНИХ ІЗ ВИКОРИСТАННЯМ МОДЕЛЕЙ BERT І PAD

Розглянуто прогнозування багатовимірного емоційного стану користувача за текстовими записами в умовах, коли наявні текстові підходи здебільшого зосереджені або на категоріальній класифікації емоцій, або на загальній тональності повідомлень, що обмежує інтерпретованість результату на рівні стійкіших афективних станів.

ПРОГРАМНА СИСТЕМА АВТОМАТИЧНОГО ДІАГНОСТУВАННЯ РАКУ МОЛОЧНОЇ ЗАЛОЗИ

Надзвичайно актуальна проблема діагностики раку молочної залози, що залишається однією із провідних причин смертності, потребує інноваційних підходів для підвищення точності та оперативності онкологічної діагностики.

Edge-Ready Speech Separation with SuDo-TasNet

This article presents a hybrid speech separation model designed for efficient deployment on edge devices, focusing on optimizing both performance and computational resources. This study proposes a novel hybrid architecture that combines the strengths of Conv-TasNet and SuDoRM- RF models, leveraging their fully-convolutional structures to achieve efficient separation with minimal resource usage. The proposed model has obtained a separation performance of 10.59 db in SI-SDRi for clean Libri2Mix dataset for only 1.17 M parameters with only 0.92 GMACs/s.

ОПТИМІЗАЦІЯ НАВЧАЛЬНОЇ ВИБІРКИ З ДОПОМОГОЮ ВИПАДКОВИХ ТОЧКОВИХ ПРОЦЕСІВ

В роботі розглядаються методи оптимізації навчальних вибірок для алгоритмів глибокого навчання із застосуванням випадкових точкових процесів, таких як Матерна першого і другого типу, Гіббсівський, Гауссівський та Пуассонівський процеси. Запропоновано підхід до скорочення навчальних даних без втрати їхньої інформативності, що дозволяє зменшити обчислювальні витрати та проблеми із перенавчання.