розпізнавання мовлення

РОЗРОБКА ІНТЕРФЕЙСУ ОБРОБКИ МУЛЬТИМОДАЛЬНИХ ДАНИХ НА ОСНОВІ GOOGLE API

Сьогодні штучний інтелект - це повсякденна рутина, яка глибоко увійшла в наше життя. Однією з найпопулярніших технологій, що швидко розвивається, є розпізнавання мовлення, яке є невід'ємною частиною ширшої концепції обробки мультимодальних даних. Мультимодальні дані охоплюють голос, аудіо та текстові дані, що є багатогранним підходом до розуміння та обробки інформації. У цій статті представлено розробку інтерфейсу для роботи з мультимодальними даними з використанням технологій Google API.

Development of a Web Application for Taking Tests by Blind People

The main purpose of this article is to de- scribethe process of creating a web application designed specifically for blind individuals to take tests. The author discusses the challenges that visually impaired individuals face when taking tests and how the new web application addresses these challenges. The application has been devel- oped using web accessibility guidelines and includes features such as screen reader compatibility, speech recognition, keyboard navigation, and high-contrast options.

Інформаційна система перетворення звукового україномовного тексту в письмовий на основі методів NLP та машинного навчання

Розпізнавання мовлення передбачає різні моделі, методи та алгоритми аналізу та опрацювання записаного голосу користувача. Завдяки цьому люди можуть керувати різними системами, які підтримують один із видів розпізнавання мовлення. Система перетворення мовлення на текст є одним із видів розпізнавання мовлення, що використовує розмовні дані для подальшого їх опрацювання.