Ученые НУ разработали технологию автоматизированного распознавания казахской речи
Проект по автоматизированному распознаванию казахской речи запускает Институт умных систем и искусственного интеллекта Назарбаев Университета (ISSAI). С его помощью казахский язык можно будет активно внедрять в глобальное цифровое пространство.
Для реализации проекта, ученые собрали самую большую базу голосовых данных на казахском языке — 300 часов записанной речи двух тысяч человек.
Применение новой разработки открывает большие возможности — распознавание казахской речи виртуальными помощниками, использование во всевозможных программах и технологии “умного дома”.
Кроме того, этот проект даст большой толчок развитию инклюзии в Казахстане. Новая технология может применяться в голосовых и текстовых программах, широко использующихся людьми с особыми потребностями.
“Прежде, отсутствие достаточно большой базы данных было препятствием для применения казахского языка в цифровом мире, поэтому мы и инициировали этот проект. Сейчас мы готовы поделиться собранной базой данных казахской речи с открытым исходным кодом со всеми исследователям и цифровыми предпринимателям, чтобы максимизировать его положительное влияние на экономику и общество страны” ,– сказал профессор Атакан Варол, директор ISSAI NU.
К слову, запуск проекта был приурочен к первой годовщине создания Института умных систем и искусственного интеллекта Назарбаев Университета — 14 сентября ISSAI отметил свой первый день рождения.
Здесь можно получить доступ к собранной базе данных, а также протестировать технологию распознавания казахской речи.