Казахстанский стартап Cybernet AI презентовал одну из самых крупных моделей автоматического распознавания речи, ориентированную на тюркские языки. О разработке сообщил портал Astana Hub. Новая ASR-модель создана с прицелом на реальное использование в бизнесе и госсекторе, где важны точность и стабильная работа с живой речью. Разработчики подчёркивают, что система изначально проектировалась под языковую специфику региона. Это должно заметно повысить качество голосовых сервисов в Центральной Азии. Про это сообщает редакция mes.kg.
Модель корректно распознаёт казахский, турецкий, узбекский, кыргызский, азербайджанский и татарский языки. Отдельное внимание уделено смешанной тюркско-русской речи, которая широко используется в повседневном общении. Такой подход позволяет системе уверенно работать в реальных условиях, а не только на «чистых» записях. Это особенно важно для кол-центров, госуслуг и сервисов с голосовым вводом. По словам разработчиков, качество распознавания заметно выше по сравнению с универсальными решениями.
Почему это важно для региона
До сих пор в странах Центральной Азии в основном использовались международные ASR-модели, ориентированные прежде всего на английский язык. Из-за этого точность распознавания тюркской речи часто страдала. Причина — особенности фонетики, интонаций и произношения, которые такие системы учитывают слабо. Новая модель Cybernet AI была обучена с нуля именно на живой разговорной речи. В результате она лучше справляется с реальными диалогами.
Среди ключевых особенностей разработки:
- устойчивость к фоновому шуму;
- корректная работа с разными акцентами и манерой речи;
- распознавание переключения языков в пределах одного высказывания;
- адаптация под повседневную разговорную речь, а не дикторское чтение.
Разработчики считают, что это открывает новые возможности для цифровых сервисов в регионе.
Кто поддержал проект
Проект был реализован с использованием GPU-инфраструктуры Microsoft. Стратегическую поддержку стартапу оказали Astana Hub и Министерство цифрового развития, инноваций и аэрокосмической промышленности Казахстана. Такое партнёрство позволило ускорить разработку и масштабировать модель. В перспективе решение может быть внедрено в государственные цифровые сервисы и корпоративные продукты. Стартап также рассматривает возможность дальнейшего расширения языковой линейки.
Напомним, мы также писали о том, что теперь будет реклама в ChatGPT.
