Кыргызский стартап представил AI-модель синтеза речи на выставке CES 2026

Виктор Сизов Экономика
VK X OK WhatsApp Telegram


Основным продуктом, представленным на выставке, стала KaniTTS — open-source модель синтеза речи. Авторы технологии утверждают, что она способна генерировать речь в реальном времени в три раза быстрее и в десять раз дешевле, чем аналогичные решения от таких гигантов, как ElevenLabs, OpenAI и Google. Модель доступна для использования под лицензией Apache 2.0, что делает ее бесплатной для разработчиков.

KaniTTS обладает впечатляющими техническими характеристиками: она может создавать 15 секунд аудиозаписи всего за одну секунду, используя стандартную видеокарту NVIDIA RTX 5080. Это позволяет интегрировать технологию без необходимости в дорогих облачных решениях. Модель была загружена более 15 тысяч раз на платформе Hugging Face и поддерживает восемь языков, включая кыргызский, английский, немецкий и китайский.

Вторым представленным продуктом стала модель Kyrgyz Whisper, предназначенная для автоматического распознавания речи. Она была дообучена на базе решения OpenAI и использует данные из 2000 часов кыргызской речи, что позволило снизить уровень ошибок распознавания с почти 100% до 0.2%. Это значительно улучшает поддержку языков, которые недостаточно представлены на международной арене.

Участие NineNineSix в выставке было организовано Парком высоких технологий КР. По информации ПВТ, IT-сектор Кыргызстана демонстрирует значительные успехи: за последние пять лет экспорт услуг увеличился в 45 раз. В 2024 году местные специалисты заработали $130 млн на внешних рынках, причем 40% из этого объема (свыше $50 млн) пришлись на США.
VK X OK WhatsApp Telegram

Читайте также: