Кыргызстандык сүйлөм синтездөө модели Kani TTS 2 Hugging Face платформасында жогорку орунда болду

Арестова Татьяна Коом
VK X OK WhatsApp Telegram

Кыргызстандык IT-специалисттер жаңы иштеп чыгуусу менен эл аралык аренада кайрадан көңүл бурууда. Бул тууралуу Кыргызстандын Жогорку технологиялар паркы (ЖТП) тарабынан берилген маалыматтан маалым болду.

NineNineSix командасы Kani TTS2 деп аталган сүйлөө синтезинин жаңыртылган версиясын сунуштады, ал уже Hugging Face — дүйнөдөгү эң ири жасалма интеллект моделдери үчүн платформада эң мыкты TTS моделдеринин катарына кирип калды.

Kani TTS 2 командасынын мурдагы иштеп чыгууларынын уландысы болуп, олуттуу жакшыртууларды көрсөтөт: эми модель бир жолу иштетүүдө 40 секундга чейин үзгүлтүксүз сүйлөөнү жарата алат, бул биринчи версиянын жыйынтыгынан эки эсе көп.

ЖТПдан белгилешкендей, Кыргызстандагы ачык модельдин Hugging Face’те эң мыкты TTS моделдеринин үчтүгүнө кириши — бул уникалдуу жана маанилүү жетишкендик.

NineNineSix командасы тууралуу

NineNineSix — Кыргызстандагы жасалма интеллект тармагында иштеген жана тил технологиялары боюнча инновациялары менен белгилүү болгон иштеп чыгуучулар командасы.

Мурда алар Kani TTSтин биринчи версиясын сунушташкан, ошондой эле биринчи кыргыз тилинде сүйлөгөн жасалма интеллект, AkylAi, үн колонкасын иштеп чыгышкан.

Аз сандагы сүйлөөчүлөр үчүн үн

Жасалма интеллект тармагындагы ири компаниялар адатта англис жана башка кеңири таралган тилдерге көңүл буруп, аз ресурстуу тилдерди эске албай калышат. NineNineSix башка ыкманы тандашты.

Kani TTS 2 англис, испан жана кыргыз тилдерин колдойт, ал эми анын архитектурасы модельди ар кандай тилдерге, акценттерге жана диалекттерге ылайыкташтырууга мүмкүндүк берет.

Проекттин өзгөчөлүгү — алдын ала үйрөнүү үчүн толук коддун жарыялануусу, бул ар бир өлкөгө же изилдөө командасына Kani TTS 2 негизинде өзүнүн үн моделин түзүүгө мүмкүндүк берет.

«Kani TTS 2 — бул биздин биринчи версиябыздын эволюциясы: биз сүйлөө генерациясынын туруктуулугун жакшыртып, модельдин узун фрагменттер менен иштөө мүмкүнчүлүктөрүн кеңейттик. Биз ар кандай тилдерге жана акценттерге, анын ичинде чектелген өкүлчүлүгү бар тилдерге ылайыкташтырууга оңой болгон компакттуу жана ачык моделдерди түзүүгө умтулабыз. Биз Кыргызстанда дүйнөлүк деңгээлдеги технологияларды түзүү мүмкүн экенин көрсөтүүнү каалайбыз, ошондуктан биз модельдин салмактарын гана эмес, ошондой эле алдын ала үйрөнүү үчүн бардык кодду ачык кылдык, ар бир команда TTSти өз тилине үйрөтө алсын», — деп белгиледи Nineninesix.aiнын негиздөөчүсү Нурсултан Бакашов.

Kani TTS 2 төмөнкү негизги жакшыртууларды камтыйт:

* Бир өтүүдө 40 секундга чейин туруктуу сүйлөө генерациялоо мүмкүнчүлүгү;

* Zero-shot voice cloning технологиясын колдоо — кыска аудиофрагментке негизделген үн клонирлөө;

* Окутуу үчүн архитектура жана коддун толук ачык болушу;

* Hugging Face’те TTS моделдеринин үчтүгүнө кирүү.

ЖТПнын маалыматына ылайык, модель 400 миллион параметрди камтыйт жана болжол менен 10 000 сааттык сүйлөө маалыматтары боюнча алдын ала үйрөтүлгөн. Ал 3 ГБ видеопамяти бар GPUда иштей алат, бул аны жергиликтүү жана серверлерде колдонууга жеткиликтүү кылат.

«Kani TTS 2 — бул жөн гана дагы бир AI-модель эмес. Бул Кыргызстандык адистер дүйнөлүк деңгээлдеги технологияларды иштеп чыгуу жана глобалдык жасалма интеллект рыногунда атаандашуу мүмкүн экендигинин көрүнүктүү далили. NineNineSix Кыргызстанды жөн гана керектөөчү эмес, алдыңкы AI чечимдерин түзүүчү катары көрсөтүп жатат», - деп белгилешти ЖТПда.
VK X OK WhatsApp Telegram

Дагы окуңуз: