Вы можете отправить нам 1,5% своих польских налогов
Беларусы на войне
  1. Американцы выложили в сеть похищенный нацистами советский архив Смоленской области. В нем есть много интересного по беларусской истории
  2. После жалоб преподавателя руководство БГУИР опубликовало данные по зарплате в учебном заведении
  3. На четверг объявили оранжевый уровень опасности
  4. Назван самый привлекательный город для туризма в Беларуси — и это не областной центр или Минск
  5. Трех беларусов будут судить за измену государству
  6. Бывшая политзаключенная Наталья Левая, которую освободили из колонии на последних месяцах беременности, родила ребенка
  7. В районе минского мотовелозавода снесут «малоценную застройку», жильцы уже отселены. Что там построят
  8. Этого классика беларусской литературы расстреляли в 45 лет, но он успел сделать столько, сколько удалось немногим. Вот о ком речь
  9. «Как бы они на меня сегодня ни обиделись». Лукашенко потребовал ужесточать подготовку водителей
  10. Ввели валютное ограничение для населения
  11. «Бюро»: Дмитрий Басков расширяет бизнес — подробности
Чытаць па-беларуску


/

Беларусы запускаюць праект Sonora — гэта ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы, які стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дапаможа ствараць аўдыякнігі, рабіць агучку для дадаткаў і не толькі. Расказваем.

Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 
Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 

Падтрымаць праект можна па спасылцы.

Сёння беларуская мова амаль не прадстаўлена ў свеце галасавых і AI-тэхналогій, адзначаюць стваральнікі праекта. А без якасных дадзеных яе развіццё ў гэтым кірунку застаецца абмежаваным.

Вырашыць гэтую праблему і збіраецца Sonora — ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы. Датасэт — гэта набор студыйных аўдыязапісаў, на якіх будуць навучацца мадэлі сінтэзу маўлення. Менавіта ён вызначае, як будзе гучаць мова: ці будзе яна натуральнай і жывой, або механічнай і «робатнай».

Плануецца, што такая база стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дазволіць з’явіцца натуральнаму гучанню беларускай мовы ў сучасных тэхналогіях: дадатках, аўдыякнігах, адукацыі і AI-прадуктах.

Каманда плануе падрыхтаваць тэксты разам з лінгвістамі, якія потым агучаць прафесійныя дыктары. Потым дадзеныя апрацуюць і падрыхтуюць для далейшага выкарыстання.

На такі праект трэба 13 тысяч еўра, разлічваюць у камандзе. Каб сабраць гэтую суму, яны адкрылі збор — падтрымаць яго можна па спасылцы.