Беларуская Служба

Навукоўцы з Інстытута мовазнаўства Я. Коласа стварылі сінтэзатар беларускага маўлення

12.07.2023 08:01
У цяперашняй тэставай версіі максімальны памер тэксту для агучвання абмежаваны 2000 знакаў.
Камп'ютарEngin_Akyurt /pixabay.com/CC0 Public Domain

На сайце праекта «Беларускі N-корпус», дзе над стварэннем Нацыянальнага корпуса беларускай мовы працуе сектар камп'ютарнай лінгвістыкі Інстытута мовазнаўства імя Якуба Коласа НАН Беларусі, з’явіўся першы сінтэзатар беларускага маўлення. Новая магчымасць пашырыць гарызонты распаўсюджвання беларускай мовы, канстатуе «Наша Ніва».

Спецыялісты адзначаюць, што даўно шукалі магчымасць стварыць сінтэзатар і цяпер свае першыя вынікі ў гэтым кірунку зрабілі даступнымі для ўсіх у раздзеле «Фанетычны канвертар і сінтэз маўлення» на сайце «Беларускага Н-корпуса».

Сінтэзатар зроблены па слядах беларускамоўнай мадэлі для агучвання тэксту «Беларускі тэкст-у-маўленне» і выкарыстоўвае тыя самыя запісы для навучання, якія былі сабраныя праектам donar.by.

На сайце праекта donar.by можна як запісаць («ахвяраваць») свой голас, так і праверыць ужо зробленыя запісы. Ухваленыя запісы трапляюць у набор даных Common Voice, які распаўсюджваецца пад свабоднай ліцэнзіяй і закліканы дапамагаць распрацоўшчыкам ствараць прылады для распазнавання маўлення. Менавіта гэтай магчымасцю і скарысталіся навукоўцы з Акадэміі навук.

Цяпер на сайце «Беларускага Н-корпуса» можна зрабіць фанетычную транскрыпцыю любога беларускага тэксту паводле правілаў Міжнароднага фанетычнага алфавіта (ІПА), або так званай «школьнай транскрыпцыі», якая шырока распаўсюджана ў айчынным мовазнаўстве. Для большасці слоў канвертар здольны самастойна падабраць і паставіць націскі для карэктнай сінтэзацыі маўлення, для больш рэдкіх словаў, напрыклад, уласных назваў, ёсць магчымасць паставіць націск самастойна. У цяперашняй тэставай версіі максімальны памер тэксту для агучвання абмежаваны 2000 знакаў.

аз

Больш на гэтую тэму: Агляд падзей культуры