Конечно нешто и од мене. Веќе имаше еден пост околу синтезата на говор на македонски јазик, меѓутоа еве решив малку да „блогирам“ на оваа тема.
Меѓу системите за конверзија на текст во говор т.е. синтетизаторите на говор, значајно место заземаат системите кои синтетизираат говор со поврзување на претходно снимени сегменти на говор – конкатенативни синтетизатори. Ваквите системи се едноставни и не бараат детално познавање на фонемски транзиции и коартикулациони ефекти, како што е случај со другите видови на говорни синтетизатори кои се базираат на правила поставени од лингвисти. Во Македонија постојат обиди за развој на квалитетен конкатенативен синтетизатор, меѓутоа ваквите синтетизатори биле базирани на говорни бази од други словенски јазици, да не кажам српскиот, што доведува до неприродна интонација на синтетизираниот говор на македонски јазик.
Конкатенативните синтетизатори бараат поставување на озбилна задача во дефинирање и снимање на говор и негова обработка за добивање на погодни говорни сегменти.
Првиот синтетизатор на говор на македонски јазик од овој тип е веќе спомнатиот TTS-MK, како еден сегмент од мојата докторска дисертација која ја подготвувам на Факултетот за електротехнички и информациски технологии и овој софтвер е комплетно развиен под .NET.
Општата функционална градба на говорен синтетизатор за македонски јазик е составена од два главни модули:
- NLP (Natural Language Processing) модул кој како влез прима текст кој по извршената анализа на текстот и негова транскрипција во гласови, заедно со прозодичните елементи на излез дава симболичка информација за гласовите и прозодијата за соодветниот влезен текст
- DSP (Digital Signal Processing) модул кој на влез ја прима симболичката информација за гласовите и прозодијата од NLP модулот и по соодветно процесирање на излез дава синтетизиран говор
Веќе неколку месеци постои евалуациска форма преку која можеше да се придонесе до подобрување на самиот софтвер, а повеќето учесници во евалуацијата бараа и малку да се „поиграат“ со него. За таа цел, морам да потенцирам, ЕКСКЛУЗИВНО TTS-MK може да се тестира на http://chungur.mkdot.net (Фала на Дејан за поддршката).
Значи сајтот е во изработка, но TTS-MK може да се тестира. Морам да напоменам дека верзијата која таму се наоѓа е базирана на снимки во доста несоодветни услови, па оттаму доаѓа и шумот, меѓутоа се работи на новите снимки кои се надевам дека набрзо повторно ексклузивно ќе се најдат на овој сајт.
На сајтот (откако ќе се направи) е планирано и Ваше учество во развојот на TTS-MK преку Ваши коментари, но и преку ажурирање на библиотеките за NLP модулот.