Sinhala Text to Speech Demo

Following results were obtained by training a VITS model on 11.5 hours of data in Sinhala dataset v2.0 here for about 800 epochs on a RTX 3090 GPU. The training took about 24 hours.

The trained model is included in the releases section of this repository here

Example texts for the following voice synthesis come from the Buddha Jayanthi Tipiṭaka and Buddhist Books App

TODO: Currently even though there are two speakers in the dataset only the male voice was used for the training since when trained with both speakers' voices the synthesis quality was not good.

Buddhist Text

බුද්ධශ්‍රේෂ්ඨ තෙම අත්‍යන්තපරිශුද්ධ වූ යම් මාර්‍ගසමාධියක් වර්‍ණනා කළේ ද, බුද්ධාදීහු ආනන්තරික (අනතුරුව ම පල දෙන) සමාධිය යැ යී යමකට කියත් ද, ඒ සමාධිය හා සදෘශ (අන් සමාධි) යෙක් නැත. මේ කරුණින් ද ආර්‍ය්‍යමාර්‍ගධර්‍මය උතුම් රුවනෙකි. මේ සත්‍යබලයෙන් සෙත් වේවා.

අර්‍ත්‍ථ - ධර්‍ම - නිරුක්ති - ප්‍රතිභානප්‍රඥාසඞ්ඛ්‍යාත පටිසම්භිදාවන් ද, අෂ්ටවිධවිමෝක්‍ෂයන් ද, බුද්ධශ්‍රාවකයන් විසින් ලැබිය යුතු වූ ශ්‍රාවකසම්පත්තිය සිද්ධ කර්‍ණ යම් ශ්‍රාවකපාරමිතාවක් ඇත් නම් එය ද, ස්වයම්භූභාවය සිද්ධ කරණ යම් ප්‍රත්‍යෙකබෝධියක් (පසේ බුදුබවක්) ඇත් නම් එය ද, සියලු සත්ත්‍වයන්ට උතුම් බව සිද්ධ කරණ අනුත්තර බුද්ධභූමියක් (ලොව්තුරා බුදු බවක්) ඇත් නම් එය ද යන සියල්ල මේ පුණ්‍යනිධානය කරණ කොට ගෙණ ලැබේ.

මෝඝරාජය හැමකල්හි ස්මෘතිමත් වැ සත්කාය දෘෂ්ටිය දුරු කොට ලෝකය ශූන්‍ය හෙයින් බලව, මෙ සෙයින් මෘත්‍යුහු ඉක්මවන්නෙහි මෙසෙයින් ලොව දක්නහු මෘත්‍යුරාජ තෙම නොදක්නේ යයි.
මෝඝරාජ මාණව පෘච්ඡා නිමි.

සුඤ්ඤත විමොක්‍ෂ, අනිමිත්ත විමොක්‍ෂ, අප්පණිහිත විමොක්‍ෂය යි විමොක්‍ෂ තුනෙකි. සුඤ්ඤත විමොක්‍ෂමුඛ, අනිමත්ත විමොක්‍ෂමුඛ, අප්පණිහිත විමොක්‍ෂමුඛය යි විමොක්‍ෂමුඛ ද තුනෙකි. විමොක්‍ෂ නම් කෙලෙසුන් කෙරෙන් මිදීම ය. එනම් මාර්ග යි. මාර්ගා ගමන වශයෙන් ඵල ද මෙහි ඇතුළත් වේ. කෙලෙසුන් කෙරෙන් මිදීමට ද්වාර වන්නේ උපකාර වන්නේ විමොක්‍ෂමුඛ ය. එ නම් අනුපස්සනා යි. ත්‍රෛභූමක සංස්කාර අනාත්ම ය යි බැලීමෙන් ආත්මාභිනිවෙශය හෙවත් ආත්මය යන දෘඪග්‍රහණය දුරු කරන්නේ ය. එබැවින් අනත්තානුපස්සනාව සුඤ්ඤත විමොක්‍ෂමුඛය යි එසේ ම ත්‍රෛභූමක සංස්කාර අනිත්‍ය ය යි බැලීමෙන් සංඥා චිත්ත දෘෂ්ටි විපර්යාස සංඛයාත විපල්ලාස නිමිති දුරු කරන්නේ ය. එබැවින් අනිච්චානුපස්සනාව අනිමිත්තවිමොක්‍ෂමුඛ යි. ත්‍රෛභූමක සංස්කාර දුඃඛය යි බැලීමෙන් තෘෂ්ණා ප්‍රාර්ථනා දුරු කරන්නේ ය. එබැවින් දුක්ඛානුපස්සනාව අප්පණිහිත විමොක්‍ෂ මුඛය යි.

එකෙක් අනෙකකු නො රවටන්නේ ය. (නො රවටාවා). අනෙකකුට අවමන් නො කරන්නේ ය. (නො කෙරේ වා). බ්‍යාරොසනා නම් වූ කය හා වචනය පිළිබඳ විකෘතියෙන් ද ප්‍රතිඝසංඥා සඞ්ඛ්‍යාත මනෝවිකාරයෙන් ද එකෙක් අනෙකකුට දුකක් නො කැමති වන්නේ ය. (නො කැමති වේවා).
මව යම්සේ තමා ගෙන් ඇති වූ එක ම ඖරස පුත්‍රයා ජීවිතපරිත්‍යාගයෙන් වුවත් රක්නේ ද, එ පරිද්දෙන් ම සියලු සත්ත්‍වයන් කෙරෙහි අප්‍රමාණ වූ මෛත්‍රීසහගත සිත වඩන්නේ ය.
උඩ ද යට ද සරස ද (සතුරන් ය යි කියන ලද) සීමාවකුදු නැති ව අතරතුර වත් වෛර චේතනා පහළ වීමක් නැති ව, සතුරන් රහිත ව සියලු ලෝකසත්ත්‍වයා කෙරෙහි අප්‍රමාණ වූ මෛත්‍රීසහගත සිත වඩන්නේ ය.
සිටින්නේ හෝ ඇවිදින්නේ හෝ උන්නේ හෝ නිදන්නේ හෝ යම් තාක් මෛත්‍රීසහගත සිහිය ඉටනු කැමැත්තේ ද, ඒ තාක් පහ වූ මිද්ධය (අලස බව) ඇති ව ඉටන්නේ ය. මේ මෛත්‍රීවිහරණය මේ බුද්ධශාසනයෙහි ශ්‍රේෂ්ඨ විහරණයැ යි ප්‍රකාශ කළහ.

සෙසු සතළොස් ප්‍රත්‍යය අතුරෙන් හේතු, සහජාත, අඤ්ඤමඤ්ඤ, විපාක, ඣාන, මග්ග, සම්පයුත්ත, අවිගත, පච්ඡාජාත යන ප්‍රත්‍ය නවය අස්තිප්‍රත්‍යයයෙහි ඇතුළති. අනන්තර, සමනන්තර, අසෙවන, නත්‍ථි, විගත යන පඤ්ච ප්‍රත්‍යය උපනිශ්‍රය ප්‍රත්‍යයයෙහි ඇතුළති.

Gāthā / Song style

Note that there were no gathas or songs in the dataset. So the synthesis can not recreate such styles.

විසිකිස විසිකිසින්
යුතු සිතෙහි දැ යි මෙතුදුස
දොළොස් අකුසල් සිත්හි මැ
යෙදෙන්නේ පස් අයුරෙකින්

හිත මිතුරන් මා හැර ගිය දවසේ...
ලොව ම එරෙහි වී තනිවුණු මොහොතේ...
ඔබේ පැලේ නැත දොරගුළුලන්නේ...
ඔබේ සෙනේ ගඟ නැත වියැලෙන්නේ...

පියාණනී මා නැවත උපන්නොත්...
අපාර වූ මේ සංසාරේ...
ඔබේම පුතු වේවා...
ඔබේම පුතු වේවා..

Following is a Pali gatha. The model was not trained on Pali sentences, but manages to do a decent job in synthesis.

“ඉති තෙකාලිකා ධම්මා කාලමුත්තා ච සම්භවා
අජ්ඣත්තං ච බහිද්ධා ච සංඛතා සංඛතා තථා
පඤ්ඤත්ති නාමරූපානං වසේන තිවිධා ඨීතා
පච්චයා නාම පට්ඨානේ චතුවීසති සබ්බථා.”

Normal Sinhala

ඉතින් දිනක් බරණැස් රජ්ජුරුවෝ රාත්‍රී කාලයේ අප්‍රසිද්ධ ව වෙස්වලාගෙන තමන් ගේ නුවර පරීක්ෂා කිරීම පිණිස පිටත් වුනා. නුවර පරීක්ෂා කරමින් ඇන අතරතුර පංචපාපාගේ නිවස ඇති දිසාවටත් පැමිණුනා. පංචපාපාත් තමන් ගේ සොහොයුරු සොහොයුරියන් සමඟ කෙළිදෙලෙන් කාලය ගත කරමින් තමයි සිටියේ. ඇය එකවර ම නො දැන ගොස් රජතුමා ගේ අතින් ඇල්ලුවා. ඒ ස්පර්ශයත් සමඟ ම දිව්‍යමය ස්පර්ශයක් ලැබූ කෙනෙක් මෙන් රජතුමාට ප්‍රකෘති ස්වරූපයෙන් සිටින්නට නො හැකි වුනා. ඒ කුමාරිකාව ගැන දැඩි කැමැත්තක් ඇති වුනා.

ප්‍රාණය හා සමාන ව තමන්ට අනුකම්පා කරන, බොහෝ දවසක් එකට වාසය කළ පුරුෂයන් ව පවා, අවස්ථාවක් ලැබුණොත් මැඩපවත්වනවා. අතහැර දමනවා. එම නිසා ස්ත්‍රීන් ව විශ්වාස නො කළ යුතු යි.
මේ ස්ත්‍රීන් ගේ සිත අත්තක් අල්ලාගෙන තවත් අත්තක් අල්ලන වඳුරන් වගෙ යි. සුළඟින් සෙළවෙන අතුපතර වගෙයි. උස් පහත් භේදයක් නො මැති ව වැටෙන ගස් සෙවන වගේ ස්ත්‍රීන් ගේ සිත එක තැනක පිහිටන්නේ නෑ. ඒ වගේ ම ස්ත්‍රීන් ට තිබෙන්නේ, වහා පෙරලෙන කරත්ත රෝදයක් වගේ නොයෙක් අරමුණු වලට පෙරළෙන සිතක්.

පොලිස් වෙස් ගෙන නිවෙස්වලට බලහත්කාරයෙන් ඇතුළු වී නිවැසියන්ට පහර දී දේපොළ කොල්ලකන කල්ලියක මහ මොළකරුවන පාදුක්කේ 'ගල් ඔළුවා' නමැති අපරාද කල්ලි සාමාජිකයා ඇතුළු සැකකරුවන් දහදෙනෙක් පොලීසිය විසින් අත්අඩංගුවට ගෙන තිබේ.

Following long text was extracted from this chapter and two subsequent chapters in the same book.