Microsoft Azure speech-to-text සමගින් දැන් සිංහල භාෂාවත්

Microsoft Azure speech-to-text සමගින් දැන් සිංහල භාෂාවත්

1430
0
SHARE

මේ ලිපියෙන් කතා කරන්න යන්නේ බොහොම දෙනෙක් දන්නා technology එකක් ගැන, ඒ කියන්නේ artificial intelligence (AI) සමගින් ගොඩ නැගුනු Speech recognition නැත්නම් කථන හඳුනාගැනීම ගැන. මේක බොහොම ලේසියෙන්ම ඔබට කරන්න පුළුවන් දැන් ඔබේ ජංගම දුරකතනයෙන්, මොකද virtual Assistantsලා සැලකිය යුතු ප්‍රමාණයක් සිටින නිසා. ඉතින් මේ ලිපියෙන් මේ Speech recognition කියන්නේ මොකක්ද කියලා කතා කරන්නයි බලාපොරොත්තු වෙන්නේ.

මෙහිදී සිදුවන දේ සරලවම කියනවා නම් අපි මොකක් හරි voice command එකක් දුන්නම ඒක හඳුනාගෙන ඊට පිළිතුරක් අපිට ලැබෙනවා artificial intelligence (AI)-based application එකකින්. එහෙම නැත්නම් අපේ virtual Assistant ගෙන්. මේ විදියට අපේ voice command හඳුනාගන්න සහ ඊට අනුකුලව පිළිතුරු දෙන්න නම් ප්‍රධාන වශයෙන්ම මෙන්න මේ හැකියාවන් නැත්නම් capabilities තියෙන්න ඕන. ඒ තමයි

  • Speech recognition – කථනය හඳුනා ගැනීමට සහ අර්ථකථනය කිරීමට ඇති හැකියාව.
  • Speech synthesis – කථන පිළිතුරක් උත්පාදනය කිරීමේ හැකියාව.

Speech recognition – කථනය හඳුනා ගැනීම

මේ  කථන හඳුනාගැනීම කියන ක්‍රියාවලියේදී සිදුවෙන්නේ ඇත්තටම කතා කරන වචන හඳුනාගෙන ඒවා දත්ත බවට එහෙම නැත්නම් ලිඛිත වචන බවට පත් කිරීමයි.සාමාන්‍යයෙන් අපිට මේ විදියට පටිගත කරපු හඬ පටියක් හෝ සජීවීව ලබාදෙන කථනයන් භාවිතා කරන්න හැකියාව තිබෙනවා.

මේ ක්‍රියාවලියටත් අවශ්‍ය වෙන තවත් models දෙකක් තිබෙනවා, ඒවා තමයි,

  • acoustic model – ශ්‍රව්‍ය සංඥාව ශබ්ද කෝෂ බවට පරිවර්තනය කරයි (විශේෂිත ශබ්ද නියෝජනය)
  • language model – සාමාන්‍යයෙන් ශබ්ද කෝෂ මත පදනම් වූ වචන අනුපිළිවෙල පුරෝකථනය කරන සංඛ්‍යානමය ඇල්ගොරිතමයක් භාවිතා කරමින්, වචන වලට ගැලපීම.

මේ විදියට හඳුනාගත් වචන ලිඛිත වචන බවට පත් කරනවා, එහෙම තමයි  phone call එකක හරි  meeting එකක හරි transcript එකක් හැදෙන්නේ.

Speech synthesis – කථන සංස්ලේෂණය

මෙහිදී සිදුවෙන්නේ Speech recognition කියන ක්‍රියාවලියේදී සිදුවන දේ විරුද්ධ දෙය එහෙම නැත්නම් ලිඛිතව තිබෙන වචන හඬ බවට පත්කිරීම.

ඉතින් කලින් වගේම මේ ක්‍රියාවලියටත් ප්‍රධාන කාරණා දෙකක් අත්‍යවශ්‍ය වෙනවා. ඒ තමයි

  • හඬ බවට පත් කරන්න ලිඛිත වචන
  • හඬක් නගන්න අවශ්‍ය සැබෑ කටහඬක්

මෙහිදී ලිඛිතව තිබෙන වචන එකින් එක ඒ එක් එක් වචනයට අදාළ ශබ්දය බවට පත් කිරීම මුලින්ම සිදු වෙනවා, මීලඟට මේ වචන phrases එහෙම නැත්නම් වාක්‍ය ඛන්ඩ බවට පත් කරනවා.මීටත් පස්සේ තමයි මේ සියල්ල සුදුසු පරිදි අර්ථානුකුල audio එකක් එහෙම නැත්නම් හඬ පටියක් බවට පත්වෙන්නේ. නමුත් මේ විදියට නිකම්ම නිකම් වචන කියවෙන හඬ පටියක් වෙලා තේරුමක් නැති නිසා මෙහි අඩංගු වචන උච්චාරණය වෙන වෙනස් විදි ඒ ආකාරයට සුදුසු පරිදි හඬ උස් පහත් කිරීම් සිදු කරනවා.

Azure සමගින් හඬ

දැන් අපිට  speech recognition සහ speech synthesis කියන්නේ මොකක්ද කියලා අවබෝධයක් තිබෙන නිසා මේ දේවල් , මේ තාක්ෂණය අපිට භාවිතා කරන්න එහෙම නැත්නම් ලබාගන්න පුළුවන් ආකාරය දැනගනිමු. Microsoft Azure මගින් ලබාදෙන Speech cognitive සේවාව හරහා අපට පහසුවෙන්ම මේ තාක්ෂණය ලබාගන්න හැකියාව තිබෙනවා. ඒ සඳහා මෙන්න මේ APIs දෙක ඔවුන් ලබාදෙනවා.

  • The Speech-to-Text API
  • The Text-to-Speech API

Speech cognitive සේවාව සඳහා ලබාදෙන Azure සම්පත් 

  • Speech resource – කථන සේවාව පමණක් භාවිතා කිරීමට අවශ්‍ය නම් මෙය භාවිතා කරන්න.
  • Cognitive Services – අනෙකුත් cognitive සේවාවන් සමග අනුබද්ධව කථන සේවාව ලබාගැනීමට අවශ්‍ය නම් මෙය භාවිතා කරන්න.

Speech-to-text API

ඔබට සජීවීව හෝ පටිගත කරන ලද හඬ පටියක් ලිඛිතව ලබාගැනීමට අවශ්‍ය නම් මෙම API එක භාවිතා කරන්න පුළුවන්. Microsoft මගින් පුහුණු කරන ලද Universal Language Model එකෙන් තමයි ඇත්තටම මේ ක්‍රියාවලිය සිදුවෙන්නේ.  මේ model  එකට අවශ්‍ය දත්ත Microsoft සතු වෙන අතර  Microsoft Azure හි deploy කරලා තිබෙනවා.

Real-time transcription

ඔබට සජීවීව හඬ පටියක් ලිඛිතව ලබාගැනීමට අවශ්‍ය නම් ඒකට සුදුසුම වෙන්නේ Real-time transcription තමයි. presentations, demos කරන විට හෝ යම්කිසි පුද්ගලයෙක් කතා කරන විට ඊට අදාළ ලිඛිත පිටපතක් ලබාගැනීමට ඔබට අවශ්‍ය නම් ඒ සඳහා සුදුසුම දේ තමයි Real-time transcription.

Text-to-speech API

Text-to-speech API එක භාවිතයෙන් ඔබට පුළුවන් ලිඛිතව තිබෙන යමක් හඬක් බවට පත් කරන්න. මෙහි තිබෙන විශේෂත්වය තමයි ඔබට අවශ්‍ය පරිදි භාෂාව, ඒ වගේම ගැලපෙන හඬක් , කාන්තා හෝ පුරුෂ හඬක් ලබාගැනීමට ඇති හැකියාව. ඒ විතරක් නෙමෙයි යම් යම් හඬ උච්චාරණයන් ඒ ආකාරයට ලබාගැනීමටත් හැකියාව තිබෙනවා.

speech-to-text සහ text-to-speech APIs දෙකම විවිධ භාෂාවන් රාශියකට අනුකුලව ක්‍රියාත්මක වෙනවා. පහතින් ඇති link වලින් ඔබට ඒ භාෂාවන් මොනවද කියලා හරියටම දැනගන්න පුළුවන්.

ඉතින් අද ලිපියෙන් කතා කරපු දේ සරලවම පැහැදිලි කිරීමට උත්සහ කලේ අපි හැමෝම දන්නා දෙයක් නිසා. ඒ වගේම බොහොම සතුටින්, මේ ලිපිය අවසන් කරන්න කලින් ඔබට දන්වන්න තිබෙන විශේෂ නිවේදනය තමයි Azure cognitive සේවාවන් හි speech-to-text භාෂා වලට අපේ සිංහල භාෂාවත් දැන් එක්වෙලා තිබෙනවා.

Comments

comments

NO COMMENTS

LEAVE A REPLY