The Phnom Penh Post Search

Search form




Logo of Phnom Penh Post newspaper Phnom Penh Post - និស្សិត​កម្ពុជា​ផលិត​រ៉ូ​បូត​ចេះ​បំប្លែង​សំឡេង និង​សន្ទនា​ភាសា​ខ្មែរ បំណង​បម្រើ​នៅក្នុង​វិស័យ​អប់រំ និង​ឯកជន​

និស្សិត​កម្ពុជា​ផលិត​រ៉ូ​បូត​ចេះ​បំប្លែង​សំឡេង និង​សន្ទនា​ភាសា​ខ្មែរ បំណង​បម្រើ​នៅក្នុង​វិស័យ​អប់រំ និង​ឯកជន​

Content image - Phnom Penh Post
​រ៉ូបូត​ «ជំនួយការ» និយាយតប និង​បញ្ចេញ​សារ​លើអេក្រង់​។ ហេង ជីវ័ន

និស្សិត​កម្ពុជា​ផលិត​រ៉ូ​បូត​ចេះ​បំប្លែង​សំឡេង និង​សន្ទនា​ភាសា​ខ្មែរ បំណង​បម្រើ​នៅក្នុង​វិស័យ​អប់រំ និង​ឯកជន​

​ភ្នំពេញ: មនុស្ស​និយាយថា​ «​ជម្រាបសួរ​!» រ៉ូ​បូត​តប​ថា «​ជម្រាបសួរ​!» មនុស្ស​បន្ដ «​ជម្រាបលា​!» រ៉ូ​បូត​តប​វិញ​ថា «​លា​ហើយ​!» មនុស្ស​បន្ថែមថា «​សួស្ដី​!» រ៉ូ​បូត​តប​ថា «​សួស្ដី​!» មនុស្ស​និយាយ «​កម្ពុជា​» រ៉ូ​បូត តប​ជា​សារ​ថា «​ពុំមាន​នៅក្នុង​សំណុំ​ទិន្នន័យ​» មនុស្ស​បន្ដថា «​ប្រទេស​កម្ពុជា​» រ៉ូ​បូត​តប​ជា​សារ​ទៀតថា «​ខ្ញុំ​ស្រឡាញ់​ប្រទេស​កម្ពុជា​»​។

​នេះ​ជាការ​សន្ទនា​រវាង​បុរស​ម្នាក់​ដែល​ត្រូវ​បានឮ​ចេញពី​ផ្ទៃ​ក្រោយ​នៃ​វីដេអូ ជាមួយ​ប្រអប់​ពណ៌​ស​មួយ រំលេច​រូបភាព​ទង់​​ជាតិ​កម្ពុជា និង​សំណេរ​ពាក្យ «​វិទ្យាស្ថាន​ជាតិ​ពហុ​បច្ចេក​​ទេស​កម្ពុជា​» ជាមួយ​អេក្រង់​តូច​មួយ​ទំហំ ៣,២​ អ៊ិញ​។​

​និស្សិត នី វីរៈ​បុ​រា ប្រធាន​ក្រុម​ស្រាវជ្រាវ​រ៉ូ​បូត​ដែលមាន​សមាជិក​ ៣​ នាក់​ទៀត ប្រាប់ ​ភ្នំពេញ ​ប៉ុស្ដិ៍​ថា​៖ «​យើង​ចង់​បង្កើតជា​ប្រព័ន្ធ​ទទួលស្គាល់​សំឡេង​ស្វ័យ​ប្រ​វ​ត្ដិ ជា​ម៉ូ​ដែល​មួយ ដែល​អាច​បំប្លែង​សំឡេង​និយាយ​ភាសា​ខ្មែរ​ទៅជា​តួអក្សរ​ខ្មែរ​នៅលើ​អេក្រង់ ដោយ​មិនចាំបាច់​ភ្ជាប់អ៊ីន​ធឺ​ណិ​ត​»​។

​ដោយសារតែ​សិក្សា​ជំនាញ programming និង​ទាក់ទង ​Artificial intelligence (AI) គួបផ្សំ​នឹង​គំនិត​ផ្ដួចផ្ដើម​របស់​គ្រូ និស្សិត​ដែលមាន​សមាជិក ៤ ​នាក់ រួមទាំង​និស្សិត ចំណោម​និស្សិត ជាតិ ជា​, ជី​ង សុឃៀង និង នី ពិសិដ្ឋ បានសម្រេច​ផលិត​ប្រព័ន្ធ​ទទួលស្គាល់​ជា​សំឡេង​ជា​ភាសា​ខ្មែរ​។

​រ៉ូ​បូត «​ជំនួយការ​» ដ៏​តូច​កម្ពស់​តែ ២,២​ តឹក ប្រតិ​ប​ត្ដិ​ការ​ស្វ័យ​ប្រ​វ​ត្ដិ​ភ្លាមៗ ក្រោយពេល​ចុច​ប៊ូ​តុង power ជាមួយនឹង​សមត្ថភាព​សន្ទនា​ជា​ភាសា​ខ្មែរ CMUSphinx ជាមួយ​សំណុំ​ទិន្នន័យ​មានកំណត់​នៅក្នុង​ដំណាក់កាល​ដំបូង​នេះ​។

Content image - Phnom Penh Post
​លោក នី វីរៈបុរា ប្រធានក្រុមស្រាវជ្រាវ​រ៉ូបូត​ «​ជំនួយការ» ជាសាស្ដ្រាចារ្យនៅ​វិទ្យាស្ថាន​ពហុបច្ចេកទេស​កម្ពុជា (NPIC)។ ហេង ជីវ័ន

​លោក នី វីរៈ​បុ​រា ស្ថិតក្នុង​មហាវិទ្យាល័យ​អេឡិចត្រូនិកបាន​បន្ដថា​៖ «​រ៉ូ​បូត​អាច​ធ្វើការ​បំប្លែង​សំឡេង​នៃ​ការនិយាយ​ទៅជា​អក្សរ​។ ស្រប​ពេលនេះ រ៉ូ​បូត​អាច​ឆ្លើយ​ទៅលើ​សំណួរ​ដែល​យើង​បាន​និយាយ​ចោទសួរ​ដូចគ្នា​។ ដូច្នេះ យើង​សួរ​ជា​ភាសា​ខ្មែរ រ៉ូ​បូត​ឆ្លើយ​ជា​ភាសា​ខ្មែរ និង​បង្ហាញ​តួអក្សរ​នៅលើ​អេក្រង់​ផងដែរ​»​។

​ក្រៅពី​ការសហការ​គម្រោង​ជាមួយ​ដៃគូ​ឯកជន ដែល​ក្រុមនិស្សិត​អាចមាន​សមត្ថភាព​បំពេញតម្រូវការ​ក្នុង​ការផលិត​បច្ចេកវិទ្យា​ស្គាល់​សំឡេង​បម្រើការ​ក្នុង​ក្រុមហ៊ុន រ៉ូ​បូត «​ជំនួយ​​ការ​» ត្រូវបាន​ផលិតឡើង​មានបំណង​ដាក់ឱ្យ​ដំណើរការ​ក្នុង​វិស័យ​អប់រំ​ជា​ចម្បង​។

​លោក បុ​រា ដែល​បច្ចុប្បន្ន​ក៏​ជា​សាស្ដ្រាចារ្យ​ម្នាក់​នៅ​វិទ្យា​ស្ថាន​ជាតិ​ពហុបច្ចេកទេស​កម្ពុជា NPIC បានឱ្យដឹងថា​៖ «​យើង​អាច​ប្រើ​រ៉ូ​បូត​នេះ​ក្នុង​កម្រិត​ថ្នាក់​ម​តេ្ត​យ្យ និង​បឋមសិក្សា ដោយ​វា​អាច​ឆ្លើយឆ្លង និង​បង្ហាញ​រូប ឬ​វីដេអូ​បង្រៀន​ផ្សេងៗ​ទៅដល់​សិស្សានុសិស្ស​»​។

​យ៉ាងណាមិញ ជាមួយ​សំណុំ​​ទិន្នន័យ​មានកំណត់ រ៉ូ​បូត ទើប​ត្រូវបាន​បញ្ចូល​ទិន្នន័យ​ភាសា​​ខ្មែរ ​១៥៧​ ពាក្យ សម្រាប់​បង្កើតជា​ប្រយោគ​និយាយ​តប​។

​សមត្ថភាព​ឆ្លើយឆ្លង​សំណួរ​របស់​រ៉ូ​បូត វា​អាស្រ័យ​លើ database ដែល​ត្រូវបាន train​។ Train ក្នុងន័យនេះ គឺជា​ការ​​បង្វឹក​មួយ​ប្រភេទ តែ​មិនមែន​សំដៅលើ​ការនិយាយ​ទៅកាន់​រ៉ូ​បូត​នោះទេ​។ វា​មាន​សមីការ​គណិតវិទ្យា និង​ចង​សរសេរ​ជា​កូដ​រួមបញ្ចូល ដើម្បី​ស្វែងយល់​អំពី​សំណួរ​ដែល​ចោទសួរ​។

​លោក បុ​រា បន្ដថា សំណួរដែល​ត្រូវ​បានដាក់​សួរ​នេះ គឺជា​សំណួរ​ទូទៅ ដូចជា សួស្ដី​! ជម្រាបសួរ​! ជម្រាបលា​! និង​ការសួរសុខទុក្ខ​អី​ជាដើម​។

​ដៃ​កាន់​អង្អែល​អេក្រង់ ដែល​ដើរតួនាទី​ជា​មុខ​រ៉ូ​បូត លោក បុ​រា បាន​បន្ដថា​៖ «​រ៉ូ​បូត​នេះ មិន​ខុសពី​កូនក្មេង​នោះទេ​។ ដើម្បីឱ្យ​កូនក្មេង​ម្នាក់​ស្គាល់​ពាក្យ ទី​១ យើង​បង្ហាញអក្សរ បន្ទាប់មកទៀត យើង​និយាយ​ឱ្យ​ក្មេង​ស្ដាប់​នូវ​ពាក្យពេចន៍​ត្រូវបាន​បញ្ចេញ​យ៉ាងដូច​​ម្ដេច​។ ប៉ុន្ដែ ម៉ាស៊ីន​ខុសពី​មនុស្ស បើ​មនុស្ស​ម្នាក់​និយាយ​ជាមួយនឹង​ម៉ាស៊ីន វា​ស្គាល់​តែ​បុគ្គល​នោះ​ប៉ុណ្ណោះ​។ ដូច្នេះ យើង​ត្រូវ​ការបញ្ចូល​ទិន្នន័យ​ច្រើន ដើម្បី​បង្កើត​ប្រសិទ្ធភាព​នៃ​ការ​ស្គាល់​សំឡេង​មនុស្ស​បាន​ច្រើន​»​។

​ពាក្យពេចន៍​ចំនួន ១៥៧ នេះ បានមកពី​អ្នក​ស្ម័គ្រចិត្ដ​បង្កើត​ទិន្នន័យ​នេះ​ចំនួន ៨៥​ នាក់ ដើម្បីឱ្យ​ពួកគេ​និយាយ​គ្រប់​ពាក្យ​ទាំងអស់​។

​លោក ស្រ៊ុន ចាន់ណា​រ៉េត សាស្ដ្រាចារ្យ​មហាវិទ្យាល័យ អេឡិចត្រូនិក នៃ​វិទ្យាស្ថាន NPIC ដែល​បាន​ដឹកនាំ​គម្រោង​រ៉ូ​បូត «​ជំនួយការ​» ឱ្យដឹងថា​៖ «​សំឡេង​មនុស្ស​ជាង ៨០ ​នាក់​នេះ សម្រាប់​បង្វឹក​ឱ្យ​រ៉ូ​បូត​ស្គាល់​សំឡេង​ភាសា​និយាយ​មនុស្ស​ទូទៅ​។ បើ​យើង train តែ​មនុស្ស​ម្នាក់ រ៉ូ​បូត​ប្រាកដជា​ស្គាល់​សំឡេង​របស់​មនុស្ស​តែ​ម្នាក់​ប៉ុណ្ណោះ​»​។

​ថ្វី​ដ្បិត​រ៉ូ​បូត​នេះ​ទើប​ស្គាល់​ពាក្យ​ចំនួន ១៥៧​ តួអក្សរ​យ៉ាងណាក៏ដោយ ក៏​វា​មាន​សុក្រឹត​ភាព​លើស ​៩០ ​ភាគរយ​។

Content image - Phnom Penh Post
​លោក ស្រ៊ុន ចាន់​ណារ៉េត សាស្ដ្រាចារ្យ​មហាវិទ្យាល័យ​អេឡិចត្រូនិក​កំពុង​បង្រៀន​សិស្ស​។ ហេង ជីវ័ន

​យុវជន វ័យ ២២​ ឆ្នាំ​រូបនេះ បញ្ជាក់ថា​៖ «​អ្វីដែល​ពិសេស​សម្រាប់​រ៉ូ​បូត​យើង​មួយ​នេះ គឺ​វា​ដំណើរការ (offline) ដោយ​មិនចាំបាច់​ប្រើ​អ៊ី​ន​ធឺ​ណិ​ត​។ ការប្រើប្រាស់​ប្រព័ន្ធ offline ដោយសារ​វា​ដំណើរការបាន​លឿន​ជាង ហើយ​វា​ជា local computing ដែល​ដំណើរការ​ទិន្នន័យ​នៅក្នុង​រ៉ូ​បូត​ស្រាប់ ដោយ​មិនចាំបាច់​ភ្ជាប់​ដំណើរ​​ការ​ទៅកាន់ servers ទេ​»​។

​លោក បុ​រា បាន​អះអាងថា​៖ «​ឆាប់ៗ​ខាងមុខនេះ យើង​នឹង​បង្កើត​តួ​ម៉ូ​ដែល​រ៉ូ​បូត​ថ្មី​មួយទៀត និង​ធ្វើការ​អភិវឌ្ឍ​សូ​ហ្វ​វែ​រ​ថ្មី ដែលមាន​មុខងារ​ជា​ជំនួយការ​សម្រាប់​ប្រើប្រាស់​ក្នុង​ក្រុមហ៊ុន ភោជនីយដ្ឋាន និង​ទីតាំង​ផ្ដល់​សេវាកម្ម​ផ្សេងៗ​។ ចំពោះ​ម៉ូ​ដែល​ថ្មី តួ​រ៉ូ​បូត​អាច​តូច​ជាង​នេះ និង​ចល័ត​ងាយស្រួល​ជាង​នេះ តែ​ពង្រីក​ទំហំ​អេក្រង់​រហូតដល់​ ៧ អ៊ិ​ញ​»​។

​ដើម្បីឱ្យ​រ៉ូ​បូត​នេះ​មានដំណើរ​​ការល្អ​ពេញលេញ សាស្ដ្រាចារ្យ​ដែល​ទើប​វិ​វត្ដ​ខ្លួន​ពី​និស្សិត​រូបនេះ បាន​បន្ថែមថា នៅសល់​ដំណាក់កាល​ ២ ធំៗ​ទៀត​។ ទី​១ ការធ្វើ​បច្ចុប្បន្នភាព​សូ​ហ្វ​វែ​រ ដើម្បីឱ្យ​ប្រព័ន្ធ​ដំណើរការ​កាន់តែ​លឿន ហើយ​ទី​២ បង្កើន​​សមត្ថភាព​ឱ្យ​វា​ស្គាល់​ពាក្យ​​ពេចន៍​កាន់តែច្រើន​។

​លោក ណា​រ៉េត បានឱ្យដឹងថា​៖ «​បន្ដិចទៀត យើង​បំពាក់​កាមេរ៉ា ដើម្បីឱ្យ​វា​មាន​សមត្ថ​-​ភាព​ស្គាល់​មនុស្ស និង​អាច​ហៅ​ឈ្មោះ​ចំៗ​។ គម្រោង​យើង​មាន​ច្រើន តែ​អ្វីដែល​យើង​ខ្វះ គឺ​ការជួយឧបត្ថម្ភ​សម្រាប់​យើង​ស្រាវជ្រាវ​បន្ថែម​»​។

​ក្រុមការងារ​ជួប​ការលំបាក​ច្រើន ទាំង​បញ្ហា​ហាដវែរ និង​សូ​ហ្វ​វែ​រ រវាង​ទ្រឹស្ដី និង​ការ​​អនុវត្ដ​ជាក់ស្ដែង​ដែល​ទាមទារ​ពេលវេលា​ច្រើន​៕

អត្ថបទគួរចាប់អារម្មណ៍