起   - 迄  族群 主題   
 
原住民族電視台    2024/03/25
善用AI科技平台研發應用 族語學習新進展
族群: 跨族群  
主題: 族群語言  
記者:Cemedas Dumalalrath(江子芊)、Kawa(施俊銘)
地點: 台北市 全部    

透過大量的語料蒐集、資料整理,再讓人工智慧「AI」進行學習,以太魯閣族語講述並翻譯而成的童話故事「小紅帽」,就這樣誕生了。

國研院國網中心佐理研究員 黃孟琦:「到目前為止我們已經蒐集了,十二小時左右的人聲資料,跟一百萬字左右的羅馬拼音,到現在的話已經可以,初步做出一個語音合成的功能,跟文字翻譯的功能,也就是中文轉太魯閣語,跟太魯閣語轉成中文的部分,然後也串接後端就是跟一般的ChatGPT。」

也就是說,在ChatGPT上用族語跟AI聊天,已經可以實現!而為了復振族語,國科會近年展開「以包容為導向之科技計畫」,其中在「原住民族語言人工智慧科技平台研發與教育應用」子計畫中,整合了國網中心、高師大、陽明交大、原語會以及相關語言學會,合作進行開發,然而太魯閣族語具有單一性的特性,而且語料相對其他族語豐富,對現階的AI學習來說,較為容易。

太魯閣族語學會理事 Miming Karaw:「老人家才是真正的語料人,使用這個語言的才是真正的語料人,那我們太魯閣比較慶幸的就是,文面耆老他們在的時候,這個(族語)聖經就已經產出來了,所以說非常地精準。」

國網中心也表示,AI模型開發前期,講求資料單純,中文跟族語的對照翻譯語句,就不能太長,而語音的蒐集也需要字正腔圓,來降低AI模型訓練的難度。

原語會董事長 Mayaw·Kumud:「我們先還是要搶救瀕臨(危)的族群(語言),包括泰雅族的克里奧語,這些都是在語言的多元化中,我們必須尊重,那但是要先做一些的規範,那之後我們會再跟原民會,提出相對的階段性的報告,那預算上我們會提出適當預算,會再跟原民會特別是教育部、文化部、國科(會)這邊來提出。」

雖然瀕危語言相較太魯閣族語更難蒐集基礎資料,但原語會仍期盼透過跨部會力量及科技輔助,讓族語教學與學習,更上一層樓。而國科會也將提供原住民族語言學會、原語會還有族語相關單位團體,辨理AI族語教育訓練與推廣,提升服務能力與能量,使服務模式多元化,未來也可推廣到全台各族語言別,達到族語深化與永續落地的目標。 

 
 
地址:106台北巿羅斯福路四段一號 國立臺灣大學總圖書館北側廣場地面層
電話:(02)3366-3776   FAX:(02)3366-3770    
EMAIL:ntutiprc@ntu.edu.tw
網站點閱次數:67,400,713 次