依類型 族群 主題   
 
 
2020.08.01 ~ 2021.07.31
賽德克語構詞結構之自動解析及標記工作
族群: 賽德克族   
主題: 族群語言  
主持人 林川傑
執行單位 國立臺灣海洋大學資訊工程學系
地點 南投縣 全部    
研究內容

中文關鍵字:賽德克語;構詞結構自動解析;臺灣原住民族語之自然語言處理
英文關鍵字:Seediq; automatic analysis of morphological structures; natural language processing for Taiwanese indigenous languages

臺灣原住民各族語言都已經被聯合國教科文組織列為瀕危語言,族語保存及振興的問題已受到重視。在現今網際網路及人工智慧盛行的年代,運用自然語言處理技術來協助各項原住民族語言的使用與推廣將是未來趨勢。然而原住民族語電子資源更是缺乏,本計畫擬從賽德克語的構詞結構自動解析工作開始,為未來在原住民族語言上的各種自然語言處理技術研究做準備。賽德克語的詞形變化相當多樣,主要是為了標示動詞焦點或時貌。本計畫預計以語法書提供的構詞結構來整理出所有詞綴相關規則,包括詞綴完整集合、出現位置、組合規則、重疊規則、元音輔音變化規則等等。也預計開發一套構詞結構標記系統,加入賽德克語構詞結構自動解析技術。預期完成的成果描述如下:(1) 賽德克語構詞結構實驗資料集(2) 賽德克語詞綴集合、詞綴出現位置規則、組合規則、變化規則(3) 賽德克語重疊前綴規則(4) 賽德克語加綴後元音或輔音的變化規則(5) 賽德克語構詞結構人工標記系統(6) 賽德克語構詞結構自動解析系統 

相關網頁 https://www.grb.gov.tw/search/planDetail?id=13540042