資料擴增與驗證技術於低資源語音辨識之研究


依類型	族群	主題

2022.08.01 ~ 2023.07.31

族群：跨族群

主題：族群語言、學術研究

主持人		吳宗憲
執行單位		國立成功大學資訊工程學系(所)
地點		全臺全部
研究內容		中文關鍵字：低資源語言；資料擴增；端到端語音辨識；元學習英文關鍵字：Low-resource language； Data augmentation； End-to-end speech recognition； Meta-learning 隨著深度學習的發展，資源豐富的語言(如中文、英文…等等)之語音辨識效果已相當出眾，但是台語、客語、原住民語等少數語言仍受限於資料不足。本計畫擬選擇台語作為低資源的應用語言。本計畫將使用各種資料擴充方法，並研發針對擴充資料之驗證技術，以取得適當之訓練語料，協助改善效能。本計畫在社會文化上，不僅對台語之應用有所貢獻，相關的技術也會對台語這個無形資產的保存盡一份心力。在經濟面向中，本計畫所開發之低資源語音辨識系統能提供業界相關領域之應用。在學術發展面向上，本計畫研發的技術及探討的問題，涉及許多目前尚未純熟或尚未有較明確定義之技術及評測方法，可將研究成果發表至學術期刊及會議和國內外學者進行交流。
相關網頁		https://www.grb.gov.tw/search/planDetail?id=14513040

網站問題/諮詢 | 提供活動