中文關鍵字:低資源語言;資料擴增;端到端語音辨識;元學習
英文關鍵字:Low-resource language; Data augmentation; End-to-end speech recognition; Meta-learning
隨著深度學習的發展,資源豐富的語言(如中文、英文…等等)之語音辨識效果已相當出眾,但是台語、客語、原住民語等少數語言仍受限於資料不足。本計畫擬選擇台語作為低資源的應用語言。本計畫將使用各種資料擴充方法,並研發針對擴充資料之驗證技術,以取得適當之訓練語料,協助改善效能。本計畫在社會文化上,不僅對台語之應用有所貢獻,相關的技術也會對台語這個無形資產的保存盡一份心力。在經濟面向中,本計畫所開發之低資源語音辨識系統能提供業界相關領域之應用。在學術發展面向上,本計畫研發的技術及探討的問題,涉及許多目前尚未純熟或尚未有較明確定義之技術及評測方法,可將研究成果發表至學術期刊及會議和國內外學者進行交流。 |