年度:104年
作者:林昕緯
畢業學校:國立中興大學
畢業系所:資訊科學與工程學系
畢業年月:103.11
獎助金額(萬元):3
本論文完成了一套中文轉客文語音合成系統,系統組成包括:文句分析模組、韻律訊息模組、語音合成模組。使用者輸入中文句子或文章,經過上述模組處理後,會輸出該句子的以下結果:1.客語斷詞及詞性標記結果、2.客語文句剖析結果、3.韻律階層預測結果、4.客語讀音求取結果、5.四縣腔的中文轉客文語音合成結果。
針對中文翻客文的斷詞處理,我們先蒐集客語句子語料,並設計一套工具,以半自動方式對客語句子做斷詞及詞性結果的標記。再利用標記結果訓練出國客語對應式的語言模型,最後應用我們提出的Mix‐Gram 分數算法於斷詞候選序列的選擇。經實驗結果顯示,在嚴重資料稀疏的情況下,此方法的正確率有81.41%。
而客語讀音求取方面,我們採用照詞或字翻譯的方法,針對客語發音辭典,我們將每詞彙切分為單字,並抽取其1.讀音、2.詞性、3.是否為詞尾等三個特徵,訓練出讀音資訊統計表。以客語詞彙發音辭典為優先,該統計資訊為輔的方式,設計出一個客語讀音求取的流程。
經實驗顯示,此方法對客語讀音求取的正確率有82.81%。最後,我們實際合成出客語語音,並做平均主觀分數的測試。結果顯示,語音合成系統中的韻律訊息及文意正確性有明顯的改善。
關鍵詞:中文轉客語斷詞處理、文句分析、讀音求取