中文轉客文語音合成系統中的文句分析模組之研究

張貼日期：2016-01-29

年度：104年

作者：林昕緯

畢業學校：國立中興大學

畢業系所：資訊科學與工程學系

畢業年月：103.11

獎助金額(萬元)：3

本論文完成了一套中文轉客文語音合成系統，系統組成包括：文句分析模組、韻律訊息模組、語音合成模組。使用者輸入中文句子或文章，經過上述模組處理後，會輸出該句子的以下結果：1.客語斷詞及詞性標記結果、2.客語文句剖析結果、3.韻律階層預測結果、4.客語讀音求取結果、5.四縣腔的中文轉客文語音合成結果。

針對中文翻客文的斷詞處理，我們先蒐集客語句子語料，並設計一套工具，以半自動方式對客語句子做斷詞及詞性結果的標記。再利用標記結果訓練出國客語對應式的語言模型，最後應用我們提出的Mix‐Gram 分數算法於斷詞候選序列的選擇。經實驗結果顯示，在嚴重資料稀疏的情況下，此方法的正確率有81.41%。

而客語讀音求取方面，我們採用照詞或字翻譯的方法，針對客語發音辭典，我們將每詞彙切分為單字，並抽取其1.讀音、2.詞性、3.是否為詞尾等三個特徵，訓練出讀音資訊統計表。以客語詞彙發音辭典為優先，該統計資訊為輔的方式，設計出一個客語讀音求取的流程。

經實驗顯示，此方法對客語讀音求取的正確率有82.81%。最後，我們實際合成出客語語音，並做平均主觀分數的測試。結果顯示，語音合成系統中的韻律訊息及文意正確性有明顯的改善。

關鍵詞：中文轉客語斷詞處理、文句分析、讀音求取