本發明公開了一種基于濾波器組頻率區分的深度網絡波形合成方法及裝置,方法包括:采用解析方法設計多個任意頻率通帶的濾波器組;將生成器輸出的語音信號并行饋入到濾波器組中,獲得多個窄頻帶的信號;將窄頻帶的信號分別輸入到各個子鑒別器中進行處理,綜合子鑒別器的損失函數對生成對抗網絡的參數進行訓練,將測試文本饋入到給定的聲學模型前端網絡中,生成測試梅爾譜,再將該測試梅爾譜輸入到生成器中,生成語音信號。裝置包括:處理器和存儲器。本發明提出的語音波形合成GAN網絡解決了高頻部分混疊失效的問題,大大減輕了高頻頻段的頻譜失真。
聲明:
“基于濾波器組頻率區分的深度網絡波形合成方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)