成功案例

SUCCESS

中華電信借助NVIDIA GPU加速深度學習,讓中英雙語語音合成能更自然互動

成功案例分類 2023.12.11
中華電信借助NVIDIA GPU加速深度學習,讓中英雙語語音合成能更自然互動

中華電信研究院前瞻科技研究所所長汪世昌表示:「目前中華電信自行研發的中英雙語語音合成技術,歷年來已應用於多個領域,除了用在24小時客服專線,更應用在166、167天氣預報、視障輔助等相關應用,以及中華電信旗下i寶貝智慧音箱、AI語意雲、智慧廣播助理等服務,同時也用於健保署、消防署的語音服務系統。」

在還沒有導入AI技術時,中華電信就已著手投入擬真數位語音技術研究,從早期藉由語音拼接進行合成,以及後續透過語音參數方式進行合成,到現在已經可以利用深度學習等AI技術,透過足夠時間長度規模的聲音資料,以及相應的文字內容,訓練合成高度自然的語音模型,唯獨整個訓練流程仍須花費較長時間。

打造自然語感的合成語音表現,自然需要龐大的資料量進行深度訓練,以過往訓練模式須花費更長時間完成,但是藉由導入NVIDIA超大規模模型推論解決方案Triton推論伺服器,並搭配TensorRT深度學習推論平台,以及透過GPU加速的cuDNN 函式庫等資源,同時,藉由NVIDIA Elite合作夥伴豐康科技協助導入NVIDIA的硬體設備,包括NVIDIA DGX-1超級電腦RTX A6000 GPU與多張NVIDIA T4 Tensor 核心 GPU等進行運算,即可讓原本需要花費多時才能完成的模型訓練,縮短至1天即可完成,更可在整個訓練過程中降低成本支出。

新聞來源:https://reurl.cc/aaVxO3