百度機器學習系統 8分鐘複製他人聲音
Net+
發布時間: 2018/03/06 19:07
最後更新: 2018/03/06 19:07
動畫名偵探柯南中,柯車利用蝴蝶結變聲器,隨時模仿別人聲音的蹺段將會成真。百度近日發表論文,其語音生成系統Deep Voice透過機器學習訓練,模仿數千把不同人的聲音。百度指,該系統只需要100段5秒的說話錄音,合共約8分鐘20秒,就可訓練百度系統完全複製一個人的聲音,即使只用10段少於5秒的錄音,合成質素較低,但欺騙語音識別系統的成功率仍高達9成半。
研究人員指,此項技術可幫助失聲人士「找回」自己的聲音,美國人工智能協會(AAAI)主席 Subbarao Kambhampati 轉發百度這項技術的博客,稱有了此技術,只要事先設置好個人聲音,父母在哄小孩睡時,便不用親身在他們旁邊,借有聲讀書器向孩子讀睡前故事。
然而,若語音技術更成熟時,將來的聲音像真度不單提高,用字、語氣更像話者本人,更有可能衍生出其他保安漏洞,如輕易欺騙語音識別系統,或扮演其他人來誤導事主朋友,以進行詐騙。