image
20240401鍾志恆/綜合外電報導

OpenAI推模擬真人語音技術

開發Voice Engine生成式AI,引發外界對深偽疑慮,暫不廣泛對外開放

image
OpenAI宣布已開發一項生成式AI技術「Voice Engine」,只要簡短的真人錄音就能模擬出錄音者的聲音來說話。但由於所生成出來的模擬人聲真假難辨,再度引發對於「深偽」風險的疑慮。圖/美聯社

 AI新創公司OpenAI宣布已經開發一項生成式AI技術「Voice Engine」,只要簡短的真人錄音就能模擬出錄音者的聲音來說話。但由於所生成出來的模擬人聲真假難辨,再度引發對於「深偽」風險的疑慮,OpenAI暫沒有廣泛對外開放使用計畫。

新科技、新技術的開發日新月異,帶來無限想像的同時,也不斷挑戰人們的認知與法律法規邊線。例如,Voice Engine只要一段15秒語音樣本,就能複製出與錄音者相似度極高的說話聲音。加上文字輸入後,就能透過文字轉語音的技術,以模擬出來的錄音者聲音把文字內容說出來。

 這種經由AI合成出來的人聲,還能轉換成說出錄音者母語以外的其他外語,同時又能保留錄音者的口音和語調。

 OpenAI表示,這項AI技術可用來幫助那些因疾病或其他因素,導致說話有困難的人用自己的聲音講話。此外,企業也能在與外國公司接洽過程中,使用這技術把其資訊轉換成對方的語言來加強溝通。

 然而,Voice Engine模擬出來的真人聲音接近難以分辨程度,因此令人憂慮具備這功能的AI聊天機器人,可能會被有心人士在選舉或其他重要場合,用來做為散播虛假資訊的工具。

 就連OpenAI也承認,這種生成式模擬真人聲音的技術確實存在嚴重風險,尤其在重要選舉時會令人擔心出現虛假訊息的問題。由於有各種可能的風險,OpenAI目前暫時沒有對外廣泛地開放使用這技術的計畫。

 OpenAI表示,現階段仍須採取多項措施,以防止這項AI技術被不當使用。目前只會小規模地向部分企業提供Voice Engine應用,透過反饋來協助改進使用方法和安全等問題,並思考如何讓不同產業都能善加使用這AI技術。

 目前會被OpenAI提供試用的企業,包括線上教育公司Age of Learning、敘事視覺化平台HeyGen、健康資訊軟體商Dimagi、AI通訊app開發商Livox,以及健康系統商Lifespan。