20240401・鍾志恆／綜合外電報導

OpenAI推模擬真人語音技術

開發Voice Engine生成式AI，引發外界對深偽疑慮，暫不廣泛對外開放

　AI新創公司OpenAI宣布已經開發一項生成式AI技術「Voice Engine」，只要簡短的真人錄音就能模擬出錄音者的聲音來說話。但由於所生成出來的模擬人聲真假難辨，再度引發對於「深偽」風險的疑慮，OpenAI暫沒有廣泛對外開放使用計畫。

新科技、新技術的開發日新月異，帶來無限想像的同時，也不斷挑戰人們的認知與法律法規邊線。例如，Voice Engine只要一段15秒語音樣本，就能複製出與錄音者相似度極高的說話聲音。加上文字輸入後，就能透過文字轉語音的技術，以模擬出來的錄音者聲音把文字內容說出來。

　這種經由AI合成出來的人聲，還能轉換成說出錄音者母語以外的其他外語，同時又能保留錄音者的口音和語調。

　OpenAI表示，這項AI技術可用來幫助那些因疾病或其他因素，導致說話有困難的人用自己的聲音講話。此外，企業也能在與外國公司接洽過程中，使用這技術把其資訊轉換成對方的語言來加強溝通。

　然而，Voice Engine模擬出來的真人聲音接近難以分辨程度，因此令人憂慮具備這功能的AI聊天機器人，可能會被有心人士在選舉或其他重要場合，用來做為散播虛假資訊的工具。

　就連OpenAI也承認，這種生成式模擬真人聲音的技術確實存在嚴重風險，尤其在重要選舉時會令人擔心出現虛假訊息的問題。由於有各種可能的風險，OpenAI目前暫時沒有對外廣泛地開放使用這技術的計畫。

　OpenAI表示，現階段仍須採取多項措施，以防止這項AI技術被不當使用。目前只會小規模地向部分企業提供Voice Engine應用，透過反饋來協助改進使用方法和安全等問題，並思考如何讓不同產業都能善加使用這AI技術。

　目前會被OpenAI提供試用的企業，包括線上教育公司Age of Learning、敘事視覺化平台HeyGen、健康資訊軟體商Dimagi、AI通訊app開發商Livox，以及健康系統商Lifespan。