外媒引述消息報導,OpenAI將於13日發表大會推出具備視覺與聽覺功能的人工智慧(AI)語音助理。該AI助理擁有更強的邏輯推論能力,且能夠協助自動化客服判別諷刺語言,恐成為Google助理與其聊天機器人Gemini的最大威脅。
市場稍早盛傳,OpenAI將搶在谷歌年度I/O開發者大會14日登場前推出AI搜尋引擎,而這將對於谷歌核心業務帶來直接威脅。鑒於OpenAI聊天機器人爆紅速度極快,外界認為這恐怕是谷歌搜尋數十年來面臨的首次重大威脅。
但OpenAI執行長奧特曼(Sam Altman)打臉媒體說法。他在社群平台X發文表示,OpenAI在13日發表產品並不是GPT-5,也不是搜尋引擎,而是「宛如魔法」的新作。OpenAI官方亦證實,當日將更新ChatGPT與其最新版模型GPT-4。
外媒引述消息報導,OpenAI在13日活動可能宣布推出「多模態」(Multimodal)數位助理。這意味著:AI可以處理多種輸入形式,不僅僅是文字而已。這個AI助理據傳能夠連結相機,處理現實世界的資訊,然後以語音方式向你回報它看到的訊息。
舉例來說,你可以將相機對準不同語言的標誌,並要求ChatGPT為你辨識與翻譯,然後AI會透過對話回覆給你。
事實上,Google助理與Google Gemini早已具備類似功能;而ChatGPT也可以做到這一點,但目前無法透過單一介面達成。
OpenAI在13日可能宣布升級GPT模型並納入最新功能,透過影像輸入與聲音輸出提供更快、更準確的回應。奧特曼最終目標是打造出類似電影《雲端情人》(Her)裡面的實用AI助理。
消息人士表示,這款AI助理不僅能與使用者對話、辨識物體與圖像,還具備「更好的圖像與聲音理解能力」。它可以做到AI助理目前還無法做到的事,包括指導論文寫作、解決數學問題與偵測諷刺語言等。