期待本週AI盛宴!輝達將發飆!蘋果已經與OpenAI達成協議,週一發布超強GPT


OpenAI將於5月13日週一舉辦發布全新的產品。但卻對到底要發布什麼閃爍其詞。先前網友猜測的GPT-5或AI搜尋引擎都被否定。

CEO奧特曼推文表示:

不是GPT-5,也不是搜尋引擎,但我們一直在努力開發一些大家會喜歡的新東西!對我來說,它就像魔法一樣。


這個神祕的新產品到底是什麼?媒體引述兩位知情人士說法稱,新產品是具備視覺和聽覺功能的AI模型,且具有比目前的聊天機器人更好的邏輯推理能力。

一個有視覺和聽覺的全新多模態AI

報導稱,OpenAI最快可能會在下週一公開展示新產品,以搶在下週谷歌的一系列產品發布之前。

奧特曼希望最終能開發出一種類似電影《她》中的AI助理那樣能夠快速響應的人工智慧,並以這種技術支援蘋果Siri等現有語音助理。

蘋果已經與OpenAI達成協議,將在iOS 18中使用後者的技術,強化Siri的功能。


這意味著什麼?

截止2024年,全球共22億台蘋果ISO設備,如果都加入ChatGPT,意味著OpenAI的算力一定支撐不住,OpenAI被迫繼續買入數十萬個輝達的GPU去支撐22億人使用ChatGPT。

蘋果蘋果公司軟體工程高級副總裁Craig Federighi和分管人工智慧業務的副總裁John Giannandrea去年曾花費數週時間測試ChatGPT,隨後意識到相比領先的生成式人工智慧技術,Siri“看起來已經過時了”

根據一位曾在Siri團隊工作過的工程師對媒體表示,Siri團隊未能獲得蘋果內部其他團隊所獲得的關注和資源,公司的軟體和硬體等部門獨立運作,共享的資訊有限。但人工智慧產品要取得成功,就必須與產品深度融合。

2011年推出的Siri還未曾有重大迭代,她不支援多輪對話,也常常無法理解用戶的請求。甚至連基本的點歌都常常出錯,也削弱了蘋果智慧音箱HomePod的吸引力。

不過,在測試過ChatGPT之後,蘋果就進行了“十多年來規模最大的重組”,將資源集中在AI方向。今年年初取消蘋果汽車專案後,大部分工程師都轉職到了AI團隊。據報導,蘋果用於迭代Siri的研發經費高達每天數百萬美元。

蘋果高層認為,ChatGPT等聊天機器人背後的大語言模型技術可以增強Siri的能力。蘋果已經與OpenAI已經達成協議,將在全新作業系統iOS 18中引進ChatGPT技術。蘋果也在和谷歌進行談判,可能也會引進其LLM,不過協議尚未敲定。

新Siri將透過邊緣運算技術運行成本更低速度更快

iPhone目前佔據全球智慧型手機利潤的85%,銷售額超過2,000億美元,令無數消費性電子硬體生產商艷羨慕,也吸引了許多挑戰者。

包括Humane Ai Pin、Rabbit R1等全新AI硬件,都宣稱擁有挑戰iPhone的潛力。雖然這些設備眼下對iPhone不具備什麼威脅,不過蘋果內部擔心,隨著大模型技術的發展、其他智慧型手機製造商將更多AI元素融入其作業系統,讓iPhone顯得「一塊笨磚頭」。尤其是可以自動完成製定旅行計劃、打車、訂餐等複雜任務的被稱為「代理」(agents)的AI技術,其智能和便捷性,可以讓蘋果AppStore裡的許多軟體黯然失色。

目前來看,蘋果不打算直接發布全新的聊天機器人與ChatGPT、Claude等競爭。根據媒體報導,蘋果專注於讓Siri更好地處理用戶請求,包括設定計時器、創建日曆事件和向雜貨清單添加物品等,全新的Siri或許還可以總結短信內容,一鍵創建GIF圖片等等。

此外,蘋果的技術路徑與其他聊天機器人有一點非常重要的不同——新版Siri將基於邊緣運算技術而非雲端運算,即無需聯網就能理解上下文、完成對話,響應速度更快,也不需要昂貴的資料中心成本。

也因此,蘋果將升級今年iPhone的內存,以支援全新的邊緣人工智慧運算。

OpenAI已經有了可以轉錄音訊和將文字轉換成語音的軟體,但這些功能是透過單獨的AI聊天機器人實現的,而新產品則將這些功能整合在了一起,而且能夠更好地理解圖像和音頻,反應速度也更快。

OpenAI認為,具有視覺和聽覺功能的助理有可能像智慧型手機一樣帶來改變。它可以觀察使用者所處的環境訊息,提供建議,潛在的用例如充當家庭教師、翻譯標誌、修理汽車等等。

新模型暫時無法在個人設備上運行最終會免費開放給所有用戶

由於新模型較為複雜,參數量級高,個人設備的配置暫時無法滿足其效能需求。

媒體分析指出,新模型運行依賴雲端,需要網路連線才能運作。要讓具有視覺和聽覺功能的複雜人工智慧對話變得足夠小巧,以便在手機等個人設備上運行,可能需要幾個月甚至幾年的時間。

目前也沒有消息透露OpenAI何時會提供這些功能給付費用戶。不過根據一些企業的預覽來看,OpenAI的新模型可以改善其服務中已有的功能,例如自動客戶服務代理。一位知情人士對媒體表示,新軟體的音訊功能可以幫助客服人員更好地理解來電者的語音語調。

此外,媒體也稱,OpenAI希望新模型最終能免費開放給所有用戶使用,因此需要讓其運行成本低於目前的最強大模型GPT-4 Turbo。

我們敬請期待下週AI盛宴! !