人形機器人新創公司Figure創始人二次創業,攜1億資金創辦AI實驗室Hark
估值390億的Figure之外,CEO再投1億美元佈局AI實驗室。近日,機器人初創公司Figure AI的首席執行長佈雷特·阿德科克( Brett Adcock)宣佈成立全新AI實驗室Hark,並個人出資1億美元作為啟動資金。這項消息源自Adcock於周四向Figure員工和投資者傳送的內部備忘錄,隨即在科技界引發廣泛關注。作為同時執掌兩家核心企業的掌舵人,Adcock將在繼續擔任Figure CEO的基礎上,帶領Hark開啟 AI 領域的新探索。根據備忘錄,Hark的核心願景是打造「以人為本」的AI系統,使其具備主動思考、遞迴式自我最佳化與深度人文關懷的能力,從而開闢一條不同於現有技術路徑的新方向。值得關注的是,該實驗室的首個圖形處理器(GPU)叢集已於周一上線,但具體規模尚未對外披露。Hark的創立並非個例,它反映出當前AI產業一個新動向:越來越多新創公司的CEO在深耕原有業務的同時,開始佈局新的技術戰場。先前有報導稱,搜尋引擎公司You.com的CEO Richard Socher也在籌備一個新的AI實驗室,並尋求10億美元融資。這類新興機構被業界稱為「新實驗室」(neolabs),近期已累計吸引數十億美元資金。「新實驗室」的核心目標,是探索OpenAI、Anthropic等大型AI企業可能忽略的研究路徑與模型架構,試圖在主流技術之外尋找突破點。儘管這些行業巨頭已坐擁數十億美元的收入規模和成熟的技術體系,但「新實驗室」以其靈活的機制、創新導向的研究和資本加持,正逐漸成為推動AI發展的重要力量。Adcock創立的Figure AI本身已是業界矚目的明星企業,累計融資近20億美元,投資方包括Parkway Venture Capital、輝達(Nvidia)、微軟(Microsoft )以及貝索斯探險基金( Bezos Expeditions)等知名機構,最新估值高達390億美元。這次他個人投入巨資創辦Hark,既是其在AI領域的二次創業,也彰顯了他對前沿技術探索的持續承諾。(左)輝達創始人兼CEO黃仁勳(Jensen Huang)與(右)Figure創始人佈雷特·阿德科克(Brett Adcock)(圖片來源:X@adcock_brett)無論是堅守本業的CEO開闢第二戰線,還是新興實驗室瞄準巨頭的技術盲區,這場創新浪潮的核心敘事,始終圍繞著如何讓AI更貼近人、更理解人、更服務於人而展開。頂尖人才與雄厚資本正以前所未有的濃度匯入AI創新領域,產業的競爭強度與技術演進速度正同步提升。 (創新觀察局)
Scaling Law沒死! Gemini核心大佬爆料,Google已有顛覆性金鑰
Google大模型將迎顛覆升級! Gemini負責人爆料:長上下文效率與長度雙重突破在即,注意力機制迎來驚人發現。 Scaling Law未死,正加速演變!Google又要有重大突破了?最近,Google DeepMind的Gemini預訓練負責人Sebastian Borgeaud在採訪中給出重磅爆料——未來一年,大模型預訓練領域將在「長上下文處理效率」和「上下文長度擴展」兩大方向迎來重大技術創新。同時,Google Gemini三巨頭——Jeff Dean、OriolVinyalsML和Noam Shazeer罕見同台了,他們的對話中,跟Sebastian的內容展現出了驚人的一致。眾多高瞻遠矚、閃爍著智慧光芒的思想讓人深思。難怪,Google依然是那個巨人。Google大佬激動預言已破解大模型核心秘密Google DeepMind的Gemini預訓練負責人Sebastian Borgeaud在最近的訪談中表示,預計在未來一年內,針對提升長上下文處理效率以及進一步擴展模型上下文長度的預訓練技術,將會有重大創新。另外他還透露說,最近他們在注意力機制方面取得了一些非常有趣的發現,這可能會在未來幾個月內重塑他們的研究方向。對此,他表示非常興奮。而他提出了振聾發聵的一句話:Scaling Law並未消亡,只是正在演變!Sebastian Borgeaud是Gemini 3的預訓練負責人。這一次,是他首次接受部落格採訪,帶我們深入理解了Gemini 3背後的實驗室思維——變化究竟發生在那裡,為什麼現在的工作不再是“訓練模型”,而是建構一個完整的系統。Gemini 3背後:AI的未來正在加速到來一場意外的飛躍後,一個系統誕生了。「如果對自己誠實的話,我想……我們比我認為我們能達到的地方,走得更遠了。」坐在麥克風前的Sebastian Bourjou語氣平靜,但這句話卻像一顆投入湖面的石子,激起無限漣漪。為何Gemini 3會實現如此巨大的效能飛躍?Sebastian的回答看似很簡單:「更好的預訓練和更好的後期訓練」。然而,在這輕描淡寫的背後,卻是一個根本性的認知轉變。「我們不再只是在建立一個模型了,」他緩緩說道,「我認為,在這一點上,我們真正在建構的是一個系統。」而這,就是Gemini 3顛覆性進步的關鍵。人們常常想像,從一個Gemini版本到下一個版本,總有一些石破天驚的「秘密武器」。但Sebastian揭示的真相是:進步源於無數細微改進的聚合。是來自龐大團隊中,日復一日發現的那些「旋鈕」和最佳化。他還指出,AI發展範式正在經歷的潛在轉移:過去,我們彷彿擁有無限資料,可以隨意擴巨量資料集;而現在,我們正轉向一個「資料有限」體制。這意味著,未來的AI,必須學會更有效率地利用有限的資料資源,建構更複雜的系統工程。這也就是模型架構研究的核心價值。這一轉變,將迫使整個產業從「大力出奇蹟」的粗放模式,轉向「精雕細琢」的精細模式。未來的競爭焦點,將不再是「誰的資料中心更大」,而是「誰的學習演算法更有效率」、「誰的模型架構更優雅」、「誰能從有限資料中提取更多智慧」。而Gemini 3的大腦架構-混合專家模型MoE,代表了LLM發展的一條清晰路徑:從追求單純的「大」,轉向追求「大而高效,大而智慧」。AI的下一站——長上下文、高效檢索與「成本革命」展望未來幾年的技術前沿,Sebastian指出了激動人心的方向,它們將共同塑造下一代AI的能力和形態。1. 長上下文:從「短記憶」到「海量工作台」Gemini 1.5帶來的超長脈絡能力,已經是一場變革。 Sebastian預測,這方面的創新將持續加速。 「我認為未來一年左右,將在使長上下文更有效率、並進一步擴展上下文長度方面看到更多創新。」這不僅僅是“記住更多”這麼簡單。超長上下文將把模型變成一個真正的數字工作台:它可以同時載入整個程式碼庫、多篇科學研究論文、長時間對話歷史,並在其中進行連貫的分析、推理和創作。這為複雜的多步驟任務、深度研究和創作提供了前所未有的可能,是邁向更強大「智能體」的關鍵基礎設施。2. 注意力機制的進化Sebastian特別提到,在注意力機制上,「我們最近有了一些真正有趣的發現,我認為這將塑造未來幾個月的大量研究。」他對此「個人非常興奮」。這暗示著,被認為是當前大模型基石的注意力機制,仍有巨大的改進空間。更有效率、更強大或具備新特性的注意力機制,可能從底層顯著提升模型的理解、推理和計算效率,是推動性能邊界的重要槓桿。3. 檢索的回歸:讓模型學會「查資料」Sebastian早期曾主導「Retro」項目,研究讓模型在訓練和推理時檢索外部知識庫,而不是將所有知識死記硬背在參數中。他認為,這一方向遠未過時。「我內心深處相信,長期的答案是以可微分的方式學習這種能力。」這意味著,未來模型可能將檢索與推理更原生地結合,動態地從海量知識源中獲取資訊進行思考,而不是依賴後期「嫁接」的搜尋工具。這能讓模型更準確、更及時,並可能突破參數規模的知識容量限制。4. 效率與成本的「革命」一個日益凸顯的挑戰是:隨著使用者激增,模型的部署和服務成本變得至關重要。未來的研究將不再只追求性能峰值,還必須關注如何讓強大模型變得「便宜又好用」。我仍看不到盡頭採訪臨近尾聲,當我們把鏡頭拉回這位站在AI浪潮之巔的研究者本人時,Sebastian的回答透露著一種沈靜的樂觀與純粹的熱情。儘管探討了資料瓶頸、成本挑戰等現實問題,但Sebastian對AI進步的整體判斷依然充滿信心。「我已經多次提到這一點,但確實有如此多不同的事情會復合起來,還有許多有改進空間的方向。我現在真的看不到這類工作停止給我們帶來進步的任何盡頭。」這種信心並非盲目。它源於他作為一線領航者所目睹的:大量細微但確定的改進空間,以及整個領域尚未枯竭的創造活力。在他看來,至少在未來幾年,這種進步勢頭不會放緩。規模不再是神話 Noam Shazeer回歸後的第一桶冷水接下來,是Jeff Dean、Noam Shazeer、Oriol Vinyals三位大佬的對話。在會議中,我們能明顯感受到,Noam不再是那個把油門踩到底的激進派。他幾乎不主動談論「顛覆」,也很少用那些讓人血脈噴張的宏大詞彙。甚至一反常態,多次談到研發節奏、系統的穩定性,以及如何長期運作。作為Transformer的開創者,他曾經引領著大模型從無到有;現在,大模型一路高歌猛進,他卻停下來警告:大模型給出的答案太快,自我檢查的次數太少。他曾在公開場合反覆強調:現在的模型並不缺乏「聰明」,缺乏的是持續思考,並在複雜任務中反覆修正的能力。也就是說,大模型的規模依然重要,但它不再是決定一切的唯一變數。當Noam討論推理時,他明顯將重心從「能不能更強」移向了「能不能更穩定」。這是他回歸Google後,第一次在公開場合展現這種判斷。聽起來不像是否定過去,而更像是在承認一個事實:那條單純靠堆參數就能不斷前進的路,已經接近邊界了。頂級科學家的共識:一次高分,無法定義AI的未來Noam提到一個字:慢思考(Slow Thinking)。不只是簡單的放慢研發速度,而是反覆追問值不值、貴不貴、能不能被規模化複製。至此,智慧不再是一項抽象的能力,而是一項需要長期支付的工程開銷,需要和CPU、硬碟一起放進帳本裡討論。這一步一旦邁出去,許多過去衡量AI的標準,如Benchmark也慢慢失效。在整場會議中,三位頂級科學家沒有表現出對榜單的興奮,也沒有用「誰贏了誰」來定義進展。榜單擅長衡量瞬時表現,卻很難回答「能不能一直運行」這類長期問題。而Noam和Jeff反覆強調的,恰恰是後者:模型是否可靠、是否具備遷移能力、是否能在複雜任務中持續自我修正。這些能力,很難被壓縮成漂亮的數字。Gemini被當成System,而不是Model在這場對話裡,「System」出現的頻率極高,這顯然不是一種修辭。Noam和Jeff在描述Gemini時,刻意避開了「一個更強的模型」這種表述,而是反覆強調它是一個可以長期運行、不斷迭代的「系統」。「系統」和「模型」,聽起來差不多,但背後的邏輯天差地別。「模型」更像是一次性的成果,是在​​實驗室裡的瞬間表現;而「系統」更像基礎設施,它關心的是穩定性、可擴展性,以及在出現錯誤後能不能快速修復並繼續工作。對於Noam這類,極度強調架構設計、研發節奏和工程約束的人,天然會更在意一個系統能不能穩健地運行十年、二十年,而不是某一次響應速度有多快。在他們眼中,Gemini不是勝利者的獎品,而是一種「長期可用」的智慧形態。正因如此,整場對話沒有急於求成的產品宣發,沒有劍拔弩張的「對標某模型」。它更像是在對外強調:Google追求的不是曇花一現的成品,而是一套能重複使用、不斷進化的智慧工業體系。 (新智元)
神級更新! Gemini 直連NotebookLM,這才是真正的第二個大腦。
Google 昨晚又悄悄搞了個大動作。國外很多硬派玩家都在刷屏,稱之為「神級更新」。簡單來說:Google 終於把「最強腦」(Gemini)和「最強記憶庫」(NotebookLM)打通了。可能你還沒意識到這代表什麼。以前用AI,最讓我抓狂的是這種「割裂感」:Gemini 是個天才,但記性差: 它懂天文地理,能寫代碼畫圖,但它不知道你電腦裡那500 個PDF 到底寫了啥。而且聊太久,它就把前面的設定給忘了。NotebookLM 是個學霸,但太死板: 你丟給它一堆書,它能倒背如流。但它不能連網,不能畫圖,甚至不能幫你寫一段像樣的行銷文案。現在,它倆「在一起」了。這意味著你現在的AI 助手,不僅連接了互聯網,還隨身背著一座只屬於你自己的私人圖書館,而且它能瞬間讀完,並幫你工作。這玩意兒到底有多強?01. 實測:當AI 真的「讀懂」了你的資料光說不練假把式。為了測試它的極限,我準備了一個很硬核的課題——“人類為什麼要睡覺?”這個主題一直躺在我的NotebookLM 筆記本裡,有36 個資料,包括各種PDF 書、論文、幾十個網頁,還有一些Youtube 影片。👉 第一步:左腦邏輯-一鍵產生「高知感」文案現在的操作絲滑得不像話。開啟Gemini 的聊天介面,點選輸入框左邊那個小小的「➕」號,選擇NotebookLM。瞬間,我之前整理好的《我們為什麼要睡覺》筆記本就被直接「插」進了Gemini 的大腦裡。我下令:“結合我筆記本裡的資料,再搜尋一下今天網上的熱梗,給我寫一篇發佈在小紅書上的《熬夜補救指南》。”圖:載入NotebookLM 筆記本並結合網路資訊輸出很快,它就結合我的筆記本和網路上最新的資料,寫了一篇小紅書筆記。注意,這裡重點是結合網路上的最新資訊!👉 第二步:右腦視覺——NBP 模型手繪“爆款封面”文案有了,圖片怎麼辦?原來的NotebookLM 可沒辦法直接畫圖。現在,直接在Gemini 的對話裡面呼叫小香蕉就可以了。我直接說:根據前面的封面建議,產生一張高畫質封面圖,3:4圖:調用NBP 畫圖從文案到出圖,全程都沒跳出這個對話框。博主們現在可是太幸福了。圖:Gemini 裡面畫的封面圖👉 第三步:降維打擊-手搓“互動科普網頁”如果你以為到這就結束了,那你就太小看「神級更新」了。既然它懂知識、懂設計,為什麼不讓它直接做一個產品?我點開Canvas(畫布)功能,發了一條略微複雜的指令:根據這本筆記本裡的核心觀點,幫我寫一個HTML 5 響應式著陸頁,主題是『為什麼你必須睡夠8 小時』。要求:1、頭部: 用震撼的標語總結睡眠不足的傷害。 2.資料區: 從檔案中擷取3 個最嚇人的統計數據,用卡片形式展示。 3.互動: 寫一段CSS 代碼,做一個動態的'睡眠周期'可視化圖表。 4.風格: 深夜藍配色,極簡科技風。圖片:用Gemini 給一個筆記做網站不出所料,Gemini 很快就把一個專業的、甚至帶有動態效果的網頁生成好了。 (當然,也可以用這個方法產生PPT)這個功能只能在Gemini 裡面做,NotebookLM 即便再強,也沒辦法做這麼多。從一大堆各種類型的素材檔案,到產生一篇小紅書筆記、以及為這篇筆記做封面圖、甚至做一個可以上線的科普網站,全過程只花了不到5 分鐘。這種「知識變現」的速度,以前想都不敢想。02. 進階玩法:給你的AI 開個“外掛”如果你是像我一樣的重度用戶,剛才那些可能只是基操。下面這兩個隱藏玩法,才是這次更新真正的「殺手鐧」。🚀 玩法一:打破次元壁——同時掛載多個“大腦”NotebookLM 的老用戶肯定有個巨大的痛點:筆記本之間是隔離的。例如我有一個「2024 財報」筆記本,還有一本「2025 財報」筆記本,在NotebookLM 原生介面裡,我沒辦法把它倆合併起來分析,只能來回切,急死個人。但在Gemini 裡,這個限制被打破了!當你點擊那個「➕」號時,你可以同時勾選多本筆記本。 (最多到10 個)圖:Gemini 裡面插入多部NotebookLM 筆記本這意味著什麼?你可以將「行銷部調查」和「技術部檔案」同時餵給Gemini。它可以跨越你原本隔離的知識庫,進行全域關聯分析。一次性導入的資料量級直接起飛,只要你的Gemini 吞得下,多少資料都能往裡塞。💎 玩法二:Gems + 筆記本= 真正的“自動駕駛”這一點是我覺得最爽的。Gems(自訂AI 助理) 簡直是懶人福音。以前在NotebookLM 裡,我每次都要重新寫一長串提示詞:「請你扮演一個專業的XX 編輯,語氣要XX,格式要XX...」。因為它不支援保存預設指令。現在?直接起飛。你可以把自己常用的工俱全部寫成Gems,例如:學術翻譯Gem: 預設好「直譯+意譯+術語解釋」的Prompt。公眾號寫手Gem: 預設好「爆款標題+痛點+情緒價值」的Prompt。然後,見證奇蹟的時刻來了:你點開這個Gem,直接掛載你的NotebookLM 資料庫。不用再說廢話,不用再調教。點擊一下,它就是一個「自備頂級寫作技巧(Gems)且熟讀你所有資料(NotebookLM)」的超級員工。以後做研究、寫文章,真的就是點兩下滑鼠的事。這才是把AI 用成了「外掛」的樣子。寫在最後Google 正在透過這次更新告訴我們:未來的AI 不只是一個陪你聊天的Bot,它正在變成一個可以掛載你個人知識庫的智慧體(Agent)。從今天開始,你的每一份PDF、每一個會議錄音、每一篇筆記,都不再是躺在硬碟裡吃灰的死數據。它們都可以成為AI 的“養分”,隨時準備為你提供洞察。如果你還沒試過,強烈建議現在就去NotebookLM 建造一個屬於你自己的知識庫,然後在Gemini 裡點擊那個「+」號呼叫它。相信我,那種「它真的懂我(的資料)」的感覺,會讓你對AI 的效率有全新的認識。 (AI範兒)
Lovart + Nano Banana Pro,這才是PPT 的王炸組合!
你是不是跟我一樣,最近為了找個好用的AI PPT 工具,快把市面上的產品試了個遍?一會刷到某個智能體,一會兒又是Gamma。前陣子很多人被NotebookLM 刷屏,我也跟著去湊了熱鬧。但講真,用下來總覺得差點意思。直到這兩天我試了這個工具,我敢說:真正的AI PPT 終結者可能真的出現了!廢話少說,直接看效果。這是我用它為《小王子》做的一份分享PPT:圖:Lovart 產生的PPT說實話,第一眼看到成品時我有點被驚豔到了。這種繪本感的視覺享受,無論是給老闆匯報還是做個人分享,拿出手的一瞬間,段位就拉開了,對吧?在PPT 這個塊,我一直有個「歪理」:視覺美感往往大於內容。因為如果第一眼抓不住人,內容再好也是白搭。這就是Lovart,它最硬核的地方:它不僅請來了Nano Banana Pro 這種等級的超強外援,還反手給它疊滿了'超級武器'的Buff。01|視覺美感:拒絕“AI 抽卡”,審美直接拉滿以前用AI 做PPT 像是在“抽卡”,出的圖能不能用全看運氣。但Lovart 輸出的畫面非常專業。就算你只是給個簡單的提示詞,它給出的視覺方案也完全在審美點上。例如我試過的第一種:國家地理史詩攝影。圖:Lovart 產生的國家地理史詩攝影風PPT說實話,出來的成品真的讓人歎為觀止,感覺每一頁都是一幀高品質的電影畫面,那種大片的厚重感和細膩質感,每一張圖都能直接拿來當壁紙。如果你想走年輕活潑的路線,可以試試下面這種孟菲斯多巴胺風格。圖:孟菲斯多巴胺風格PPT撞色大膽,充滿躍動感,這種視覺衝擊力極強的風格,相信會受到很多年輕人的喜歡,拿去做創意提案瞬間就能抓住眼球。當然,還有我們最親切的中國風。圖:中國風PPT這種水墨感一出來,高級感直接拉滿。它最牛的地方在於不只是堆砌素材,連文案都會跟著風格變,裡面甚至藏著「道法自然」、「安土重遷」這種哲學意境。是真的有靈魂。當然,不只是好看,這些內容的總結、提煉也都是由它自己完成的,可以說非常強大。看到這兒你可能會說:“這不都是Nano Banana Pro 的功勞嗎?Lovart 自己到底有啥亮眼的?”說實話,剛開始我也這麼想。但深度體驗之後,我發現自己錯了。正是因為下面這幾個「殺手鐧」等級的優勢,才讓我覺得它——而不是現在大火的NotebookLM——才是真正的AI PPT 終結者。02|40頁+長篇幅:終於不用再手動「續命」了很多朋友吹爆NotebookLM,它確實很牛,但有個致命傷:生成的PPT 不能超過15 頁。這對咱們打工人來說太難受了,一個稍微大點的匯報,15 頁那夠寫?Lovart 就大方多了,生成40 頁以上都完全沒有壓力。圖:Lovart 產生的30 頁PPT例如為這本書《智人之上》產生一個30 頁的讀書分享PPT,也就幾分鐘的事兒。所以說,對於咱們這種動輒要做幾十頁深度報告的人來說,Lovart 這種「量大管飽」的屬性真的太解壓了。再也不用為了湊頁數分好幾次折騰,這種一氣呵成的感覺,才是大項目該有的效率。03|全程可編輯:它是「活」的,不是死圖!這可能是我最想給Lovart 點讚的地方。NotebookLM 另一個讓我頭大的點是:產生的PPT 是「死」的,基本上就是一張張大圖。我真的因為它產生的一份PPT 文字有瑕疵,在PS 裡面摳了4 個小時。而Lovart 的所有元素都是可編輯的。文字寫得不滿意?直接改。佈局覺得擠?拖動一下。圖:Lovart 方便的修改文字和佈局它最神奇的是這個Touch Edit 功能。例如我覺得畫面裡的這張圖不錯,但想給人物換個圍巾顏色:圖:Lovart 的Touch Edit 功能這種指那改那的編輯,非常有效率,也非常完美:圖:透過TouchEdit 修改了圍巾顏色他甚至能換單頁的風格:圖:在Lovart 中修改單頁PPT 的風格一個簡單的提示詞:改成線稿風格,一頁PPT 就完美的改好了:圖:通過Lovart 風格修改前後的對比這種“掌控感”,才是AI 工具該有的樣子。關於這些高級玩法,我之前的文章裡有詳細教學,感興趣可以翻翻。04| 到底怎麼用?在Lovart 裡做PPT 簡單到什麼程度?頭腦空空時: 告訴它一個想法,它會自己聯網搜尋,幫你把邏輯和大綱都寫好。圖:僅透過提示詞來產生一份PPT材料一大堆時: 直接扔進一堆配件(支援多個PDF檔案哦),它能瞬間消化並吐出一份精美的PPT。圖:Lovart 根據附件來產生PPT我們在提示詞裡面可以簡單到一句話,也可以具體到規定頁數、風格、每一頁的內容。比如下面這樣:請基於《人類簡史》製作15頁的'新中式'意境風格PPT。 視覺風格: 東方禪意美學。採用水墨質感、宣紙背景紋理。色彩以黛青、硃砂紅、墨黑為主。裝飾元素使用留白、印章、遠山、雲紋。標題使用書法體,正文使用宋體。 內容大綱: > 用中國哲學的視角重新解讀:P1: 封頁(水墨意境);P2: 簡史總覽;P3-P5: 認知篇(道法自然與虛構世界);P6-P8: 耕織篇(農業的羈絆);P10-P12: 大同紀元(天下 3:P4);歸宿:天人之際的思考。 要求: 文案風格帶有一點詞章氣息,優雅而深邃。出來的效果,真的會讓你覺得它是有「靈魂」的。One More Thing:拯救「丑PPT」的終極殺手鐧最後,必須分享一個大驚喜:Lovart 還能直接修改現有PPT 的風格!很多時候我們手上已經有一份內容改了80 遍的匯報稿,但排版實在太「班」了,沒法拿去見大老闆。這個時候,你只需要把這份PPT(PDF 格式)丟給Lovart,然後告訴它:“幫我把這份策劃案改成賈伯斯最愛的Apple Keynote 風格。”圖:現有的「丑」PPT瞬間!那種土裡土氣的PPT 就變身成了高級感十足的發佈會現場。圖:Lovart 一句話改之後的PPT這個功能,真的能幫大家在年底匯報裡省下大把的掉髮時間。最後的話說實話,AI 工具層出不窮,但我一直在找那種「懂人心、有審美、不給使用者添麻煩」的產品。Lovart 這種強大的Agent 邏輯+ Nano Banana Pro宇宙級的生圖能力+ 極高的編輯自由度,目前看來,確實是AI PPT 圈子裡的最佳解決方案了。眼看就到年底了,復盤會、年度計畫、總結匯報都在路上了吧?別再為調格式、找素材這種瑣事熬到凌晨了。還猶豫啥?這種「降維打擊」的神器,趁現在知道的人還不多,趕緊去試試,驚豔一下你的同事們:👉 http://lovart.ai (建議收藏備用)對了,說到AI 生圖,這兩天OpenAI 的GPT Image 1.5也已經上線到Lovart 了。 (AI範兒)
全球首顆2nm晶片:正式發佈
三星Exynos 2600重磅發表:2nm一、全球首款2nm移動晶片周五,三星電子丟下行動半導體產業重磅炸彈-正式公佈業界首款2奈米製程智慧型手機應用處理器Exynos 2600的完整細節。這款承載三星頂尖半導體實力的晶片,不僅標誌著行動晶片正式邁入2nm新紀元,更以環繞閘極(GAA)架構為基石,在性能、AI、影像、散熱四大維度實現顛覆性突破,重新定義旗艦移動運算核心的技術天花板。作為智慧型手機的“超級大腦”,Exynos 2600由三星系統LSI部門傾力打造,代工廠全程保障GAA架構的精密製造,將直接賦能明年初發佈的Galaxy S26系列旗艦機型。基於最新Arm架構的10核心CPU配置堪稱豪華:1顆3.8GHz Cortex-C1 Ultra超級核心領銜,搭配3顆3.25GHz Cortex-C1 Pro性能核心與6顆2.75GHz Cortex-C1 Pro能源效率核心,形成「超高高性能+均衡能效」的黃金組合,整體運算效能較上一代暴漲39%。AI與圖形效能提升顯著:整合32K MAC NPU的AI引擎,使生成式AI負載性能翻倍;三星Xclipse 960 GPU加持下,圖形效能較Exynos 2500飆升100%,配合Kinetic Reality技術,光線追蹤效能提升50%,Exynos Neural Super Samplingling 技術讓遊戲流暢度上升影像能力拉滿:單攝最高支援3.2億像素CMOS及108MP@30fps連拍,雙攝64MP+32MP滿足專業需求;顯示與編解碼實力頂尖,支援4K/WQUXGA@120Hz高刷螢幕、8K編解碼,整合全格式編解碼器覆蓋影音場景。核心亮點在於,Exynos 2600首次在行動SoC中植入散熱路徑模組(HPB),採用高介電常數材料,熱阻最多降低16%,破解高階晶片散熱痛點。同時,作為首款2nm GAA智慧型手機晶片,其率先支援混合後量子加密保障安全,更將成為未來Exynos晶片基礎平台,奠定技術優勢。二、三星手機策略:半數S26機型搭載Exynos 2600量產落地,既是技術突破,也是三星重振自研行動處理器策略的重磅訊號。根據《韓國經濟日報》先前報導,三星計畫為Galaxy S26系列約半數機型配備該晶片,這是其自研晶片受挫後的激進反攻舉措。規劃顯示,韓歐市場Galaxy S26全系列(含Ultra版)將搭載Exynos 2600,美日中市場仍用高通驍龍。這種均衡分佈,意味著三星2021年後首次在旗艦Galaxy系列大規模部署Exynos晶片,標誌自研策略全面回歸。回溯歷史,2015年前三星旗艦Galaxy全用Exynos晶片,2016年開始轉向高通。2022年Galaxy S22系列Exynos晶片的散熱問題與低良率打擊消費者信心,加速轉向。去年起三星開啟自研回歸:Galaxy S24基礎版/Plus版搭載Exynos 2400,後續Galaxy Z Flip7(僅韓國銷售)搭載Exynos 2500,逐步重建信任。如今Exynos 2600量產與大規模搭載,是三星自研回歸的關鍵一步。這反映其對自身半導體能力的自信,也是重構行動晶片市場格局的重要舉措。憑藉2nm製程先發優勢,三星試圖重奪高階行動晶片話語權,扭轉被動局面。隨著Galaxy S26臨近,這場與高通的正面較量,將成2025年高階手機市場最大看點。(深科技)
AGI真相大揭密! DeepMind創辦人5個顛覆認知觀點,未來比你想像的更近
Google DeepMind共同創辦人、首席AGI科學家Shane Legg的分享五個觀點:🔮 觀點一:AGI不是“開關”,而是“光譜”——第一級已近在眼前我們總以為AGI是某天突然覺醒的“天網”,但Legg說,它更像一個漸進的光譜: 最低限度AGI:能完成普通人的所有認知任務(比如讀文件、寫郵件、做基礎分析)完整的AGI:能完成普通人的所有認知任務(比如讀文件、寫郵件、做基礎分析) 超級智慧ASI:全面超越人類Legg預測,2028年我們有50%的機率實現最低限度AGI。⚙️ 觀點二:超級智慧不是魔法,而是物理學的必然「人類智慧是宇宙上限嗎?絕對不是。」Legg從物理第一原理對比了人腦vs. 資料中心:能耗:大腦20瓦vs 資料中心 2億瓦訊號速度:大腦30公尺/秒vs 光速3億米/赫茲頻寬:大腦80v 大腦資料中心100億赫茲體積/重量:幾磅vs 數百萬磅機器在多個維度上領先6-8個數量級。所以,超級智慧的出現不是“是否”,而是“何時”。就像起重機比人力氣大、望遠鏡比人看得遠一樣——它只是物理規律的延伸。💼 觀點三:最危險的工作,可能是你現在羨慕的「菁英職業」如果AGI能完成認知任務,那麼最容易取代的不是體力勞動,而是高薪腦力工作。Legg給一個簡單判斷法則:如果你只用筆記型電腦+網路就能完成工作,那你的崗位正站在AI替代的最前線。🧠 觀點四:AI可能比人類「更道德」Legg提出「系統二安全」概念:系統一:直覺、快速反應(人類道德判斷常受情緒、偏見影響)系統二:慢思考、邏輯推理(AI可被訓練為純理性道德推理者)AI能嚴格、一致地執行複雜道德框架,不受情緒波動影響。Legg認為:AI在原則上可以比人類更道德,因為它能以「超人層次」進行倫理推理。🚨 觀點五:領域專家們,你們已經落後了Legg用一個鋒利比喻:現在就像2020年3月——流行病專家已拉響警報,大眾卻還在球場聚會。許多領域專家(法律、教育、經濟、醫學…)仍認為自己的行業“特殊且複雜”,AI短期無法深入。但他們評價AI的依據,往往是一年前的模型──而在AI領域,一年已是「古代史」。Legg緊急呼籲:所有業界專家,必須立刻開始嚴肅思考AGI對自身領域的衝擊。等它到來再反應,就太晚了。 (WhaleThink)
諾獎得主Hassabis:5-10年AGI將至,衝擊力將是工業革命10倍!
近日,在與數學家Hannah Fry的對話中,DeepMind CEO Demis Hassabis回顧了AI在過去一年的飛躍式進展,他談到了“參差智能”、持續學習、模型幻覺等邁向AGI過程中的關鍵挑戰,並提到AGI帶來的社會衝擊可能是工業革命的10倍。「過去一年,我們像是經歷了十年的發展。」近期,在與數學家Hannah Fry的對話中,DeepMind CEO Demis Hassabis如此形容他對過去一年最大變化的感受。DeepMind CEO Demis Hassabis(左)與數學家Hannah Fry(右)在播客中在Hassabis看來,過去一年,AI領域取得了十分驚人的變化。對於Google來說,發布了Gemini 3,在多模態能力取得了長足進步。此外,世界模型的進展也讓Hassabis非常興奮,這是他一直以來最熱衷的領域之一。Hassabis談到了通往AGI過程中存在的一些瓶頸難題,例如「參差智慧」的,持續學習能力的缺失等。他認為邁向AGI需要「50%的規模化+50%的創新」。距離AlphaFold 2面世已經5年,Hassabis談到目前DeepMind團隊正在探索材料科學、核融合等其他的可能性。「參差智能」的挑戰在對話中,Hassabis談到了通過AGI過程中的一些挑戰。例如,「參差智能」(jagged intelligences)的挑戰。AI能在國際數學奧林匹克競賽中摘金奪銀,卻會在高中數學題目上犯一些非常低階的錯誤。Hassabis認為,這正是我們邁向AGI的一個瓶頸問題:「一致性」或「參差智能」(jagged intelligences)。在他看來,「參差智能」出現的原因有各種理論解釋和不同的原因,具體到不同情況,可能在於圖像被感知和Token化的方式。例如,有時它甚至無法辨識所有的字母。所以當你讓它數單字裡的字母時,它有時會出錯。這可能是因為它沒有看到每一個獨立的字母。此外,Hassabis也提到線上學習和持續學習的能力是當今AI模型所缺乏的,這同樣也是邁向AGI所不可或缺的重要能力之一。AGI需要50%的規模化加上50%的創新AI的競賽與加速發展模式,有時也會面臨許多「規模化最終會撞牆」「資料會耗盡」的質疑。Gemini 3發布後,在眾多基準測試中遙遙領先,似乎打破了這一質疑。對此,Hassabis坦言,可能會存在一些「收益遞減」效應,但他們在這個過程中其實從未真正遇到所謂的「牆」。他特別糾正了一種公眾誤解,即將「收益遞減」錯誤解讀為「零收益」,非黑即白:「在指數級增長與停滯不前兩種極端之間存在著廣闊的空間,而Google正處於這個中間地帶。」這也意味著不可能每次發布新版本,效能就在所有基準上翻倍。但Hassabis也強調自己並未看到任何放緩的跡象。談到「網路資料是否快被用盡」這個問題,Hassabis認為這可以透過使用合成資料來解決。「現在的系統已經夠強大,可以自己產生數據,尤其是在編碼和數學這類可以驗證答案的領域;從某種意義上說,你可以創造出無限的數據」。Hassabis也表示這些領域目前仍是研究主題,而這一直以來也是Google的優點:「我們始終堅持研究為先。Google一直擁有最廣泛、最深厚的研究團隊。如果回顧過去十年的重大進展,無論Transformer、AlphaGo、AlphaZero,都出自Google或DeepMind。」當賽道變得越來越難時,Hassabis反而覺得更加興奮。他認為這不僅需要世界一流的工程能力,還必須將其與世界一流的科學研究結合,而後者正是Google的專長。此外,最重要的一點Google還擁有世界級基礎設施的優勢,包括TPU和其他硬體。這些結合,使Google能夠同時在創新前沿和規模化應用上保持領先。「50%的精力用於規模化,50%用於創新,要最終實現通用人工智慧,這兩者缺一不可。」模型幻覺即使在Gemini 3這樣的前沿模型上,仍然能看到「幻覺」現象。Hannah問是否可以讓Gemini像AlphaFold一樣,為自己的答案給予一個置信度分數。Hassabis認為這個功能很重要,也是目前所缺少的關鍵環節之一:「我相信我們正在接近這個目標。模型越智能,它們就越『知道自己知道什麼』」。模型越可靠,我們就越能依賴它們某種形式的「內省」或更深度的思考,從而讓它們自己意識到對某個答案不確定。Hassabis表示,接下來我們需要研究如何透過訓練,讓它能夠將這種「不確定性」作為一個合理的答案輸出。他將目前的模型比作一個「說話不過腦子的人」,大多數情況下可能沒問題,但當遇到非常棘手的問題時,你希望它能停下來,審視一下自己要說的話,並作出調整。因此,需要引入「思考」和「規劃」的步驟,讓模型能回顧自己剛剛輸出的內容。世界模型除了AI,世界模型和模擬一直是Hassabis最熱衷的領域。他認為語言模型仍然缺乏對許多關於世界的空間動態、空間感知、物理接觸,以及我們所處的物理環境如何運作的力學原理的理解,這些通常是很難用語言描述的,也不會出現在文字語料庫中。如果我們希望機器人能夠真正運作,或者希望有一個能隨時陪伴你的通用助手,無論是在你的眼鏡上,還是手機上,在你的日常生活中提供幫助,你就需要這種對物理世界的深刻理解,而世界模型正是其核心。Hassabis談到聖塔菲研究所(Santa Fe Institute)所做的模擬社會動力學的實驗,讓智能體在設定了正確激勵機制的環境中運行足夠長的時間,它們可以「發明」出像市場、銀行等種種有趣的東西。他認為這些實驗很酷,也能幫助我們理解生命的起源和意識的起源,而模擬,則是實現這一目標最強大的工具之一。「你可以設定略微不同的初始條件,將模擬運行成千上萬次,然後以一種高度受控的實驗方式,去理解這些細微差別所帶來的不同結果。」Hassabis認為,精確的模擬將為科學帶來不可估量的福祉。避免「資訊繭房」Hassabis曾提到,建構AI不應以最大化用戶參與度為目標,以免重蹈社群媒體的覆轍。如何建構一個既能將使用者置於其個人世界的中心,又不至於為他們創造出一個「單人回音室」的AI?Hassabis表示目前已經看到了過度「諂媚」或迎合使用者的AI所帶來的後果,它們會形成「回音室」效應,對個人產生非常負面的影響。Gemini正在透過發展出一套關於AI「人格」設定的科學方法來解決這個挑戰。Hassabis帶領了一個團隊來負責這項工作,希望塑造一種近乎「科學家」的個性:它溫暖、樂於助人,但同時又言簡意賅、切中要點;它會以友好的方式,對那些不合邏輯的觀點提出質疑,而不是盲目附和。Hassabis認為為模型「人格」設定標準,是讓大模型走向科學研究的重要關鍵。模型會有一個出廠的「基本人格」,每個使用者可以根據自己的偏好進行個人化設置,例如更幽默或更簡潔。但其核心的基礎人格是不變的,它始終致力於遵循科學方法。工業革命對AI變革的啟示Hassabis近期研究了許多關於工業革命的歷史,他認為這有助於幫助我們應對即將到來的社會變革和衝擊。工業革命為人類帶來了難以置信的進步,例如現代醫學、物質豐富、現代交通等。同時也帶來了巨大的挑戰,不同時期,不同產業的勞動力都經歷了被取代的陣痛,但沒有人會想回到前工業時代。而AI帶來的改變的規模可能是工業革命的十倍,而其發生的速度也可能快十倍,或許將在十年內展開,而非一個世紀。在Hassabis看來,透過學習那段歷史,提前預見這次改變可能帶來的社會錯位,有助於我們更早、更有效地去緩解它們。就像工業革命徹底改變了農業社會的工作模式一樣,至少同等規模的改變將再次發生。因此,Hassabis認為我們可能需要新的經濟體系和模式來幫助社會轉型。圖靈機的終極問題Hannah Fry:超越通用人工智慧,邁向人工超級智慧(ASI)的階段,您認為是否存在某些事情是人類能做到,而機器永遠無法企及的?Demis Hassabis:這正是那個終極問題,又回到了我最愛的話題之一圖靈機。Hassabis認為,如果成功建構了AGI,並用它來模擬人類心智,並將其與真實的心智進行對比,就能發現其中的差異,以及人類心智中那些獨特且無法被取代的東西。其中那些是可計算的,那些是不可計算的,目前存在許多假說,但這最終都歸結於圖靈機的問題:圖靈機的能力極限究竟在那裡?自從瞭解到圖靈和圖靈機以來,這個問題一直是Hassabis人生的核心問題,令他著迷,也是他的核心熱情所在。他所做的一切,都在某種程度上不斷拓展著圖靈機能力的邊界,包括破解蛋白質折疊。但他並不確定這個極限在那裡,這又回到了心智的問題:它完全是經典計算嗎?還是說有其他機制在運作?「如果現在非要我猜,我會賭是後者,而我正基於這個假設在工作,直到物理學證明我錯了。」Hassabis十分推崇康德(Kant)的一個觀點-現實是心智的建構。「所有這些感覺,包括光、溫暖、觸感,它們透過我們的感官輸入。歸根結底它們都是資訊。而我們,就是資訊處理系統。」Isomorphic Labs的創辦正是基於這樣一個理念。他們將生物學視為一個訊息處理系統,相信最終能治癒所有疾病。目前AI都不具備意識,AGI可能需要5-10年Hassabis從小便對生命的意義、意識的本質、以及現實本身到底是什麼這類宏大的問題著迷。一直指引他並讓他始終保持熱情的,是理解我們周圍的世界。對他來說,AI就是一個推動人類知識進步,幫助他實現這一目標的終極工具。2025年4月,Hassabis在接受CBS 《60 Minutes》節目採訪時表示,目前的人工智慧系統在任何真正意義上都不具備自我意識或意識。Hassabis接受CBS《60 Minutes》節目採訪當CBS 《60 Minutes》主持人Scott Pelley問他,「你們現在是否在研究一種可能具有自我意識的系統」時,Hassabis表示,在他看來,如今的系統都不具備自我意識,也談不上真正的意識。Scott Pelley又問他是否會將打造有自我意識的系統當作目標。Hassabis回答,這並不是一個明確的目標,但它可能會以一種隱含的方式發生。例如,這些系統有可能獲得某種「自我意識的感覺」。他表示讓系統理解「自我」和「他者」是非常重要的,而這可能正是自我意識的起點。但Hassabis也提到,即使機器真的獲得了自我意識,人類未必能辨識出來。Hassabis談到了他對AGI的時間表,他認為可能在未來5到10年內實現。 (新智元)
圍牆倒塌前夕:iOS 與Android 迎來“世紀大和解”
在科技界的歷史上,如果要選出兩個最涇渭分明的陣營,非iOS 與Android 莫屬。喬布斯當年立下的「圍牆花園(Walled Garden)」策略,不僅成就了蘋果兆美元的市值,也讓這兩個操作系統之間豎起了一道看不見的高牆。圖源:不客觀實驗室然而,2025 年底的這個冬天,牆體出現了巨大的裂縫。隨著Google Pixel 10 系列率先宣佈打通與Apple 裝置的AirDrop 協議,緊接著iOS 26.3 Developer Beta 1 的發布,蘋果正以前所未有的姿態向Android 開放。iOS 26.3 的「反向移民」如果你是資深的iPhone 用戶,你一定熟悉「遷移到iOS」這款Android 應用程式。圖源:不客觀實驗室多年來,它一直是蘋果從Android 陣營吸納使用者的利器。但在iOS 26.3 中,蘋果做了一件在五年前不可想像的事情——它在系統底層鋪設了一條「通往Android 的高速公路」。在最新的開發者預覽版中,當我們點開那個熟悉的「設定」-「通用」-「傳輸或還原iPhone」頁面時,除了原本的重設選項,赫然出現了一個新的入口:「傳輸至Android」。圖源:不客觀實驗室這項功能的完成度極高,不同於以往需要藉助網盤或第三方換機助手的繁瑣操作,iOS 26.3 的這一功能是系統級的。它不僅能遷移照片、影片和通訊錄,更核心的是,它打破了應用和私有格式的壁壘。iOS 的備忘錄可以直接轉換為Android 可讀的富文字(RTF)格式;iMessage 中的部分富媒體訊息也能透過標準化協議匯出。甚至,它能識別用戶已安裝的iOS 應用,並在傳輸過程中產生Android 版本的匹配列表,在目標手機上自動引導下載。配合Google Pixel 10 系列最新的互聯協議,這種傳輸幾乎是AirDrop 體驗的複刻:不需要數據線,不需要復雜的配對碼,僅僅是簡單的「握手」確認,數據流就開始在兩個曾經老死不相往來的系統間奔湧。這種體驗的改變是顛覆性的。它意味著用戶跨平台切換的「痛苦指數」從10 級直接降到了1 級。蘋果似乎不再透過「鎖死資料」來留住使用者,而是被迫開始透過服務體驗來透過真正的產品力決勝負。解開「困」在手腕上的自由如果說手機資料的互通是預料之中的妥協,那麼iOS 26.3 引入的「通知轉發(Notification Forwarding)」功能,則是對穿戴式裝置市場的一次重磅炸彈。長久以來,Apple Watch 之所以能佔據全球智慧手錶市場的半壁江山,很大程度上依賴它與iPhone 獨佔的API 介面。其他無論是國產手機廠商的智慧手錶還是還是高階運動大廠的智慧表,連接到iPhone 上時,往往只能淪為半殘:訊息只能看不能回,連接也極不穩定。但在iOS 26.3 中,蘋果引入了「通知轉發」的新設定。此設定允許使用者將系統層級的通知串流,透過標準藍牙協議(Standard Bluetooth Protocol)轉發給非Apple Watch 裝置。圖源:不客觀實驗室這意味著什麼?這意味著你未來可以在Android手錶上直接回覆iPhone 的微信;意味著佳明的使用者在戶外跑步時,不再需要因為擔心漏接電話而被迫攜帶兩台手機。這項改變徹底擊碎了Apple Watch 的護城河。對於那些因為喜歡圓形錶盤、需要超長續航或特定運動功能而不得不忍受Apple Watch 的iPhone 用戶來說,選擇權終於回到了自己手中。房間裡的大象:DMA 與被動開放蘋果是自願推倒這堵牆的嗎?顯然不是。庫克時代的蘋果,最擅長的就是商業利益最大化。主動放棄生態壁壘,不但不符合蘋果的商業邏輯,更違背了其軟硬一體的控制慾。這一切的推手,依然是那個讓矽谷巨頭們頭疼不已的名字——歐盟委員會。就在上周,海外媒體Macrumors 轉發了歐盟委員會發布了一份措辭嚴厲的聲明,指出蘋果和Google 必須設計並實施新的資料轉移系統,以符合歐盟《數字市場法案》(DMA)中關於「資料可移植性」和「互通性」的規定。DMA 的核心精神在於:資料屬於使用者,而非平台。既然資料屬於使用者,那麼使用者就有權以最方便的方式,將自己的資料從A 平台帶到B 平台。蘋果先前雖然提供了資料匯出工具,但流程繁瑣、格式封閉,實質上構成了對使用者遷移的阻礙。而iOS 26.3 的「傳輸至Android」功能,正是對此法規的直接回應。 Google Pixel 10 系列能夠打通AirDrop 協議,也是基於相同的法規邏輯:標準化的近場通訊協議必須對競爭對手開放。這不禁讓人想起幾年前的USB-C 介面之爭。當年的蘋果也是在歐盟的強力施壓下,才不情不願地放棄了Lightning 介面。如今,歷史正在軟件層面重演。不同的是,這次涉及的不僅是充電線,而是作為蘋果核心資產的使用者資料和生態黏性。國產手機廠商從「駭客」到「正規軍」對國產手機廠商而言,iOS 26.3 的這一變化無疑是天降甘霖。在過去的幾年裡,vivo、OPPO、小米等廠商為了打破蘋果的護城河,可謂是絞盡腦汁。無論是vivo 的「互傳聯盟」,還是小米的「跨螢幕協作」,都在嘗試透過安裝第三方App 或利用系統漏洞的方式,實現與iPhone 的資料互通。圖源:小米圖源:不客觀實驗室但這些方案往往有體驗上的硬傷:連接不穩定、後台易被殺、傳輸速度受限。本質上,它們是在像“駭客”一樣攻擊iOS 的壁壘。而現在,iOS 26.3 主動打開了大門。這對於正在衝擊高端市場的國產Android手機來說,消除了最後一道「因為生態不得不買iPhone」的顧慮。蘋果失去了什麼,又贏得了什麼?當離開iPhone 變得容易,那些對訊號、充電速度、AI 功能不滿意的使用者,會毫不猶豫地嘗試Android旗艦。但從長遠來看,這或許是蘋果不得不走的一步“險棋”,甚至可能帶來意想不到的生命。首先,競爭將回歸產品本質。當生態捆綁不再是決定性因素,蘋果必須重新審視iPhone 的硬體創新。這會倒逼蘋果在折疊螢幕、散熱、信號以及Siri 的AI 化上投入更多精力,而不是躺在iOS 的功勞簿上擠牙膏。其次,服務收入的擴張。蘋果早已不是單純的硬體公司。 Apple Music、Apple TV+、iCloud 都是跨平台的搖錢樹。當iOS 更加開放,意味著蘋果的服務可以更容易滲透到Android 裝置中。如果有用戶換了Android 手機,但他依然訂閱Apple One,依然使用Apple Music,這對蘋果來說,利潤損失並沒有想像中那麼大。最後,是反壟斷壓力的釋放。主動(或半被動)地拆除圍牆,能讓蘋果在面對全球監管機構時擁有更多的談判籌碼,避免像Google 那樣面臨被分拆的風險。對於消費者而言,這是一個最好的時代。無論你手持的是iPhone 還是Android,你會第一次擁有真正的選擇自由。裝置間的物理隔閡正在消融,而這,正是萬物互聯原本該有的樣子。 (不客觀實驗室)