官方認證
RexAA
全球科技產業觀察者
AI創業最怕的一件事:把噪音當訊號|微軟 CTO Kevin Scott
Kevin Scott:“長期記憶”是AI創業最被忽視的機會2025 年 12 月 19 日,舊金山。矽谷創業社區 South Park Commons 的一場對話中,微軟 CTO Kevin Scott 聊職業拐點、與 OpenAI 合作、AI 時代更值錢的問題為什麼總被忽視。整場對話 56 分鐘,話題從創業試錯,一路聊到開源與閉源。他最關鍵的一句話是:AI 創業最怕的,不是技術落後,而是把“噪音”當訊號。什麼是噪音?看起來像積極訊號,但對你做的東西沒有價值,而且沒有關係的資訊。 媒體熱度、投資人興趣、技術熱詞,這些訊號容易獲取、容易量化,但可能正在把你引向錯誤的方向。這篇文章講四件事:第一, Kevin 如何學會識別正確的訊號。第二,今天的創業者面對什麼樣的環境。第三, ChatGPT 為什麼成功。第四, 如何識別被忽視的真實訊號。第一節|放棄有趣的技術,選擇值得做的事Kevin Scott 原本想當一名大學教授。博士期間他研究動態二進制翻譯,技術含量極高,但他後來放棄了。原因很簡單:這事除了我,幾乎沒人在意。他說:我花了大量時間研究這些最佳化方法,能提升系統幾個百分點性能。寫論文、被引用、繼續寫論文……然後呢?在學術界,這就是標準路線。但在真實世界裡,這些百分比的提升沒有任何意義。Kevin 第一次意識到:學術界的評價標準,和真實世界的價值判斷,根本不是一回事。學術界看重論文數量、引用次數、同行認可,這套機制清晰、容易量化。但真實世界在意的是:有多少人因此受益?產生了多大價值?這兩套標準不一致,甚至是衝突的。於是他從學術界出來,進入Google。他做的第一個項目,是廣告稽核流程的自動化。這事聽起來一點也不酷。Kevin說:其實就是做一套自動過濾規則,判斷廣告文案能不能用驚嘆號、有沒有成人內容。但這個問題值錢。每天 5000 萬美元的廣告被卡住,人工稽核處理不過來。就這麼點改動,最終每年幫 Google 省了近 10 億美元。這讓他得到創始人獎。從那時起,他確定了一條職業準則。做每一件事,第一眼先看它有沒有可能產生真正的影響,其次才是技術有多有趣。他說,人生是從放棄最複雜的技術,轉向最有價值的工作開始的。這是他第一次識別出正確的“訊號”。第二節|容易獲取的反饋,往往是噪音Kevin 20 年前做的那次選擇很簡單:學術界 vs 商業世界,二選一。今天的 AI 創業者面對的環境要複雜得多。現在做創業比過去任何時候都便宜。但也正因為便宜,試錯的人多了,噪音也就多了。什麼是噪音?他給出定義:看起來像是正反饋,但和產品價值無關的資訊。媒體熱搜、點贊數、風投的興趣,這些都可能是噪音。很多創業者依賴的這些訊號,恰恰也是最容易把你帶偏。因為這些訊號背後有自己的利益機制。媒體需要流量,選擇有話題性的故事。投資人看重多元的項目組合,對熱門賽道表現出興趣。技術社區追逐最新的模型、最大的參數量。但這些和有人願意為你的產品買單是兩回事。更麻煩的是,這些噪音還特別容易獲得。你發一條帖子,幾百個贊;寫一篇文章,上了熱榜;見幾個投資人,都說感興趣。你開始覺得方向是對的。但這可能只是說明:你踩中了一個熱門話題,成了轉發素材,而不是解決了真正的問題。很多創業者開始往熱門概念上靠:“我們是AI+教育”、“AI時代的瀏覽器”、“GPT時代的新筆記工具”……這些說法新穎、容易講,但不等於有人真正需要。Kevin 給了一個判斷方法:要分清楚兩件事。一件事是你希望它發生;另一件事,是它不管有沒有你都會發生。真正適合創業的,是後者。那麼,什麼才是真正的訊號?Kevin 用 ChatGPT 說明。第三節|當所有人卷模型,OpenAI在做什麼ChatGPT 上線時,用的是老模型。業內很多人都見過,Kevin 說,包括他自己在內,沒人想到它會成為爆款。那為什麼它成了?因為所有人在追一個訊號,OpenAI 在追另一個訊號。2022 年底,每個實驗室都在追逐容易量化的數字:更大的參數量、更高的benchmark、更先進的架構。但這些是噪音。OpenAI 關注的訊號是:普通人能不能零門檻使用互動是否足夠自然能否成為日常工具這些才是真實需求。ChatGPT 的改動極小:一套老模型,加上 RLHF,加上一個輸入框。技術上沒有任何突破。但它讓普通人第一次可以直接和 AI 對話,不需要任何技術門檻。Kevin 明確表示:“它不是我們見過最強的模型,但第一次讓 AI 直接進入了使用者生活。”在他看來,這類機會有三個特徵:技術能力已經夠了但沒人認真設計用法因為看起來太普通、太基礎、沒熱度而被忽略。這些機會不會出現在熱詞榜上,也講不出宏大的故事,但可能打開兆美元市場。關鍵是:如何識別這樣的機會?第四節|識別真實訊號的三個標準為此,Kevin 給出了三個判斷標準。標準 1 :看能力和使用的差距他說:現在不是 AI 不夠強,而是很多人不知道怎麼把它用好。這意味著什麼?意味著機會不在能力端,而在使用端。他舉了長期記憶的例子。現在大模型能對話,但記不住歷史。使用者每次都要重新交代背景,AI 像個永遠喝斷片的“實習生”。技術上能解決嗎?完全可以。只需要做資料管道、內容壓縮、歷史記錄。但沒人做。為什麼?因為這不會上論文,也拿不到媒體關注。。Kevin 說:很多人不願意做這件事,是因為它看起來像修修補補,不像創造。但這恰恰是真實訊號。因為使用者真的需要,技術能力已經夠了,只是沒人認真做。標準 2:看誰在製造噪音如果媒體在報導、投資人在追逐、大公司在佈局,這很可能是噪音。這就像 Kevin 20 年前的選擇:他做的是所有人覺得不夠酷的事,但恰恰解決了真實問題。今天同樣如此。已經有太多資源在追逐那些熱門賽道,你作為創業者很難勝出。真正的機會往往在被忽視的地方:大公司覺得太瑣碎、媒體覺得不吸引眼球、投資人覺得不夠宏大。正因為被忽視,競爭反而更小。標準 3 :做小實驗驗證Kevin說,做工具的成本已經非常低了。現在真正缺的,是願意動手的人。比如:讓 AI 記住使用者歷史。搭個簡單的上下文快取,看使用者是否真的需要。用現有工具搭建一個端到端流程。把 AI 對話、自動化工具、文件系統連起來,做一次完整閉環,看能不能真正替代人工。不寫 PPT,直接做互動原型。從產品體驗出發,而不是從概念包裝出發。現在是 AI 創業最好的時候,因為你可以不靠預測未來,只靠動手做個小實驗,就能找到好的方向。關鍵是分清噪音和真實訊號。你是追逐容易講的故事,還是解決真正的問題?結語|訊號比方向更重要Kevin Scott 說,他不追求快樂,只想做有意義的事。因為有意義的事,自帶清晰的訊號。20 年前,Kevin 只需要選擇:學術界還是商業世界。今天的創業者面對更複雜的環境:媒體熱度、投資人興趣、技術熱詞,那些是噪音?那些是訊號?Kevin 的方法是:不要靠判斷去猜,要靠行動去驗證。做工具的成本從未如此低,但噪音也從未如此多。找對訊號,比找對方向更重要。 (AI深度研究員)
Google DeepMind 通用機器人路線圖:VLM → VLA + Agent,“能幹活”的機器人跑起來了
Google DeepMind 的機器人團隊強調,他們做的不是預先編好動作、只會後空翻表演的機器人,而是面向現實世界的 開放式通用機器人。這類機器人需要能夠 理解人類自然語言指令,並且可以 靈活組合執行幾乎不限種類的任務,而不是只會重複固定指令碼。來源:AI工業(採用 AI 工具整理)相比四年前,實驗室形態也發生了明顯變化:依託 更加魯棒的視覺主幹網路(visual backbone),模型對光照、背景、雜亂環境的敏感度大幅下降,視覺泛化問題被解決了很大一部分,不再需要用隱私屏去“淨化”場景。來源:AI工業(採用 AI 工具整理)最近幾年的核心進展,是把機器人系統 直接建構在大模型之上。團隊使用大規模 視覺–語言模型(VLM)作為通用世界知識的底座,在此基礎上疊加控制能力,建構出視覺–語言–動作模型(VLA/VALA)。在這樣的模型中,機器人在世界中的 物理動作也被視為一種序列 token,與視覺 token 和語言 token 放在同一序列中建模。這使得模型能夠在統一框架下處理“看到了什麼、理解成什麼、接下來該做什麼動作”,從而在 新場景、新物體、新指令上表現出更強的動作泛化(action generalization)能力。來源:AI工業(採用 AI 工具整理)在任務層面,系統已經從早期只會做“拿起、放下、拉開拉鏈”等短視野任務,邁向可以完成“行李打包、垃圾整理”等 長視野任務。通過在 VLA 上方加入一個 Agent 層,系統可以把很多短動作 編排成完整的長鏈條行為。例如“幫使用者打包去倫敦的行李”時,Agent 會先 查詢當地天氣,再 推理需要準備那些物品,然後呼叫 VLA 驅動機器人執行具體收納,形成 “上層推理規劃 + 底層物理執行” 的分層架構。在Gemini 1.5中,團隊又加入了 “思考(thinking)元件”:模型在執行動作之前,會 先顯式輸出自己對即將執行動作的“想法”和推理過程,然後才真正下發動作指令。本質上,這是把語言模型中的 鏈式思考(Chain-of-Thought)機制遷移到機器人控制上。實驗結果顯示,顯式輸出“思考過程”可以顯著提升機器人在新任務上的泛化能力和成功率,同時也大幅提升了系統的 可解釋性。代表性案例:Aloha 午餐盒、桌面操作與衣物分揀來源:AI工業(採用 AI 工具整理)在具體實驗中,團隊用 Aloha 機器人演示了一個高難度的 “午餐盒打包”長視野任務。機器人幾乎 完全依賴視覺伺服(visual servoing),以 毫米級精度抓住自封袋的一小段邊緣,把面包準確塞進狹窄空間,在出錯時根據視覺反饋不斷調整和重試。支撐這些端到端策略的資料主要來自遠端操作(tele-operation),研究人員以第一人稱視角“軀體化”地操控機器人完成任務。機器人則從這些 人類演示資料 中學習“什麼算做對”,最終得到真正端到端的視覺–動作控制策略。他們還展示了結合 語言控制與通用桌面操作 的場景:桌面上有不同顏色的積木和托盤,上面疊加了Gemini 語言互動層,使用者可以直接說出指令,機器人一邊執行一邊用語言反饋自己的動作。更關鍵的是,場景中加入了 完全未見過的新物體(例如剛買來的梨形小容器、減壓球),系統依然可以理解諸如“打開綠色梨形容器,把粉色軟團放進去,再蓋上”的複雜指令,展現出對 新物體、新組合的開放式泛化能力。在另一個衣物分揀的人形機器人示例中,模型在每個時間步同時輸出 “思考文字 + 接下來要做的動作”,將 思考與行動統一在一個端到端閉環模型中,既提升了表現,也增強了 可偵錯性和可解釋性。技術路線已成型,瓶頸轉向物理互動資料來源:AI工業(採用 AI 工具整理)團隊整體的判斷是:儘管當前機器人仍然 偏慢、動作有些笨拙,成功率也並非完美,但與幾年前相比,已經出現了“質變級”的進步。現在的系統能夠 理解語義、形成有上下文的場景理解,並對複雜的物理任務進行分解與推理。他們認為目前的很多成果,已經是在搭建 未來通用家用機器人的基礎模組,而不是將來會被完全推翻的臨時方案。在這種情況下,真正的核心瓶頸,已經從“模型結構設計”轉移到了“資料匱乏”:機器人要學會通用操作能力,需要海量的 真實世界物理互動資料,而這類資料的規模遠遠比不上網際網路的文字和圖像。未來一個重要方向,是充分利用人類在網際網路上發佈的 大量手工操作視訊,從這些人類示範中大規模學習,從而緩解實體機器人採集資料成本高、速度慢的問題。總體來看,通用機器人操作仍然是一個高度非結構化、開放式的難題,但在團隊看來,如果能跨過“物理互動資料”的門檻,當前這些“幫忙疊衣服、打包午餐”的演示,很可能就是一場真正“機器人革命”的前夜。 (AI工業)
美國太空算力戰略部署研究報告
核心觀點與結論建構 “政策 - 商業 - 科研” 三位一體閉環體系:以 “立法 - 研發 - 測試 - 落地 - 監管” 全周期推進,商務部簡化許可審批、NASA 提供技術驗證、科技巨頭主導商業化,形成全球獨有的規模化部署模式。突破太空極端環境適配技術瓶頸:抗輻射晶片(輝達 H100 輻射加固)、相變散熱等技術保障硬體在軌穩定,SpaceX 星艦全復用發射將部署成本降至 200 萬美元 / 噸,重塑太空算力性價比標竿。開創 “天感天算” 資料處理新範式:星載 AI 處理使資料傳輸量減少 90%,應急響應從小時級縮至秒級,破解傳統 “天感地算” 頻寬瓶頸,滿足災害預警、戰場偵察等即時需求。打造天地一體化混合雲算力網路:太空算力與地面雲動態調度,星間雷射鏈路實現 100Gbps 高速傳輸,2030 年將支撐全球 30% AI 推理任務,重構全球算力供給格局。形成 “軍事 - 商業 - 地月” 三級應用生態:2030 年軍事場景算力覆蓋率超 50%,2027 年推出按分鐘計費的太空公共雲,月球資料中心落地支撐地月經濟圈,實現多場景價值變現。技術外溢催生跨行業革命:星間雷射鏈路助力 6G 無縫覆蓋,高效熱控技術推動地面資料中心 PUE 降至 1.05 以下,帶動通訊、AI、能源等領域兆級增量,2030 年為美 GDP 新增超 5000 億美元。主導全球太空算力規則制定:從硬體介面到安全規範形成全套標準,通過 “商業太空對話” 聯動澳、加、德、日等盟友,憑藉 “規則 + 技術 + 市場” 三重優勢掌控全球科技競爭話語權。開創可持續太空經濟新模式:通過規模化降本(星艦發射)與算力服務變現,推動商業航天從 “項目制” 轉向 “平台服務制”,2035 年在軌資料中心市場規模將達 390 億美元。(鼎帷諮詢)
儲存大廠獲蘋果大單!霸佔70%!
以挑剔著稱的蘋果公司,業界傳認可了三星的一款DRAM產品,將佔三星出貨量的60-70%。 三星半導體的旗艦產品通常被稱為LPDDR(雙倍資料速率),這是一種通用DRAM。 韓國經濟日報報導,三星以一款「『無名英雄』產品,橫掃蘋果供應鏈」,已獲得LPDDR5X的最大量訂單,該晶片用於最新的iPhone 17,三星也因此成為「領先供應商」。業內人士估計,三星將大幅提升其市場佔額,預計將佔iPhone 17出貨量的60%至70%。 先前,三星電子和SK海力士在iPhone機型上的供應量一直被認為相近。 iPhone採用三家記憶體公司、SK海力士和美光LPDDR記憶體。據信,蘋果決定增加從三星的採購量,是因為它認為三星對於確保其每年生產的2.3億部iPhone所需的LPDDR記憶體供應至關重要。尤其是在SK海力士和美光近期將產能集中於高頻寬記憶體(HBM)的情況下,蘋果現在能夠儘可能地從三星獲得供應,而三星在通用DRAM市場佔據了相當大的佔額。 蘋果也向三星訂購了大量用於明年9月發佈的iPhone 18的記憶體。美媒wccftech則報導指出,蘋果雖然是市值上兆美元的巨頭,但也無法倖免於DRAM短缺的影響。 由於其與三星和SK海力士的長期合作協議預計將於明年初到期,該公司必須迅速採取行動以避免價格上漲。最新報導指出,蘋果已與三星達成合作,並在此過程中使三星成為其最大的DRAM供應商,三星提供的DRAM將佔其總出貨量的60%至70%,這些DRAM不僅用於現有的iPhone 17系列,還將用於明年的iPhone 18系列。iPhone 18系列將於明年第3季發佈,據傳將配備六通道LPDDR5X儲存器 以提升頻寬和AI效能。 在這種情況下,三星似乎是唯一能夠同時滿足其最重要客戶需求,並保證供貨量和質量的廠商。 該報告還指出,蘋果對DRAM的「規格」極為嚴格。此外,A19、A19 Pro以及明年的A20和A20 Pro等晶片組都無法承受瞬時電壓尖峰。 三星的12GB LPDDR5X 晶片厚度僅0.65毫米,是移動裝置中最薄的元件之一。 憑藉上述優勢,其熱阻提升了21.2%,功耗降低25%,蘋果毫不猶豫地選擇了三星作為替代供應商。 (大話晶片)