#核心技術
DeepSeek-V4技術報告暗藏的10個神級彩蛋,“煉丹玄學”也被寫進論文
DeepSeek在“省錢”和“省資源”上達到了變態的程度。DeepSeek-V4總算來了。4月24日,DeepSeek官方帳號發佈了一篇名為《DeepSeek-V4 預覽版:邁入百萬上下文普惠時代》的文章。文章中正式宣佈,“全新系列模型 DeepSeek-V4 的預覽版本正式上線並同步開源。”同時,還介紹:DeepSeek-V4 擁有百萬字超長上下文,在 Agent 能力、世界知識和推理性能上均實現國內與開源領域的領先。模型按大小分為兩個版本:發佈後,測評、討論已非常充分,不再贅述。盒飯財經關注到,DeepSeek同步發佈了一篇關於DeepSeek-V4 技術報告。地址如下:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf這份名為《DeepSeek-V4:Towards Highly Efficient Million-Token Context Intelligence》的技術報告,共55頁,從架構、通用基礎設施、預訓練、訓練後等6個部分介紹了V4。而這份高度專業的技術報告中,隱藏了10個有意思的小彩蛋。彩蛋一:“Think Max”模式,絕不允許走捷徑的“壓榨”指令位置:第30頁,Table 3原文為:Reasoning Effort: Absolute maximum with no shortcuts permitted. You MUST be very thorough in your thinking... rigorously stress-testing your logic against all potential paths, edge cases, and adversarial scenarios.翻譯過來,大概的意思就是:推理投入度:絕對最大化,不容許任何捷徑。你的思考必須極其徹底,全面拆解問題以觸及根本原因,並針對所有可能的路徑、邊緣案例及對抗性場景,對你的邏輯進行嚴苛的壓力測試。要明確寫出完整的深思過程,記錄每一個中間步驟、考慮過的替代方案以及被否決的假設,確保絕對沒有任何未經審視的預設。這段話是模型開啟 Think Max(極致思考模式)時,後台偷偷塞給大模型的“系統提示詞(System Prompt)”。寫得極具壓迫感,像是一個嚴厲的導師在逼學生榨乾腦力,不準有任何偷懶。DeepSeek為其式設定了一套極為嚴苛的系統提示詞。用詞極具壓迫感,還全部使用了絕對祈使句:“絕對最大化”“不許走捷徑”“必須徹底”“嚴酷地壓力測試”“不放過任何一個假設”。它還顯式地命令模型“禁止走捷徑”,要求記錄每一個被拒絕的假設和中間步驟。通過這種極度嚴厲的工程化Prompt,榨乾大模型在 1M Context(百萬上下文)裡的算力去驗證程式碼和邏輯錯誤。這就像是給模型戴上了“邏輯緊箍咒”,確保在處理複雜邏輯或程式碼時,模型不會因為追求速度而忽略細節。彩蛋二:給硬體廠商的“公開信”:別瞎忙活頻寬了位置:第16頁,Section 3.1原文為:Once bandwidth meets this threshold, it ceases to be the bottleneck, and devoting additional silicon area to further bandwidth brings diminishing returns. We encourage future hardware designs to target such balance points rather than scale bandwidth unconditionally.意思是:一旦頻寬達到該閾值,便不再是瓶頸,此時將更多的晶片面積用於進一步提升頻寬,會帶來邊際收益遞減。我們鼓勵未來的硬體設計瞄準這樣的平衡點,而非一味地無條件擴展頻寬。DeepSeek在報告中反客為主,給輝達和華為等硬體廠商開出了“方子”。體面表達了他們在硬體方面的觀點:盲目提升頻寬對現在的AI訓練效率提升有限,建議廠商把晶片面積留給更能提高計算通訊比的地方。彩蛋三:極致效率,1M長度下僅需V3.2的10%快取位置:摘要,Abstract原文:In the one-million-token context setting, DeepSeekV4-Pro requires only 27% of single-token inference FLOPs and 10% of KV cache compared with DeepSeek-V3.2.意思是:在百萬級token上下文設定下,與DeepSeek-V3.2相比,DeepSeek-V4-Pro僅需其27%的單token推理FLOPs,以及10%的KV快取。DeepSeek在“省錢”和“省資源”上達到了變態的程度。通過 CSA(壓縮稀疏注意力)和 HCA(重度壓縮注意力)技術,它在處理100萬字的長文字時,佔用的記憶體竟然只有前代版本的十分之一。這意味著未來個人電腦甚至手機運行百萬超長文字分析將成為可能。彩蛋四:坦誠的“煉丹玄學”:知其然不知其所以然位置:第26頁,Section 4.2.3原文為:Although a comprehensive theoretical understanding of their underlying mechanisms remains an open question for now, we are sharing them openly to foster further exploration by the community.意思是:儘管目前對其底層機制的全面理論理解仍是一個懸而未決的問題,但我們將其公開分享,以推動社區的進一步探索。在Mitigating Training Instability 緩解訓練不穩定性章節中,DeepSeek團隊分享了兩個解決兆參數模型訓練崩潰的獨門絕技,Anticipatory Routing和SwiGLU Clamping。技術報告中,他們也非常耿直地承認:這種“雖然我不知道原理是啥,但它跑起來確實有用,大家拿去用吧”的坦誠,可以說是AI煉丹界的真實寫照了,非常有開源精神。彩蛋五:“快指令”(Quick Instruction)特供Token位置:第33頁,Table 5<|action|> (判斷是否搜網), <|title|> (生成標題), <|query|> (生成搜尋詞)。為了讓Chatbot響應更快,DeepSeek在模型內部植入了一系列專用Token“暗號”。V4之所以能這麼快,是因為它直接復用了已經算好的長文字 KV Cache(快取)。不用像以前那樣把幾十萬字重新喂給另一個小模型去判斷,從而徹底消除了“冗餘的預填充(redundant prefilling)”,這樣使用者的等待時間就能大幅縮短。彩蛋六:Codeforces全球排名第23位位置:第39頁,Section 5.3.2原文為:On the Codeforces leaderboard, DeepSeek-V4-Pro-Max currently ranks 23rd among human candidates.這句話的意思是,在 Codeforces 排行榜上,DeepSeek-V4-Pro-Max 當前在人類參賽者中位列第23名。這個“彩蛋”極具含金量。在純人類參與的全球頂級程式設計競賽Codeforces排名中,DeepSeek-V4的預估分值(3206分)足以排到全球第23名。這意味著它已經超越了絕大多數頂級程式設計師,進入了人類程式設計智力的最頂端一小撮。彩蛋七:內部“員工大調查”,52%的人已離不開它位置:第44頁,Section 5.4.4原文為:In a survey asking DeepSeek developers and researchers (𝑁= 85) — all with experience of using DeepSeek-V4-Pro for agentic coding in their daily work— whether DeepSeek-V4-Pro is ready to serve as their default and primary coding model compared to other frontier models, 52% said yes, 39% leaned toward yes, and fewer than 9% said no.翻譯過來是:在一項面向DeepSeek開發者和研究人員的調查(N=85)中,這些受訪者均有在日常工作中使用DeepSeek-V4-Pro進行智能體編碼的經驗。當被問及與其他前沿模型相比,DeepSeek-V4-Pro是否已準備好成為他們默認且主要的程式設計模型時,52%給出了肯定回答,39%傾向於肯定,而表示否定的不足9%。DeepSeek非常罕見地公開了公司內部85名頂尖研究員的真實反饋。超過一半的DeepSeek內部核心人員已經將其作為日常首選程式設計工具。這種“吃自己的狗糧”的行為比跑分資料更能說明模型在實際生產中的情況。彩蛋八:內部員工的真實“吐槽”被寫進技術報告位置:第44頁,Section 5.4.4原文:Respondents find DeepSeek-V4-Pro to deliver satisfactory results across most tasks, but note trivial mistakes, misinterpretation of vague prompts, and occasional over-thinking.翻譯過來就是:受訪者認為DeepSeek-V4-Pro在大多數任務上都能給出令人滿意的結果,但也指出它存在一些細小的錯誤、對模糊提示的理解偏差,以及偶爾的過度思考。這句話緊挨著上一條“內部員工調查”的彩蛋,DeepSeek選擇把內部員工的吐槽也寫了進去。彩蛋九:親民的“中國特色”評測題位置:第43頁,Figure 13為了展示模型在複雜長文字白領工作中的能力,DeepSeek放出的示例任務非常親民。“寫一份某知名奶茶品牌與北京地鐵的聯名行銷策劃”“UGC傳播與社交裂變設計”,比起國外大模型測寫全英文的莎士比亞詩歌,DeepSeek的評測題真的很懂國內打工人的日常PPT需求。彩蛋十:致謝名單裡的神秘測試Dolly Deng位置:第55頁,附錄 A.2 致謝部分附錄 A.2 致謝(Acknowledgment)部分,除了全體作者外,團隊特別單獨點名感謝了一位非作者人士:“We would like to thank Dolly Deng and other testers for their valuable suggestions and feedback...”翻譯過來就是,我們要感謝 Dolly Deng 及其他測試人員,就DeepSeek-V4系列模型的能力所提出的寶貴建議與反饋。能在這樣一份AI基礎模型技術報告中被單獨拎出來感謝的測試(或外部反饋者),不知道他在V4內測期間提交了怎樣關鍵的Bug或改進建議。 (盒飯財經)
20億美元收購案被直接叫停!美媒破防:中國不講自由?真相太打臉
4 月 27 日中國國家發改委一紙通報,直接叫停了一筆 20 億美元的跨國收購。消息一出美國媒體集體炸鍋。彭博社哀嘆一個時代結束了,華爾街日報抱怨手伸太長,還有人直接扣上破壞自由市場的帽子。可只要稍微往前翻一翻,就會發現這場指責有多諷刺。這次被收購的 Manus,是去年橫空出世的中國國產通用 AI 智能體。它的核心技術是中國團隊研發的,核心人才全是中國人,成長過程也完全依託中國的 AI 基礎設施和產業環境。它只是悄悄把註冊地遷到了新加坡,裁掉了中國大部分團隊,遮蔽了中國 IP,就想換個馬甲賣給美國的 Meta。很多人以為這樣就能繞開監管。但監管部門早就盯上了這筆交易。從 1 月 8 日啟動調查到 4 月 27 日下達禁令,整整用了 109 天。全程嚴格按照法律程序走,給足了雙方申訴和整改的機會。可對方始終避重就輕,一門心思指望境外殼公司矇混過關。最終的叫停決定,完全符合中國的外商投資安全審查辦法。而美媒口中的自由市場,在美國自己那裡早就成了笑話。美國的國家安全審查機制 CFIUS,早在 1975 年就成立了,比中國早了整整 46 年。全球商界都叫它併購粉碎機。最典型的例子就是幾年前的 Magnachip 收購案。中資智路資本出價 14 億美元,收購這家韓國晶片公司。這家公司的生產研發全在韓國,銷售也基本不在美國。就因為它在紐交所上市,CFIUS 直接以國家安全為由否決了交易。沒有公開證據,沒有正式聽證,智路資本最後還被迫支付了 7020 萬美元的終止費。類似的操作美國做過無數次。圍剿 TikTok 四年拿不出任何證據,逼著字節跳動要麼賣要麼關。輝達的先進晶片說斷供就斷供,連聽證會都不開。還直接出台規定,禁止美國風投向中國 AI 領域投一分錢。這是中國 2021 年實施審查辦法以來,首次公開叫停 AI 領域的外資收購。而美國 CFIUS 公開否決的中資科技收購,早就不止三筆了。美媒真正憤怒的根本不是自由市場被破壞。他們生氣的是,過去只有美國能用國家安全當藉口卡別人,現在這個規則居然被別人用了。很多人有個誤區,覺得公司註冊在那,它就是那的。但對科技公司來說,核心技術在那,核心團隊在那,它的根就在那。換個馬甲就能把國家培育出來的核心技術打包賣掉,這種空子本來就不該存在。自由市場從來不是沒有邊界的自由。任何主權國家,都有權保護自己的核心利益和國家安全。美國自己玩了幾十年的規則,現在輪到別人用了就跳腳罵街。這不是中國不講自由,這是用美國的鏡子,照出了它自己的雙標真面目。 (科技直擊)
狂燒2000億!小米拼了
前段時間,雷軍正式宣佈小米將在未來五年投入至少2000億的研發資金,並在後續的民營企業座談會上直接透露:小米接下來的五年將會重點攻堅晶片、AI、作業系統等底層核心技術。晶片、AI、作業系統,說實話每一個單拎出來都不是善茬,小米卻想著“全都要”,那也怪不得要砸2000億。而且真要說的話,2000億還得花在刀刃上才能看到成果,畢竟光晶片一項,投入都是以十億計數的。圖源:微博雖然錢砸得不少,但是對於小米來說卻是物有所值,因為在2020年時,雷軍其實宣佈過一個差不多的計畫:從2020年開始,在接下來五年投入1000億進行技術研發,而截至2025年底,這項投資的總額定格在1050億。千億研髮帶來的效果是顯著的,短短5年時間小米數字系列就成為中國市場最暢銷的旗艦手機,而小米汽車則成為崛起最快的新勢力品牌,小米AIoT如今已是國內最大規模的IoT生態。但是,與2020年時不同的是,小米這次關注的是更底層、更基礎的領域,這些領域的進展體現到產品和營收上可能會慢很多,甚至明面上的效果還不如2020年的1000億,那麼小米為什麼還要做這些“吃力不討好”的事情呢?沖高端,自研是唯一道路自從去年5月份發佈首款自研3nm旗艦SoC晶片“玄戒O1”後,小米其實一直都在試圖扭轉外界對這個品牌的印象:我們已經不再是以“網際網路思維”和“供應鏈整合”為核心的企業,小米的“硬科技”才是驅動這家企業成長的核心力量。事實上,直到現在還有不少網友將小米稱為“組裝廠”,認為小米的產品技術都來源於供應商,這個觀點顯然不對,畢竟這麼多年了,也不見得有第二家“小米”出現在手機行業。不過,當我們回顧過去幾年的手機市場,你會發現多數創新都集中在系統更新、影像演算法升級等層面,其根基確實是建立在上游供應鏈的基礎上。對於一直致力於衝擊高端市場的小米來說,“組裝廠”的標籤幾乎是品牌層面的最後絆腳石,而想要搬走這個石頭,只有一個“笨辦法”——自研。圖源:小米而在自研領域裡,晶片則是毋庸置疑的“皇冠”,特別是在國內外的半導體競爭愈發激烈的當下,一顆足夠出色的自研晶片就可以轉變很多路人對一個品牌的印象。小米的自研晶片計畫其實起步很早,在2017年時就推出過一顆面向中端市場的“澎湃S1”,因為體驗不佳等問題,最終“一代而亡”。澎湃S1的繼任者直到8年後的2025年才發佈,而在這段時間裡,小米的自研晶片力量都集中在充電、影像等領域,雖然也有進展,但是終究無法像核心SoC那樣在終端性能層面帶來本質上的體驗區別。所以,小米最終還是拿出了玄戒O1,證明自己有設計頂級SoC的能力,而在許多評測裡,玄戒O1的能效甚至超過了同年的其他兩個旗艦移動平台,這就是深度整合與最佳化帶來的效果。而且自研核心晶片也是對“組裝廠”標籤的最有力回擊,當所有Android旗艦都在使用相同的處理器時,手機廠商就只能在散熱面積、外觀材質和行銷話術上內卷,這種高度同質化的產品,其實很難在高端市場說服消費者“更換門庭”。圖源:小米就拿iPhone來說,消費者除了買蘋果的設計和功能外,其核心是購買A系列晶片與iOS系統所帶來的獨一無二的體驗,所以小米想要站穩高端,單靠徠卡聯名或是首發驍龍旗艦晶片已經不夠了,必須提供一個只有小米才能給到的“差異化體驗”。當小米在發佈會上不再僅僅羅列供應商的參數,而是深入講解自家晶片的微架構設計、自研作業系統的底層最佳化機制時,它在路人的眼中自然就會變得不一樣,別管黑子們的嘴硬,至少支撐品牌價值提升、對抗蘋果與華為等頂尖對手的必要條件是有了。不過說實話,晶片領域一直是資金與技術的“黑洞”,有時候幾十億丟進去都只能聽個響,從前期的預研,到實際的研發,再到後期的流片,每一個步驟都需要花費大量的資金,僅拿流片來說,3nm製程的單次流片成本就達到數千萬美元,這是個沒錢的玩家壓根無法進場的行業。小米的2000億投資,就是在敲開這扇門後繼續走下去的保障。小米的人車家,還差什麼?而在晶片之外,對於小米使用者來說,最值得關注的還是自研系統,甚至可以說這才是小米接下來五年的最核心領域。從小米汽車發佈後,我們經常能夠看到雷軍提到一個概念:人車家,基於小米生態實現的智能互聯體驗,才是將使用者綁在產品生態上的關鍵。但是,缺乏自研底層技術的生態互聯往往是表層的,特別是不同終端系統之間的互聯,對軟體的最佳化要求極高。如果小米想讓人車家生態徹底落地並普及,死磕自研系統基本是唯一的方法,而且可以搭配自研晶片,組成一套完整的軟硬體體系。比如使用者拿著搭載玄戒晶片的小米手機靠近小米汽車時,不僅可以得到更快速、無感的開關鎖體驗,還可以讓汽車在使用過程中與手機聯動,借助手機晶片的性能處理任務。圖源:小米為什麼要讓手機與車機聯動?其實這就涉及到一個智能生態裡非常火的概念“主動式智能”,簡單來說就是AI不再是一個等待指令的工具,而是會根據使用者的習慣、日程、需求主動提供幫助的智能體。舉個例子,小雷在飯點時開車導航到附近的一個購物中心,AI會判斷你打算去就餐,然後詢問你是否需要推薦餐廳,或者是否查看常去餐廳的排隊情況。如果你想得到以上體驗,那麼就必須依賴於手機系統與車機系統的資料互通(為什麼?不妨看看你的手機app們)。如果可以將手機的隱私資料不經雲端(走UWB協議)就直接共享給車機,就可以在規避隱私洩露問題的同時為使用者提供細緻的智能體驗。更進一步地說,當小米汽車的存量達到一定等級後,它們本身也能組成一個新的邊緣計算網路,為周圍的小米手機提供算力支援,不過這就是系統生態完全統一之後的事情了。AI模型,小米生態的最後一環至於最後一個類股——AI模型,說實話現在曝光出來的資訊還不多,小米的保密目前來看做得挺好的,只不過雷軍表示模型的進展遠超預估,那麼我們就暫且認為進展順利吧。AI模型在未來智能生態中的地位有多重要,應該就不用小雷再重複敘述了,對於小米來說,AI模型將會是其打通所有裝置生態的鑰匙,基於小米自研系統的互聯,小米自研AI模型可以輕鬆解決隱私等層面的關鍵問題。而且,自研模型的最大優勢在於能夠根據需求進行蒸餾最佳化,比如將其從一個兆參數的模型濃縮成數百億規模的小模型,如此一來就可以將其從雲端模型轉成端側模型,無需擔心隱私洩露或網路延遲導致的使用問題,這對於同時在部署智能駕駛和智能助手生態的小米來說是必要的一環。從晶片到系統再到AI,其實不難發現小米的底層技術研發計畫,都是圍繞著打造一個完善的智能生態鏈的目標設計的,如果小米可以完成這個計畫,那麼也將成為少數能與蘋果、華為並駕齊驅的企業。說實話,在智能裝置高度內卷的今天,單純的模式創新已走到盡頭。這2000億,是小米換取未來十年智能生態核心牌桌席位的入場券,這條全端自研的道路註定困難,但對於小米而言,這也是一場已經沒有退路的硬仗。 (雷科技)
韓國官方認栽:中國136項核心技術反超,研發投入是韓國8倍
韓國一份官方科技報告,直接在業內掀起了波瀾。這份報告覆蓋 11 大領域 136 項核心技術,資料顯示中國技術水平達到美國的 86.8%,已經超過韓國的 82.8%。僅僅兩年時間,中韓技術差距從 0.2 年拉大到 0.7 年,就連韓國最自信的二次電池技術,也被中國實現反超。這不是單個技術的突破,而是全產業鏈的系統性追趕,依靠的是長期穩定的研發投入,和從頭到尾的完整產業佈局。韓國官方也明確承認,中國研發投入是韓國的 8 倍。不少人覺得技術反超靠的是運氣,可這次韓國評估的技術,橫跨航空航天、材料、生命健康、資訊通訊等所有前沿方向。能做到全面推進,核心是天量且穩定的研發資金支援。2024 年中國研發投入突破 3.6 兆元,規模接近韓國的 8 倍。韓國研發投入佔 GDP 比重不低,但國家體量差距太大,根本無法彌補。這種差距不是靠效率能追上的,是底層實力的降維打擊。對比二十年前,中國研發支出只有現在的二十分之一,這樣的增速在全球主要經濟體裡獨一無二。和美國相比,高端產業仍有差距,但追趕速度讓西方格外重視。我們的研發不是盲目燒錢,而是從基礎研究到應用技術,從零部件到終端產品的精準佈局。政府、高校、企業三方協同,形成了很難被覆制的創新體系。韓國媒體也坦言,面對中國全方位的研發推進,韓國只能死守少數領域。過去韓國還能靠幾個支柱產業撐場面,如今中國全領域突破,韓國已經越來越力不從心。讓韓國最難以接受的,是一個個優勢產業被中國攻破。二次電池兩年內完成徹底反超,2025 年中國兩家動力電池企業全球佔比超 55%,韓國三家合計僅 15% 左右。顯示面板也實現逆襲,2025 年中國大陸面板廠商全球營收份額突破 52%,OLED 手機面板出貨量首次超過韓國。半導體領域,中國技術水平 91.5%,同樣小幅超過韓國的 91.2%。韓國機構預測,2030 年前中國將在十大出口產業全面超越。韓國經濟高度依賴這些支柱產業,如今接連失守,國內輿論充滿焦慮。中國的核心優勢是全產業鏈閉環掌控,從原材料到製造應用全部打通,成本、效率、規模都佔據絕對優勢。韓國企業再努力,也擋不住中國全產業鏈加超大市場的組合拳,曾經的技術壁壘,正在被逐一攻破。技術反超的最終紅利,落到了每一個普通人身上。動力電池成本大幅下降,讓新能源車價格越來越親民。國產面板量產,讓手機、電視不再高價,千元機也能用上好螢幕。半導體國產化推進,還會讓更多電子產品告別溢價。中國科技發展,從來不是為了資料攀比,而是擺脫被卡脖子的困境,讓國人用上更好更便宜的產品。韓國的官方報告,已經用資料承認了現實。全球科技格局早已改寫,這是長期投入的必然結果,中國科技的自強之路,才剛剛步入快車道。 (科技直擊)
美科技巨頭「偷師」中國大模型,人民日報:核心技術討不來
“落後就要挨打”,這是一個很殘酷但又很現實的血淋淋的歷史教訓。挨打不一定要是熱戰,經濟制裁、科技打壓等,都是在挨打,只是方式不一樣罷了!而遺憾的是,中國在科技、經濟等各方面,都曾因為落後,才遭遇過屈辱。近幾年,美國為了阻止中國科技的崛起,或實施技術封鎖、或發動關稅戰,針對中國科技企業,進行了一輪接一輪的打壓和製裁。但值得慶幸的是,美西方的霸權主義,令越來越多的中國科技企業意識到──唯有自強,方能無畏!於是,中國科技企業有了共同的目標──加速國產替代,擺脫對美依賴。從5G到晶片,從光刻機到AI,中國科技企業堅定的走上了自主研發的創新之路。一向傲慢的美西方可能也沒有想到,短短幾年的時間,中國在不少前沿科技領域就已經追趕了上來,甚至完成了超越,上演了一出「逆風翻盤」的好戲。近日,有重磅消息傳來,全球頂尖AI科技企業Meta,放棄其旗下曾經領跑全球的Llama大模型,「偷師」阿里千問Qwen中國大模型!你沒有看錯,美國頂尖AI企業也要向中國科技企業低頭,這再次證明了,中國科技正在悄悄征服西方,風向徹底變了!幾年前,ChatGPT、Llama等美知名AI模型,在全球風靡,國內開發者也爭相使用。但僅僅兩年多時間,隨著阿里千問Qwen、DeepSeek等中國大模型的崛起,誰能想到,Llama等美大模型也能被超越,阿里千問Qwen取而代之,且黃仁勳還親自認證——阿里Qwen搶佔了大部分的市場份額,且還在持續擴大自身優勢。要知道,Meta的CEO祖克柏可是一名堅定的“美國支持者”,他曾多次呼籲,要多使用美國的大模型,不要依賴中國大模型。但結果呢?現如今態度一百八十度轉變,自家的「酪梨」訓練竟使用了阿里千問Qwen大模型,這也從側面證實了一點,阿里千問Qwen系列正在強勢崛起,已有取代Llama之勢。阿里千問Qwen系列開源至今,僅僅只有3年的時間,就已經交出了多份高分答卷,其全球下載量已經步入“7億俱樂部”,且衍生模型的數量也已經超越了Llama。不只Meta,不只美國,阿里千問Qwen大模型在阿聯、日本、巴西、韓國、泰國等國家和地區,也深受科技巨頭和開發者的喜愛。總的來說,這次Meta寧願被扣上“打”臉的帽子,也要使用阿里千問Qwen開源模型,說明了一點,阿里的選擇是對的,全面開源要比西方的“小院高牆”閉源發展更勝一籌,再加上阿里還有全棧AI佈局作為“護城河”,優勢很明顯了!正如人民日報所說的,核心技術是討不來的。阿里做了一個很好的榜樣,全棧佈局、生態協同、技術創新,用自研核心技術打破西方封鎖,闖出一條屬於中國的光明道路,未來可期。 (W侃科技)
對AI泡沫的理性思考:尋找風口上的鷹
這幾年全球資本市場都在為AI瘋狂,輝達市值衝破5兆美元,美國五大科技巨頭宣佈未來一年要砸幾千億美元搞AI。就在一片狂熱中,比爾蓋茲潑了一盆冷水,他說現在正處在一個與2000年網際網路剛開始時高度相似的AI泡沫中,未來泡沫可能會破裂。這引發了市場的擔憂,如果真的像當年網際網路泡沫一樣,那可是幾兆財富蒸發,無數公司破產倒閉,股價跌到退市。那麼,這輪AI浪潮到底有沒有泡沫?我的觀點很明確:一定存在AI泡沫。第一,是估值泡沫。比如美股的一個AI明星企業Palantir,它主要給美國軍方情報機構和政府提供AI資料分析,現在年營收大概30多億美元,但市值早就4000多億美元,100多倍市銷率,400多倍市盈率,估值極高。再比如國內的千模大戰,湧現了無數創業公司。但馬太效應極其殘酷,當DeepSeek和豆包在快速迭代時,很多曾經的明星小創業公司,正被快速邊緣化,聲量越來越小。對於那些沒有核心技術、最終會被淘汰的公司,它們現在的高估值就是巨大泡沫。第二,是投資泡沫。比如大家一直詬病的“左腳踩右腳”的神操作:之前輝達宣佈向OpenAI 投資1000 億美元,再加上微軟在Open AI裡面1350億美元的投資,OpenAI拿到錢後,轉身就可以用這筆錢繼續向輝達採購大量高端GPU,租微軟的算力。最後輝達、微軟的錢轉了一圈,又以收入利潤的形式轉回去了,大家都有了投資、業績和估值。所以,無論是個股誇張的估值,還是這個左腳踩右腳的資本循環,都告訴我們——泡沫確實存在。但是,我們必須搞清楚,泡沫不是騙局,泡沫消散後,AI最終會改變世界。就像19世紀的鐵路股泡沫,破滅後留下了橫貫大陸的鐵路網。20世紀初網際網路泡沫後,留下了網際網路基礎設施,並催生了亞馬遜、微軟、Google、阿里、騰訊這些偉大企業,改變了全球每個人的生活方式。今天的AI,本質上是在用資本狂熱,加速建設未來所需的AI基礎設施。未來消化如此巨大的估值和投資泡沫,最後要靠AI進入超級應用時代。有超級應用,才能有收入和價值,才能有未來。今天AI巨頭們幾千億的資本開支,目的只有一個:不計代價地燒錢,去跑出那個能讓全球買單的超級應用。無論是無人駕駛、AI助手,還是人形機器人。說到這,我認為這次AI泡沫和20世紀初的網際網路泡沫有兩個根本性的不同。第一,玩家不同,這次AI玩家已經有真金白銀的投資回報。2000年的網際網路泡沫,主角是大量沒有利潤、沒有現金流的初創公司,全靠PPT融資。今天牌桌上的玩家,是微軟、Google、Meta、騰訊、字節,手握數千百億美元現金、盈利能力極強的超級巨頭。它們用真金白銀的利潤在投資AI,正在產生新的利潤。比如Meta最新三季度財報顯示,AI已經大大提升了廣告業務效率,幫公司每年多創收600億美元。第二,技術不同,今天AI的技術不僅有用,而且供不應求。2000年,絕大多數網際網路公司只有PPT,很多公司只要把名字加上“.com”,股價就能暴漲,那怕它根本沒有任何網際網路業務。今天,AI已經實實在在地在提升生產力。程式設計師用它改程式碼,藥學家用它做創新藥研究。並且,AI算力是真的不夠用。AI巨頭們積壓了大量訂單,大量客戶簽了合同、排隊給錢等著交貨。輝達宣佈接下來還有幾千億美元的晶片要交付。歷史上無數次的科技泡沫告訴我們,要尋找風口上的鷹,而不是風口上的豬。因為,風停之後,鷹一樣能展翅飛翔,再創新高,而風口上的豬則會重重的摔死。不要去追逐“風口上的豬”,那些沒有核心競爭力、只會炒作概念的垃圾股票。未來,誰能成為那隻鷹呢?它必須具備四個特質:擁有核心的技術優勢、清晰的商業模式、長坡厚雪的超級應用以及不屈不撓的企業家精神。剩者為王,AI泡沫後活下來的贏家,將是用AI解決人類生產生活中真實的問題和痛點的玩家。要麼是提供底層AI基礎設施,要麼是在交通、醫藥、機器人等垂直領域提供殺手級的超級應用。 (澤平宏觀展望)
輝達人工智慧發展戰略研究報告(2025版)
引言當人工智慧成為 “十五五” 戰略階段定義核心競爭力的關鍵賽道與核心技術,當中美科技博弈的勝負手日益聚焦於算力主導權與 AI 生態控制權,對全球頂尖 AI企業的深度解碼,已不再是企業內部的策略選擇,而是關乎產業突圍與國家發展的研究方向與命題。2024 年初,鼎帷公司在錨定 “十五五” 戰略落地路徑的內部研究中,敏銳捕捉到人工智慧應用規模化落地的歷史性機遇,歷經半年深耕輝達的研究,我們於24年9月首次發佈了《輝達人工智慧發展戰略研究報告》。通過研究:我們愈發清晰地認識到:輝達絕非單純的商業實體,其以核心技術迭代為支撐的戰略佈局、與全球頂尖 AI 研發力量的深度算力繫結、對全球九成以上高端 AI 加速晶片市場的壟斷性控制,已使其成為美國維繫未來技術霸權的關鍵支點,更是中美算力競爭格局中的核心變數。這份認知讓我們深刻意識到,此項研究的價值早已超越企業內部決策範疇。在全球 AI 技術與產能分配日益受到地緣因素影響、國產 AI 產業雖加速突圍卻仍面臨關鍵壁壘的當下,拆解輝達 AI 戰略的底層邏輯與佈局脈絡,對中國在關鍵技術領域實現自主可控、推動人工智慧產業長足進步,具有緊迫的現實意義。為此,我們決定打破內部研究的邊界,將深度洞察的成果免費發佈。2025年10月,我們再次更新了《輝達人工智慧發展戰略研究報告》,旨在為產業同行、政策制定者與研究機構提供一份全景式的戰略參考:既解碼輝達的技術研發路徑與生態控制策略,也結合國內 AI 產業的突圍實踐反思差距與機遇。期望以這份研究為 “拋磚引玉” 之石,助力中國在 AI 這場關乎未來的全球競賽中佔據主動、實現突破。為企業制定“十五五”規劃提供AI前瞻與瞭望,為國家在人工智慧、低空經濟、生物醫藥、腦機介面、量子計算等戰略新興與未來產業打造兆產值落地提供綿薄之力。 (鼎帷咨詢)
不止是快:Google量子突破的5個驚人事實
3.2年的任務,2.1小時搞定。我沒開玩笑。這是Google最新的量子晶片剛幹出來的事。順便說下,領銜這篇Nature論文的,是剛拿諾獎的大佬。我剛看完成果報告,說實話,最讓我震驚的不是這個速度(雖然13000倍的提升確實很誇張),而是藏在速度背後的幾個細節。這篇論文(剛登上Nature,由新晉諾獎得主Michel Devoret領銜,總計超過200位作者參與)像一聲響指,把“量子計算”從遙遠的科幻拽入了“工程現實”。圖:Google發表在 Nature 上的論文今天我就來扒一扒,這次突破到底牛在那,尤其是那5個容易被忽略的驚人事實。💡 事實一:從3年多,縮短到2小時這次最抓眼球的,就是這個速度差。Google在Willow量子晶片上跑一個演算法,只用了 2.1 小時。而目前世界最快的超算“Frontier”,模擬同樣任務,預計需要 3.2 年。這等於Google第一次真正做到了“可驗證的量子優勢”。這幾年,AI圈的目標已經從“量子霸權”(聽著玄乎,但容易被推翻)轉向了更實在的兩個目標:量子實用性:能幹點有用的活兒量子優勢:比傳統電腦幹得快這次突破,就是對第二點的堅實證明,也給第一點打了個好基礎。🧠 事實二:關鍵在於“可驗證”這個詞,才是這次突破的核心。“可驗證”,是跟2019年Google那次“量子霸權”的爭議做對比。當時那次雖然動靜很大,但後來很快被數學家找到了新演算法,用傳統電腦追上了,導致很多人(包括我)都覺得Google那是在“吹牛”。而這一次,“可驗證”的意思是:這結果是實打實的,可重複的,在同等級量子電腦上都能得到相同答案。這個特性太關鍵了。它意味著量子計算,終於從一個“一次性”的實驗煙花,變成了一個“可靠”的科學工具。這才是真正能拿來幹活的底氣。⚙️ 事實三:核心技術“量子回波”這次突破的核心演算法,叫“量子回波”。(也叫回聲)我必須再提一遍:領銜這篇論文的大佬(Michel Devoret),就是因為在相關量子領域的貢獻,剛拿了諾貝爾獎。圖:諾貝爾獎得主、Google量子硬體首席科學家 Michel Devoret所以,這套演算法基本就是“諾獎等級”的操作。這演算法幹了啥?Google打了個比方,特生動:這就像不僅能在海底用聲納找到一艘沉船,還能清晰地讀出船體上的銘牌。(說人話就是:精度高到變態)它的工作流大概是:讓量子系統“正向播放”。中途,給一個量子位元“戳一下”(施加擾動)。然後,讓整個系統“精確倒帶”。最後“聆聽”倒帶回來的“回波”。通過分析這個回波,科學家就能知道系統內部的動態。就像Google自己說的:“就像望遠鏡和顯微鏡開闢了新的、看不見的世界一樣,這項實驗是朝著‘量子示波器’(quantum-scope)邁出的一步。”📈 事實四:首個實用場景“分子標尺”你可能以為這東西是用來破解比特幣的(這個我們後面說)。但它第一個實用的場景,是當一把“分子標尺”——用來做基礎科學研究。Google用它來增強“核磁共振”(NMR)技術,能量出比以前更長距離的原子間相互作用。這有啥用?用處太大了。比如:藥物研發:幫科學家看清藥物分子是怎麼和靶點精確結合的。材料科學:幫科學家分析新電池、新聚合物的分子結構。更騷的操作在這:AI + 量子 = 王炸現在像 AlphaFold 這樣的AI模型很牛,但它們受限於“高品質的訓練資料”。而量子電腦(用“分子標尺”這種技術),恰好能生成AI需要的那種、傳統電腦算不出來的高精度分子資料。AI + 量子這波要是聯手,真可能把藥物研發這事給徹底掀桌了。這也暴露了Google的野心:它內部的尖端技術(量子、AI、製藥)未來能互相“喂招”,這才是最可怕的。🤖 事實五:比特幣的“量子威脅”?看到這,肯定有人(比如我)又開始慌了:比特幣是不是要涼了?理論上,強大的量子電腦確實能破解現在的加密技術。但先別慌。有專家出來說了(密歇根大學教授),量子技術離真正威脅到現代密碼學,還有很長的路要走,幾年內還不是現實風險。而且,就算轉向“後量子時代”的加密方案,挑戰也巨大。比如,新的加密方案會導致“金鑰”和“簽名”變得超級大,這會極大增加網路流量和區塊大小,區塊鏈這種系統根本吃不消。儘管如此,這次Google的成果(尤其是“可驗證性”),無疑是一個強有力的提醒:後量子時代的安全問題,這個鐘,已經開始倒計時了。總結:一個新時代的開端所以,Google這次突破,給我的感覺是:量子計算,終於從一個實驗室裡的“理論奇觀”,變成了“可靠、能用”的工具。感覺離我們普通人的生活,又近了一步。 (AI范兒)