在AI界,2024年7月9日是一個不太平凡的日子,有媒體曾經把這天形容為中國AI界的「羞辱日」。
為什麼這麼說呢?因為OpenAI在這天官宣,從即日起將限制不支持地區的API使用,也就是所謂的“停服”,沒錯,這個不支持的地區中就包含了中國。
這背後的意義可以說再明顯不過了——OpenAI將保持閉源策略,以提防其寶貴的模型被中國使用。
但一年之後的今天,相信很多人都會有一個相同的感受,那就是這一風向已發生徹底轉變。
例如,幾個月前,OpenAI CEO Sam Altman罕見地承認了OpenAI的閉源策略站在了“錯誤的一邊”,同時小心翼翼地放出了有限“免費+開源”的消息。包括曾專注於閉源模型Gemini的谷歌,幾個月前也推出了開源模型Gemma 3,以吸引更多開發者從閉源平台轉向開源生態。
以上種種跡象引起了我們的強烈好奇,短短一年時間,AI界怎麼就發生瞭如此之大的風向轉變?這背後到底發生了什麼事?
一番研究下來,我們發現了一個十分關鍵的原因,那就是中國科技企業所提供的開源模型,有力地替代了美國科技巨頭所力推的封閉系統,並讓它們感受到了前所未有的壓力,不得不做出一定的讓步。
這方面,阿里雲就是一個典例,甚至可以說,“開源”之所以能夠戰勝“封閉”,國產模型之所以能夠有力抗衡美國AI巨頭的遏制,阿里雲及背後的阿里是功不可沒的。
這並非空口無憑,我們可以簡單回顧下:
2024年9月,阿里雲推出Qwen2.5系列,包括0.5B到72B等多個尺寸的語言模型、多模態模型、數學模型、程式碼模型等,一次上架100多個開源模型,刷新業界紀錄。
2024年11月28日,阿里雲發布全新AI推理模型QwQ-32B-Preview,並同步開源。評測資料顯示,QwQ在數學和程式設計方面表現特別出色,整體推理水準比肩OpenAI o1。
2024年12月25日,阿里雲發佈業界首個開源多模態推理模型QVQ-72B-Preview。多項評測數據顯示,QVQ超越了先前的視覺理解模型「開源王者」Qwen2-VL,整體表現與「滿血版」OpenAI o1、Claude3.5 Sonnet等推理模型相當。
今年3月和4月,阿里雲又接連推出全新的開源推理模型通義千問QwQ-32B和Qwen3,大大降低了模型的部署和使用成本,Qwen3更是登頂全球最強開源模型。
在外界看來,如此頻繁地推出開源模型,既透露了阿里要將開源進行到底的決心,同時也亮出了其All in“AI+雲”的技術底牌。
特別值得一提的是,就在昨天清晨,阿里雲又一「王炸」級開源模型問世——通義千問AI程式設計大模型Qwen3-Coder。深入了解下來,我們認為,稱其為全球最強的程式設計模型也並不為過。
為什麼敢說全球最強?不妨繼續往下看。
全球最強,當之無愧!
關於Qwen3-Coder的能力,可以用一句話來形容,超越GPT4.1,比肩全球最強的程式設計模型Claude4。
如果你覺得這句話還不夠直白,你也可以這樣理解,借助於Qwen3-Coder,一個剛入行的程式設計師一天就能完成一個資深程式設計師一周的工作,一個品牌官網僅用5分鐘的時間就能生成,乃至一句話就能生成一個3D物理模擬動畫。
這裡,很多人可能就要問了,這是真的嗎?它是怎麼實現的?還有那些讓人眼睛一亮的地方?結合Qwen3-Coder已公佈的信息,我們可以將這些問題的答案梳理為以下幾點:
1. 卓越的技術架構框架
從程式碼模型來看,Qwen3-Coder是千問系列模型中首個採用混合專家MoE架構的程式碼模型,總參數達480B,啟動35B參數。
通俗點來說,我們可以將MoE架構理解為一個各領域專家的集合體。例如,當遇到某個專業問題時,Qwen3-Coder就可以調動該領域的專家進行解決,當遇到一個複雜問題時,它就可以連結各領域的專家來共同解決。
所以,採用MoE架構的Qwen3-Coder可以根據任務類型動態地選擇合適的「專家模組」來處理,模型的任務處理速度和複雜任務的處理能力大大提升。
此外,Qwen3-Coder也原生支援256K token的上下文,並可透過技術手段擴展至1M長度。
於程式設計模型而言,能夠理解和記憶多少情境是衡量其能力的一個硬指標。Qwen3-Coder的這組數據相當於大大擴充了模型的腦容量,讓模型的理解力和記憶力得到了大大提升,能夠更好地理清代碼之間的邏輯關係,避免「短視」問題。
還有,Qwen3-Coder在程式碼佔70%的7.5T資料上預先訓練,龐大且專業的資料量為模型通用能力、程式碼能力和Agent能力的提升奠定了堅實的基礎。
評測結果顯示,在瀏覽器呼叫(WebArena)、工具調用(BFCL)等Agent能力評測中,Qwen3-Coder刷新開源模型紀錄,超越GPT4.1。在考察模型自主規劃解決程式設計任務的SWE-Bench評測中,Qwen3-Coder取得了開源最佳效果,可媲美Claude4。
2. Agent能力取得重大突破
出色的Agent能力也是Qwen3-Coder的一大亮點,它不只能用來寫程式碼,還可以自主規劃工作流程並呼叫工具來解決多步驟的複雜任務。實測數據顯示,在執行任務時,Qwen3-Coder能夠調用的工具數量比Claude多出幾倍,效果非常出色。
此外,從阿里雲百煉平台公佈的價格來看,Qwen3-Coder的API遠比Claude4便宜。以約200K輸入為例,Claude 4輸入價格為21.48元/百萬Tokens,輸出價格約107.41元/百萬Tokens,而Qwen3-Coder輸入為5元/百萬Tokens,輸出價格為21.48元/百萬Tokens ,分別為5元/百萬Tokens ,輸出價格為21.48元/百萬Tokens,分別為Claude/51/5。
所以,有業內人士就指出,開源的Qwen3-Coder有望取代昂貴的Claude,成為Agent領域最受歡迎的程式設計模型。
3. 程式設計師的“福音”
於廣大程式設計師而言,Qwen3-Coder無疑是一個「福音」般的存在。
Qwen3-Coder不但可以寫入程式碼、補全程式碼、修Bug,還可以將程式碼測試、查詢產生等工作從手動編寫的數小時驟降至數分鐘,大大提升了程式設計師的工作效率。
當程式設計師們不用再一行行盯著程式碼找bug,不用再一遍遍地做程式碼測試和優化,他們就可以從基礎的程式設計工作中解脫出來,將更多的精力放在系統架構和業務邏輯梳理等更高維度的工作上,人的創造力得以進一步發揮。
多說一句,其實不只是程式設計師,Qwen3-Coder的出現其實也大大降低了一般人接觸程式設計的門檻。試想,只要用一句話來描述自己的想法,例如製作賽車小遊戲,Qwen3-Coder就能產生對應的遊戲程式碼,這樣的程式設計方式顯然不存在任何難度。
4. 開源、開源、還是開源
目前,Qwen3-Coder已在魔搭社群、HuggingFace等平台開源,全球開發者都可以免費下載使用。最新消息顯示,Qwen3-Coder很快將接入阿里的AI程式設計產品通靈靈碼,API也已上線阿里雲百煉。
此外,為方便開發者更好地使用Qwen3-Coder,通義團隊還同步開源了一款命令列工具Qwen Code,可以利用其充分發揮Qwen3-Coder在代理式程式設計上的潛力。
總結下來,Qwen3-Coder可謂集卓越性能、實用價值、社會價值於一身,稱其為全球最好的程式設計模型自然當之無愧!
一場連鎖反應或將發生
更深層來看,Qwen3-Coder發布所帶來的變革絕不只侷限在程式設計領域,它很可能還會引起一場AI Agent的連鎖反應,乃至重構千行百業。
不要忘了,AI之所以能夠與實體世界產生交互,之所以能夠應用到各行各業,這一切都有賴於程式設計技術,或者說,程式設計技術才是那個支撐AI落地的底座所在。當這個底座發生重大變化時,具體的AI應用勢必也會隨之改變。
目前可以預見的是,當Qwen3-Coder極大提升編程效率後,那些能夠與AI產生聯繫的行業,其生產力將得到巨大釋放,行業面貌或將煥然一新。
例如醫療產業,過去這些年,醫療產業累積了大量的數據,像是病歷、影像、檢驗報告等等,這些數據中其實蘊藏著巨大的醫學價值。
過去,受制於有限的技術條件,這些數據無法得以充分挖掘,但如果借助於Qwen3-Coder的模型能力,有理由相信,醫療行業的海量數據將會被精準、快速地分析,進而為醫生提供輔助診斷建議,讓疾病的診斷變得更加精確。
例如金融業,長期以來金融業以風險和不確定性著稱,但如果建立起一個能夠對市場行情、交易數據、宏觀經濟指標等數據即時分析的風險預測模型,並製訂相應的風險應對方案,行業中的風險和不確定性很可能就會大大降低。
如果要建立這樣一個金融業的風險預測模型,很顯然,Qwen3-Coder在這個過程中將大有可為。
再例如教育產業,當Qwen3-Coder深度應用到教學場景後,智慧教學系統會更加全面地掌握每個學生的學習情況、學習進度和知識熟練程度等信息,進而為學生提供個性化的學習方案,傳統「一刀切」的教學模式將被大大改變。
所以,表面上看,Qwen3-Coder大大提升了程式設計效率,可能會引發一場程式革命。但深層來講,它很可能會引起一個又一個行業變革,而這些行業變革將在Qwen3-Coder的助力下朝著更好地滿足市場和用戶需求的方向演進。
從這個角度來看,Qwen3-Coder的想像空間和未來前景可以說是無限大的。
結語
最後想說的一點是,在這場愈演愈烈的全球AI競賽中,Qwen3-Coder的重磅發布,不僅是中國科技企業技術實力的有力證明,更彰顯了中國科技企業在這場競爭中的韌性、格局與擔當。
韌性無需多言,面對美國科技巨頭的技術封鎖,一大批中國科技企業以其獨特的智慧和創新力突出重圍,乃至愈發呈現出赶超之勢,這一點阿里等科技企業的領先產品就是最好的回應。
那份格局與擔當則更為人稱道。例如,當美國科技巨頭想著靠閉源壟斷AI進步的路徑時,中國科技企業的眼光顯然更長遠、更務實、更具普世性。
如阿里般,一直以來它想的都是盡可能地透過開源來降低模型訓練成本,讓模型真正能夠低成本的部署和使用,進而讓AI技術成為驅動千行百業、惠及千家萬戶的「共同財富」。
一切,也正如馬雲所言:
「高科技絕不只是征服星辰大海,更應該呵護人間煙火。科技人員的責任,不是讓AI取代人類,而是讓AI更懂人類、更好地服務人類。”
這次Qwen3-Coder的發布也讓我們更加相信,中國科技企業不僅無懼封鎖與打壓,還將以更加開放和創新的姿態,為全球AI發展提供更具包容性的「中國方案」。
至此,必須要說一句,阿里AI,好樣的!(正和島)