#R1模型
DeepSeek R1模型完成“小版本試升級”,程式設計、邏輯理解上了一個層次!
隨著人工智慧競爭升級,DeepSeek發佈R1模型更新版。周三,DeepSeek在微信群發佈帖子稱,DeepSeek R1模型已完成“小版本試升級”,歡迎前往官方網頁、APP、小程序測試(打開深度思考),API 介面和使用方式保持不變。DeepSeek R1模型在語義理解精準性、複雜邏輯推理、長文字處理穩定性等方面進行了強化。DeepSeek並未提供本次更新的更多細節。有網友測評後稱,感覺模型的理解能力上了一個層次:感覺模型的理解能力上了一個層次,比如啟動參數部分,R1可以製作互動動畫來展示,另外關鍵資訊的邏輯也非常清晰。程式設計能力也大幅提升,有網友測評後感嘆,太嚇人了,1000多行程式碼一次搞定,沒有bug。還有網友稱,程式設計能力可以和“程式設計新王”Claude 4一較高下。這是兩個月來DeepSeek的首次模型更新。今年3月,DeepSeek放出了 DeepSeek-V3-0324 模型。該模型全面超越 Claude-3.7-Sonnet,在數學、程式碼類相關評測集上超過 GPT-4.5。作為一個沒有思維鏈的非推理模型,DeepSeek-V3-0324 模型在推理類任務上的表現可圈可點。根據第三方評測,新版的 DeepSeek-V3 模型與 Grok-3 打平,並列傳統對話類模型榜首。同時性價比極高,輸入價格僅為Claude-3.7-Sonnet的1/11、GPT-4.5的1/277。此外,新版本開源且可免費用於商業用途。迄今為止,DeepSeek最震動世界的動作還是1月發佈R1。當時人們發現,R1不但在多項標準化指標上的表現均優於OpenAI的模型等西方競爭對手,而且成本據稱僅有數百萬美元,採用的還是較低版本的輝達晶片。R1的異軍突起引發了全球科技股暴跌,因為投資者開始質疑,是否還需要像微軟等矽谷巨頭那樣投入巨資建構突破性的AI模型和AI服務。前幾個月R2頻傳要發佈證券時報指出,自以上V3模型的小版本升級之後,DeepSeek的熱度就開始下降,使用率也有所回落,並且引發了一些質疑。當前,市場最關心的依然是R2模型發佈。今年2月,有媒體稱,1月R1問世後,DeepSeek在加速推出R2,原計畫時間定在5月初,後希望儘早推出,還稱DeepSeek希望,R2在程式碼生成方面表現更佳,並具備在英語之外的語言中進行推理的能力。4月初,DeepSeek聯手清華大學發佈一篇論文,提出一種名為自我原則點評調優(SPCT)的新學習方法,用於推動通用獎勵建模在推理階段實現有效的可擴展性,最終建構出DeepSeek-GRM系列模型。同時,研究者引入了元獎勵模型(meta RM),進一步提升推理擴展性能。上述論文引發了DeepSeek的R2是否很快面世的猜測。4月末,又有消息稱,R2將採用更先進的混合專家模型(MoE),總參數量預計達1.2兆,較6710億參數的R1提升約1倍,單位推理成本較GPT-4劇減97.4%。而且,R2訓練全程未使用輝達顯示卡,全部基於昇騰910B晶片叢集平台,在FP16精度下,計算性能達到512 PetaFLOPS,晶片利用率高達82%,整體性能約為輝達上一代A100叢集的91%。不過,迄今為止DeepSeek都未正式確認任何有關R2發佈時間的消息。在社交媒體X上,有關此次R1模型小版本試升級的消息下面,就有些點贊高的網友評論在猜測R2。有的問,DeepSeek有沒有R2,有的認為,這次的小版本升級可能意味著,R2還遠未準備好推出。 (華爾街見聞)
德媒:從五大領域看中美人工智慧競逐
在很長一段時間裡,美國人工智慧的發展似乎領先中國。然而,深度求索(DeepSeek)推出的R1模型讓人們對這一結論產生質疑。與美國相比,中國在人工智慧發展方面處於什麼位置?本文將從五個方面進行比較。01 大語言模型:DeepSeek對陣OpenAI今年1月,深度求索推出大語言模型的升級版,可以與西方最好的模型相媲美。它所需的算力大大降低,成本也更低。日前,人工智慧體Manus再次驚豔該行業。中國模型的吸引力還在於,許多模型都是開放原始碼的。中國的成功也體現在聊天機器人排行榜上。自今年年初以來,越來越多中國模型出現在排行榜上——前十名中有兩個來自中國,8個來自美國。不過,Google和開放人工智慧研究中心(OpenAI)等美國公司繼續佔據主導地位。徐飛玉是德國思愛普公司前人工智慧主管,現在為公司提供人工智慧方面的建議。她說:“長期以來,中國只是模仿美國的研究突破,而且有一定滯後性,但現在正奮起直追。”過去,中國的大語言模型數量要少得多,功能也沒有那麼強大。徐飛玉說,現在它們的效率更高,創新性更強。不過,美國在技術上仍領先一步。02 圖像和視訊模型:中國“猛虎”正在出擊除了可以生成文字和程式碼的人工智慧模型,圖像和視訊模型被認為具有最大的顛覆潛力。黑森林實驗室公司、“穩定”人工智慧公司、米德朱尼實驗室和開放人工智慧研究中心等美國和歐洲公司在圖像領域處於領先地位。不過,第一個視訊模型來自中國:2022年問世的CogVideo。美國高德納資料諮詢公司分析師閆斌這樣解釋中國視訊模型的成功:“通過抖音等眾多短影片平台和其他應用,中國擁有海量的視覺資料。”2月底,阿里巴巴宣佈將在全球範圍內開源其視訊生成模型通義萬相2.1(Wan 2.1)。該模型支援一鍵生成中英文視訊特效,在對象互動方面被認為是特別先進的。這一功能對許多模型(包括Sora模型)來說都是一大挑戰。還有一些不太知名的中國公司正引領這一領域的發展。根據聊天機器人排名平台聊天機器人競技場和人工智慧分析網的資料,全球最優秀的視訊模型中有6個來自中國。與大語言模型一樣,中國的圖像和視訊模型通常也是開放原始碼的。03 資料:新的“石油”資料是人工智慧模型成功的基礎。清華大學公共管理學院教授孟慶國認為,中國是僅次於美國的第二巨量資料資源國。他認為,資料標註質量的進步將決定中國還是美國在人工智慧競爭中勝出。美國政府已經開發了一個用於人工智慧訓練的政府資料開放平台。中國公司則會混合使用國外的開源資料和中文資料。美國的人工智慧訓練資料市場包括亞馬遜、Google和微軟等科技巨頭,以及攀登人工智慧公司和阿萊吉恩公司等初創公司。這些公司都在爭奪高品質和多樣化的資料集。據北極星市場研究公司估計,該市場價值超過5.8億美元。這對美國公司來說是一個巨大優勢。04 人才:幼兒園裡的人工智慧根據美國高德納資料諮詢公司提供的資料,中國在人工智慧教育方面投入巨大。如今,47%的頂尖人工智慧研究人員來自中國。徐飛玉說:“在中國,孩子們在幼兒園就已經開始接觸人工智慧了。”徐飛玉強調,中國之所以有機會趕上美國,是因為培養了大量聰明和有抱負的人才。在英國《泰晤士報高等教育》雜誌排名前20位的人工智慧大學中,美國有14所,中國有2所。為了在人工智慧發展中保持領先地位,中國必須利用好國內人才並吸引國際人才。▲2月19日,浙江省諸暨市暨南街道南悅幼兒園的孩子們在人工智慧拓展課程上觀看機器人舞蹈。(新華社)05 應用:問題的關鍵百度首席執行官李彥宏認為,2025年是人工智慧應用的關鍵一年。他曾表示:“如果對基礎設施層投入了數千億美元,卻無法開發出能帶來10倍以上回報的應用,那麼這是不可持續的。”中國公司在人工智慧具體應用方面,尤其是在工業領域,領先於美國競爭對手。閆斌認為,中國未來可以更多地從人工智慧競賽中獲益。中國在技術轉化和產品升級方面是領先的。在美國,人工智慧在日常生活中的應用還較少。美國公司主要將人工智慧整合到軟體和聊天機器人中,或者開發專門的應用。閆斌說:“中國擅長人工智慧的應用和進一步技術開發。但在變革性創新方面,美國仍處於領先地位。”他認為,即使是深度求索,也只是對現有技術的成功最佳化。徐飛玉認為,儘管中國已經取得一定成功,但仍在追趕,尤其是由投資者、初創公司和人工智慧基礎設施組成的生態系統仍需進一步發展。她認為,雖然中國有實力雄厚的人工智慧公司,但缺乏多樣性;美國的生態系統更為成熟,但中國有潛力崛起為人工智慧強國。 (參考消息智庫)