近日,中共中央政治局常委、國務院總理李強主持召開專家、企業家和教科文衛體等領域代表座談會,聽取對《政府工作報告(徵求意見稿)》的意見建議。
座談會上共有9人先後發言,就解決當前發展中的問題、做好今年政府工作提出了意見建議。其中就有近期震動全球AI圈的DeepSeek創始人梁文鋒。
DeepSeek,全稱“杭州深度求索人工智慧基礎技術研究有限公司”(下文稱中國深度求索公司),成立於2023年7月,由量化資管巨頭幻方量化創立,創始人梁文鋒在量化投資和高性能計算領域具有深厚的背景和豐富的經驗。
2024年12月,DeepSeek-V3在全球AI領域掀起巨大波瀾,它以極低的訓練成本,實現了與GPT-4o等頂尖模型相媲美的性能,震驚業界。
隨著DeepSeek推出新模型DeepSeek-R1,1月27日,Deepseek應用登頂蘋果中國地區和美國地區應用程式商店免費App下載排行榜,在美區下載榜上超越ChatGPT。
DeepSeek是一款大型語言模型。它擁有強大的自然語言處理能力,就像是一個聰明又懂你的助手,能夠像朋友一樣理解並回答問題。根據其背後的演算法和資料支援,還能幫助你寫程式碼、整理資料,甚至解決一些複雜的數學問題。
提到類似的大模型,大家的第一印象或是OpenAI開發的ChatGPT。從2024年9月OpenAI發佈o1-preview到現在,僅僅過去不到四個月,市場上媲美甚至超越其性能的推理模型遍地開花。
之所以DeepSeek可以從眾多模型之中異軍突起,是因為它不僅率先實現了媲美OpenAI-o1模型的效果,更是將推理模型的成本壓縮到了極低。
在本月世界經濟論壇2025年年會開幕當天,中國深度求索公司發佈其最新開源模型R1,再次引發全球人工智慧領域關注。
DeepSeek-R1在技術上實現了重要突破——用純深度學習的方法讓AI自發湧現出推理能力,在數學、程式碼、自然語言推理等任務上,性能比肩OpenAI-o1模型正式版,該模型同時延續了該公司高性價比的優勢。
據瞭解,DeepSeek-R1模型訓練成本僅為560萬美元,遠遠低於美國開放人工智慧研究中心、Google、“元”公司等美國科技巨頭在人工智慧技術上投入的數億美元乃至數十億美元。
關於價格,創始人梁文鋒曾在接受媒體採訪時表示,無論是API還是AI都應該是普惠的、人人可以用得起的東西。
△DeepSeek R1模型與o1類推理模型輸入輸出價格對比(圖源/DeepSeek)
DeepSeek持續引發業內震動。臉書母公司Meta已成立專門小組展開研究和學習。
北京郵電大學人工智慧學院人機互動與認知工程實驗室主任劉偉表示,DeepSeek最大優勢在於演算法的改進和最佳化,如果說OpenAI是“大力出奇蹟”,那麼DeepSeek小力也可以出奇蹟。
此外,值得關注的是DeepSeek採用完全開源策略。
曾經OpenAI創立的初衷,是希望“以最有可能造福全人類的方式推進數字智能發展,而不受產生財務回報需求的限制”。然而在GPT-3發佈之後,OpenAI限制了對模型的存取權,在GPT-4發佈之後更是隱藏了其訓練資料和模型權重,完全走向了“閉源”。
DeepSeek的完全開源策略不僅降低了使用者的使用門檻,還促進了AI開發者社區的協作生態。通過開源,DeepSeek吸引了大量開發者和研究人員的關注,他們可以在平台上自由獲取和修改模型程式碼,共同推動AI技術的發展。
輝達高級研究科學家JimFan在其個人社交平台表示,“我們正身處這樣一個歷史時刻:一家非美國公司正在延續OpenAI最初使命——通過真正開放的前沿研究賦能全人類。”
市場分析師認為,中國深度求索公司的模型的推出如同一顆“震撼彈”,令市場對美國科技行業的競爭力產生疑慮,讓投資者質疑美國公司的領先優勢、投資規模以及支出是否會帶來利潤。
當地時間1月27日,受DeepSeek衝擊,美國人工智慧主題股票遭拋售,美國晶片巨頭輝達股價歷史性暴跌,納斯達克綜合指數大幅下跌。
截至當天收盤,輝達公司股價下跌16.97%,市值一日內蒸發近6000億美元,創美國歷史上任何一家公司的單日最大市值損失。
納斯達克副主席麥柯奕表示,人工智慧仍是最重要的科技革命之一,而中國深度求索公司將是其中重要組成部分。 (新聞聯播)