最近,DeepSeek 火遍國內外,其創始人梁文鋒成為焦點。
春節除夕夜,梁文鋒的家鄉-廣東湛江吳川市米歷嶺村,比往年更添了幾分熱鬧。
當昔日“小神童”的梁文鋒踏進家鄉時,村口高掛的橫幅寫著“熱烈歡迎文鋒,家鄉的驕傲與希望!”,街邊的雙喜拱門上則寫著“文鋒回鄉傳佳績,鄉村振興添動力」。
近日,梁文鋒還現身央視《新聞聯播》,以DeepSeek 創始人的身份參加一場座談會並進行現場發言。
老狐最近看了不少梁文鋒的成長經歷和最近發言,也對這位創始人有了更深的認識。
1985 年,梁文鋒出生在廣東湛江吳川市的一個普通教師家庭,父母都是小學語文老師。
梁文鋒從小就是學校裡的“尖子生”,並在數學學科中表現出極大天賦。小學六年級時,梁文鋒順利考上吳川一中。國中時就自學完了高中數學,還開始接觸大學數學。
最後一排右邊第6個是梁文鋒。圖源:湛江青年
2 002 年,17 歲的梁文鋒以吳川一中的「高考狀元」成績考入浙江大學電子資訊工程專業,一路攻讀資訊與通訊工程碩士學位。
在浙江大學求學期間,梁文鋒不僅學業成績優異,更是各種學術競賽和社團活動的積極參與者和表現的佼佼者。
2008 年,全球金融危機爆發,梁文鋒帶領團隊探索機器學習技術在全自動量化交易中的應用潛力,為日後的創業埋下了「種子」。
研究生畢業後,梁文鋒先後在網易、阿里巴巴等網路企業中累積了豐富的實戰經驗。
然而他並沒有像周圍人一樣去大廠當個程式設計師,而是選擇了創業。
2013 年,梁文鋒與浙大同學徐進共同創立杭州雅克比投資管理有限公司。
2015 年,又創立杭州幻方科技有限公司(即幻方量化),致力於透過數學和人工智慧進行量化投資,到了2021 年,其資產管理規模已經突破千億,成為國內量化私募「四大天王」之一。
這段經歷不僅展現了梁文鋒在金融科技領域的卓越眼光,也為他後續轉戰人工智慧領域積累了豐富的經驗和資本。
2022 年,OpenAI 發表了ChatGPT,全球為之震動。梁文鋒敏銳地捕捉到這一機遇,2023 年果斷進軍通用人工智慧(AGI)領域,成立了DeepSeek。
今年春節期間,DeepSeek 一舉登頂中國大陸和美國應用程式商店的免費APP 下載排行榜,引起全球科技界的廣泛關注。
更令人驚訝的是,DeepSeek 從成立到成為“東方神秘力量”,僅用了短短一年多時間。研發團隊只有140 人,使用2048 塊低端GPU,在兩個月內投入557.6 萬美元(約4000 萬元人民幣),成功研發出震驚世界的大模型。
在研發DeepSeek-V2 模型時,團隊面臨如何在降低成本的同時保證模型效能的挑戰。梁文鋒帶領團隊進行了無數次試驗,嘗試了各種不同的技術組合。
經過連續一個月的艱苦努力,團隊成功最佳化了模型,不僅將推理成本降到每百萬token 僅1 塊錢,約等於GPT-4 Turbo 的七十分之一,被稱為「AI 界的拼多多”,還在性能上有了顯著提升。
同時,DeepSeek 宣佈上線並同步開源DeepSeek-V3 模型,公佈了長達53 頁的訓練和技術細節。
模型測算資料顯示,DeepSeek-V3 雖然在文字生成類別任務上表現較弱,但其程式碼、邏輯推理和數學推理能力都名列前茅。
1 月20 日晚,DeepSeek 正式發表DeepSeek-R1 模型,該模型在數學、程式碼、自然語言推理等任務上,性能比肩OpenAI 的GPT-4 正式版,並同步開源模型權重,公開訓練技術,促進技術社區的交流與創新協作。
1 月26 日,《黑神話:悟空》的製作人馮驥稱DeepSeek 可能是一個「國運級」的科技成果,他激動地表示:
「太幸運了!太開心了!這樣的震撼突破,來自一個純粹的中國公司。知識與資訊平權,至此又往前邁出了堅實的一步。”
面對這一評價,DeepSeek 創始人梁文鋒在除夕夜回應道:「用程式碼當磚瓦,拿演算法做鋼筋,在資本與質疑的裂縫中,硬生生壘出通往未來的棧橋。」他在知乎的一篇長文中,詳細分享了這次被譽為「國運級」突破背後的故事。
梁文鋒提到,DeepSeek 的團隊始終站在開源社區的肩膀上,透過不斷努力推進國產大模型的技術進步。
他特別分享了一些細節:例如,支援聯網搜尋的功能來自於內測使用者三十天凌晨三點提交的錯誤日誌;一位視障開發者使用DeepSeek 的API 開發出「氣味導航」應用,讓他深刻意識到科技的真正意義,不僅在於創新,更在於它對社會的貢獻與改變。
在另一場訪談中,梁文鋒直言:“很多人驚訝DeepSeek 能在矽谷層出不窮的創新中脫穎而出,其實在美國每天發生的大量創新裡,我們的表現也許並不出奇。”
但關鍵在於,這是一家中國公司以真正的創新貢獻者身份參與全球遊戲。大部分中國公司習慣於跟隨,而非從根本上做原創。
老狐認為更深的衝擊或許在於,DeepSeek 選擇了一條「反常識」路徑——將核心技術開源。
這不僅是商業策略,更是一種文化宣言:當矽谷用閉源生態築起護城河時,中國公司試圖用開放共享重構技術話語權。
此外,中國長期以來依賴西方技術,造成了創新信心的缺乏和技術生態的斷層。以輝達的CUDA 為例,數十年的技術積累與協作讓其在全球佔據了主導地位,而中國的晶片產業和演算法研發則面臨全鏈條的生態缺失。
截至目前,7 家中國大模型創業公司中,它是唯一一家放棄「既要又要」路線,至今專注於研究和技術,未做to C 應用的公司。
這樣的選擇背後或許可以從梁文鋒的發言中窺見一二:
「過去很多年,中國公司習慣了別人做技術創新,我們拿過來做應用變現,但這並非是一種理所當然。這一波浪潮裡,我們的出發點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展。
另一方面,DeepSeek 也是7 家大模型公司中唯一一家未全面考慮商業化,堅定選擇開源路線甚至都沒融過資的公司。
用“開放共享”取代“閉源收稅”,正好印證了梁文鋒團隊提到的護城河不在程式碼裡,而在人的腦子裡。在顛覆性的技術面前,閉源形成的護城河是短暫的,技術沒有秘密,但重設需要時間和成本。
「選用了一群沒有經驗但有潛能的人,以及有一個可以讓創新發生的組織架構和企業文化」。這是梁文鋒這家大模型創業公司可以與大廠競爭的秘密所在。
OpenAI 前政策主管、Anthropic 聯合創始人Jack Clark認為,DeepSeek 僱傭了一群高深莫測的奇才。
「並沒有什麼高深莫測的奇才,都是一些Top 高校的應屆畢業生、沒畢業的博四、博五實習生,還有一些畢業才幾年的年輕人。”
“我們選人的標準一直都是熱愛和好奇心,V2 模型沒有海外回來的人,都是本土的。前50 名頂尖人才可能不在中國,但也許我們能自己打造這樣的人。”
梁文鋒透過「獨具一格」的用人策略,結合自下而上的創意湧現與自上而下的資源調度,成功營造了充滿創新文化的氛圍,推動公司在技術創新中保持強大動力與靈活性。
DeepSeek 的意義或許遠超一家公司的成敗,它驗證了一個更宏大的命題:中國能否從「技術消費者」進化為「技術創造者」?
DeepSeek 選擇開源後,DeepSeek-R1 被全球47 所頂尖大學引入課程,GitHub 衍生項目超3000 個。這種「技術傳染力」正在孵化下一個AI技術社區,而這正是中國科技一個新的突破與開始。
DeepSeek 的崛起不僅促使中國科技創新反思,也讓OpenAI 重新審視其開源策略。
在最近的Reddit AMA 中,OpenAI CEO 奧特曼公開承認在開源權重AI 模型這個問題上,我們站錯了隊,已經認識到閉源並非保持領先的唯一途徑。
緊接著,OpenAI 緊急上線o3-mini 模型,免費使用者也可以使用。與此同時,奧特曼也宣稱內部正在考慮開源策略,繼續研發模型,但OpenAI 領先優勢不會像以前那麼大了。
可以看到的是,梁文鋒帶領下的DeepSeek,這條「鯰魚」仍在持續攪動全球科技界的風雲。
參考資料:
新聞聯播
暗湧Waves
21世紀經濟報導 (科技狐)