這兩天,一款名為DeepSeek的國產人工智慧大模型,攪動了全球的科技界,成為了熱議的話題,且熱度一直不減。
與DeepSeek一同出圈的,是它的創始人梁文峰,這位來自廣東湛江的85後,成為了科技界的大紅人。
1月20日,在李強總理主持召開專家、企業家和教科文衛體等領域代表座談會,梁文鋒在會上發言,並且出現在新聞聯播。
因此,梁文鋒開始被大眾所熟知。
隨著梁文鋒的DeepSeek持續火爆,美股的科技股受到暴擊,上周五AI晶片巨頭輝達暴跌3%。
我寫稿時,美股盤前交易,晶片相關的科技巨頭輝達、台積電雙雙暴跌7.5%,光刻機巨頭ASML暴跌8.5%。
為何梁文鋒橫空出世,把美股科技股給干翻了呢?
這要從梁文鋒和DeepSeek說起。
1985年,梁文鋒出生於廣東省湛江吳川市,覃巴鎮米歷嶺村。
梁文鋒的父母都是小學語文老師,優良的家族基因,讓他從小天資聰穎。
初中和高中,梁文鋒都在吳川最好的吳川第一中學完成,那個時候,他就展現出了對數學的極大天賦。
隨後,梁文鋒以吳川一中高考狀元的身份,考上了浙江大學電子資訊工程專業。
在浙江大學,梁文鋒完成了本科和碩士的學歷,在讀期間,他對投資股票很感興趣,開始積累市場行情,並且探索全自動化量化交易。
2010年,碩士畢業後,梁文鋒與校友合作,創辦了雅比克投資。
5年之後,梁文鋒又與校友徐進,聯合創辦了杭州幻方科技有限公司,希望利用數學和人工智慧來進行投資。
這就是傳說中的量化投資,利用電腦程式,通過數量化的方式,當股市行情達到一定的條件情況下,實現機器自動買入賣出股票,以此來實現盈利。
2016年,幻方量化就上線第一個AI模型,實現自動倉位上線交易。
很快,AI量化模型就開始大行其道,市面上幾乎所有的量化私募基金公司,都使用AI量化策略。
梁文鋒的幻方量化以火箭般的速度成長,僅用了4年時間,其管理的基金就突破百億規模。
2021年,幻方量化成為首家突破千億的量化私募基金。
在類似幻方量化這樣的基金公司面前,普通散戶被降維打擊,處於被吊打的處境。
量化基金憑藉技術優勢和資訊優勢,以及特殊的席位和通道,可以進行快速高頻的交易,把A股的股民折騰得死去活來,虧損纍纍。
而量化基金本身,卻賺得盆滿缽滿。
2023年,幻方量化一員工向慈善機構捐贈1.38億元,登上了熱搜。
人們這才驚奇地發現,原來幻方量化一直悶聲發大財,富得流油。
再加上A股這幾年一直跌跌不休,股民虧損纍纍,對量化私募公司也是怨聲載道,非議頗多。
梁文鋒在做量化投資的同時,也在思考如何轉型,做更多技術造福人類的事情。
2022年11月30日,美國微軟投資的工人智能公司OpenAI,發佈了史無前例的大模型ChatGPT,火遍全球。
此時,在人工智慧落地應用投資積累多年的梁文鋒,看到了新的機遇。
2023年5月,梁文鋒確定要做通用人工智慧(AGI),於是成立了杭州深度求索人工智慧基礎技術研究有限公司,即現在紅極一時的DeepSeek,開始投身研發大模型。
此後,國產大模型如雨後春筍,各個網際網路大廠資金技術實力雄厚,率先發佈自己的大模型。如百度發佈文心一言,阿里發佈通義千問,字節跳動發佈豆包,騰訊發佈混元等。
這些大廠的大模型,與OpenAI的ChatGPT,始終有一條不可踰越的鴻溝,功能還去甚遠。
因此,人工智慧領域有一種說法,中國的大模型始終落後美國半年到一年以上。
就在美國的OpenAI在中國,打著望遠鏡都找不到對手的時候,DeepSeek悄無聲息地發佈了自己的大模型。
2024年5月,DeepSeek V2發佈,並且率先在業內打起價格戰,推理成本每百萬token不到1元錢,只有GPT-4 Turbo的七十分之一。
12月26日,DeepSeek再次發佈DeepSeek V3,成本再次降低,擊穿行業價格。
1月20日,對標ChatGPT o1的推理大模型,DeepSeek R1正式版發佈,價格直接將ChatGPT o1按在地上瘋狂摩擦。
DeepSeek極其低廉的價格,讓美國矽谷震驚,當他們回過神來,才發現DeepSeek的訓練成本,簡直吊打ChatGPT。
原來DeepSeek的訓練成本為558萬美元,這一成本遠低於GPT-4o的訓練成本,僅為GPT-4o的約1/2012。
DeepSeek的訓練過程使用了2048張H100的GPU叢集,用時僅53天。
相比之下,全球AI第一梯隊的頭部公司通常需要使用1.6萬張以上的GPU進行訓練14。
此外,DeepSeek-V3的整個訓練過程僅用了不到280萬GPU小時,而Meta旗下頂尖的開源模型Llama-3405B的訓練時長是3080萬GPU小時。
DeepSeek的橫空出世,不僅讓美國的大模型公司倍感震撼,甚至讓晶片巨頭輝達也坐立不安。
通過靠堆算力、堆晶片這種大力出奇蹟的人工智慧方向,被DeepSeek無情打破,輝達晶片銷售未來無限增長的夢想,也被DeepSeek終結。
這是不是意味著,在人工智慧領域,美國希望通過高端晶片來卡中國的脖子的企圖,也可能失算呢?
這才是美國科技界感到後怕和恐怖的地方。
於是,美國的科技股開始出現暴跌,資金的風險偏好開始變低,從而進一步帶崩了幣圈,比特幣價格跌破10萬美金,山寨幣血流成河。
一隻南美洲的蝴蝶搧動翅膀,結果可能引發美國德克薩斯州的一場龍捲風。蝴蝶效應背後的原理,是一個微小的變化能影響事物的發展。
2年前,梁文鋒轉型做AGI的時候,引發美國人工智慧大地震的那隻蝴蝶,已經搧動了翅膀。
希望梁文鋒的DeepSeek,成為刺破美國科技股泡沫的那根鋼針! (投資家)
