隨著ChatGPT的火爆,AI產業今年開始進入新的階段。
在2015年前,人工智能發展以小模型為主導地位,能夠較好地適應在垂直領域的分析任務,但是在通用交互相關的任務上,由於表達和理解能力欠缺,無法完成生成類的任務。但隨著計算機深度學習模型的進展,同時算力成本降低,逐漸開始探索並訓練大語言模型。
可以說大模型的出現,大家才真正看到人工智能的影子。大模型提高了人工智能的水平和範圍,使得人工智能能夠處理更複雜和多樣的語言問題,如文本理解、生成、翻譯、摘要、問答等。它極大地推動了人工智能的創新和想像,馬化騰表示“這是幾百年不遇的、類似發明電的工業革命一樣的機遇。”
AI已經是戰略上的必爭之地,小到企業大到國家。
一、產業環境競爭
當前,美國、中國、歐洲、以色列、加拿大等國家和地區都在AI領域展開激烈的競爭。
美國作為AI的重要發源地,擁有眾多技術巨頭和頂尖研究機構,一直保持著領先地位。中國則通過國家戰略和大力投資,迅速崛起成為全球AI領域的重要力量。歐洲和其他國家也在加大投入,試圖縮小與美中兩國的差距。
7月7日由中國科學技術信息研究所研製的《2022全球人工智能創新指數報告》發布,報告顯示,當前全球人工智能發展總格局是由中美兩國引領、多國呈梯次分佈的格局。
按照2022年人工智能創新指數得分排名,可將46個參評國家分為四大梯隊。
第一梯隊國家得分為50分以上,只有美國和中國進入。美國的得分已連續四年位居全球第一,中國連續三年保持全球第二水平。第二梯隊國家得分為35~50分,包含英國、德國、新加坡等11個國家。第三梯隊國家得分為20~35分,包括丹麥、芬蘭等12個國家。第四梯隊國家得分為20分以下,包括捷克、巴西等21個國家。
如果單看分數看起來有些絕對,其實AI產業的競爭格局是一個多極化和分化的現象,不同的國家和地區在AI產業中有不同的優勢和特色。
例如美國在AI基礎研究、創新能力、人才培養等方面領先;中國在AI應用場景、數據規模、市場潛力等方面領先,在人才、教育、專利產出等方面有所進步,但基礎資源建設水平仍有待提高;歐盟在AI倫理、法律、標準等方面領先;其他國家和地區如日本、韓國、印度、以色列等在某些細分領域也都有突出表現。
整體來看,在今年ChatGPT發酵之前,全球就在AI領域持續積累。各國都在積極培育本土AI產業,努力形成完整的AI產業鏈,以確保在全球競爭中有更強的話語權。
2022年,參評國家的人工智能企業總數和人工智能從業人口總數繼續增長,且增幅均有所擴大。人工智能企業總數同比增長25%,高於2021年的18%;人工智能從業人口總數同比增長53%,顯著高於2021年的10%。
從重要的基礎建設數據中心的數量看,近三年參評國家託管型數據中心總量持續增長,其中有三分之一的國家相比2020年增長了10%以上。美國、英國、德國等國家進入全球500強的超算數量持續增加。激烈的競爭下,中國在超算上的優勢反而有所減弱,中國超算佔全球比重從2020年的45%下降到2022年的35%。
無疑世界各國對AI的重視已經到了空前的高度。該報告對於各國在政策完備性和人工智能治理的重視程度也進行了評分。
根據報告,相比2021年,無論是人工智能創新制度一級指標,還是政策規劃和治理兩個二級指標,2022年幾乎所有參評國家的分數都有所增加。其中,英國、新加坡、美國、中國、澳大利亞五個國家的政策規劃得分提高最多,英國、新加坡、法國、澳大利亞、日本五個國家的治理得分提高最多。
此外,值得一提的是,中國在AI論文數量上佔據了絕對的優勢。據斯坦福大學發布的《2023 年AI 指數報告》統計,人工智能論文的總數自2010年呈現翻倍增長,從2010年的20萬篇增長到2021年的近50萬篇(49601),中國保持領先地位,2021年佔比為39.8%,其次是歐盟和英國(15.1%)與美國(10% )。
二、算力競賽
ChatGPT爆發後,算力是漲的最好的板塊之一。
作為AI環境的基礎建設,算力需求的確定性要遠大於AI產業鏈的其他板塊。算力成為AI發展的關鍵基石是產業的新共識。
根據國盛數據,歷代GPT參數量呈現指數級增長。訓練一次1750億參數的GPT-3模型需要的算力約為3640 PFlop/s-day(即假如每秒計算一千萬億次,需要計算3640 天)。但這算力消耗速度很快被新一代模型刷新。GPT-4 不僅支持文本輸入,還支持圖像輸入,文字輸入限制提升至2.5 萬單詞,所需計算規模大幅提升。
而根據OpenAI 統計,AI 訓練任務中的算力增長(所需算力每3.5個月翻一倍)已經超越摩爾定律(晶體管數量每18 月翻一倍)。
中國信通院《中國算力發展指數白皮書》測算,2021 年全球算力規模超過615EFLOPS(1 個EFLOPS 代表10^18FLOPS),同比增速高達44%左右,而後續幾年則將迎來算力引爆時代。信通院報告預測,2030年全球算力規模有望達56ZFLOPS,2022-2030年復合增長率達65%。
有趣的是,世界各國對於算力的佈局情況與GPD正相關,屬於相互影響的關係。根據IDC的報告,計算力指數平均每提高1個點,數字經濟和GDP將分別增長3.3‰和1.8‰
2021年算力規模前20的國家中有17個是全球排名前20的經濟體,中美遙遙領先。美國、中國、歐洲、日本在全球算力規模中的份額分別為34%、33%、14%和5%,其中全球基礎算力美國份額達37%,中國以26%份額排名第二;智能算力方面,中國、美國分別佔比為45%和28%;美國、日本、中國在超級計算綜合性能指標方面份額分別為48%、22%、18%。
AI對於整個算力產業需求的拉動將會非常顯著,而最重要最基礎的算力競爭在於芯片。
面對數據中心海量數據處理工作,傳統CPU計算結構越來越難滿足需求,輔助CPU進行數據運算的協處理器應運而生。運算協處理器基於不同設計架構存在多條技術路線,包括通用GPU(GPGPU)、FPGA、ASIC 等,它們是目前主流的AI芯片類型。
GPU是圖形處理器,最初用於圖形渲染,但後來被發現非常適合神經網絡訓練和推理。GPU具有大量的並行計算能力,這使其能夠快速處理大量數據。
FPGA是現場可編程門陣列,是一種可以重新編程以適應不同應用的芯片。FPGA具有靈活性和可編程性,這使其非常適合開發新的AI算法。
ASIC是專用集成電路,是一種專門為特定應用設計和製造的芯片。ASIC具有高性能和低功耗,這使其非常適合部署在邊緣設備上的AI應用。
GPU 憑藉強通用性和完善軟件生態系統成為該領域的主流解決方案。據IDC數據,2021年我國搭載GPU服務器銷售額佔據AI 加速服務器市場的88.4%,遠超搭載ASIC、FPGA等服務器。
2022年CPU市場規模約249 億美元。從市場競爭格局來看,Intel 和AMD 兩家佔據市場主要份額,其中英特爾憑藉至強系列市場份額維持在60%以上,AMD 市場份額持續提升。根據IDC 數據,2Q22 英特爾和AMD 服務器CPU 全球出貨量份額分別約為63.7%和29.2%,合計佔據全球市場89.9%的份額。
最關鍵的GPU市場,英偉達和AMD基本包攬全場,英偉達佔據壟斷級別的優勢,而英特爾佔比極小。根據JPR的數據,2022年Q3獨立顯卡市場份額:英偉達佔據88%,AMD 佔8%,英特爾為4%。華泰估算2022年獨立GPU市場規模超166億美元。
從區域市場發展水平來看,美國憑藉英偉達、AMD、英特爾三巨頭霸占全球GPU芯片研發領域的主導地位;歐盟、日本、韓國處於第二梯隊,歐盟、英國擁有先進的芯片設備製造技術,日本、韓國憑藉領先的半導體材料研發和製造技術等優勢搶占市場份額;而以中國為代表的發展中國家還在努力追趕中。
三、百模大戰
2022年11月,OpenAI發布聊天機器人ChatGPT,點燃生成式AI的燎原戰火。2023年,全球AI佈局加速,在AI大浪潮下,國內外科技廠商紛紛入局,密集上線大模型。
2023年2月,Meta AI在其官網公開發布了LLaMA大型語言模型。5月,Google 發布新一代大語言模型PaLM2。國內方面,百度於3月發布文心大模型。隨後,商湯、阿里雲、科大訊飛、華為等陸續發佈各自的大模型。
AI 行業呈現出“百模大戰”的格局,戰局非常混亂,幾乎所有的科技平台龍頭都積極下場參與。
AI 大模型是一個資本密集,人才密集和數據密集的產業。千億級參數模型訓練一次成本就超過1200萬美元,可以看得出來這是平台之戰。國外大模型PaLM-E、Visual ChatGPT、GPT-4 的模型參數量分別為5620億,1750 億和1750億。國內大模型中,模型參數數量達千億的模型有文心大模型(2600 億),盤古NLP (千億級)等。
是否擁有大語言模型將成為衡量科技企業甚至衡量國家綜合實力的重要尺度之一,而更遠的競爭在於掌握全球AI產業的主導權和主動權。贏得大模型之戰,後續AI很多相關的發展都可能在它的框架之下運作,AI+下半場有望演繹以大模型為入口向終端應用擴散的過程,類似於AI時代的“App Store”。
未來的日子,AI領域的節奏會逐步加快。例如類安卓系統的AI路線,Meta已經想快速搶占坑位。7月19日,Meta發布最新AI大語言模型LLaMa2系列,模型信息和起始代碼全部開源,並支持免費可商用。相較於今年2月發布的LLaMa1,最新LLaMa2訓練所用的token翻了一倍至2萬億。同時,Meta還宣布與微軟、高通公司展開合作,LLaMa2將部署在微軟雲服務Azure上,同時LLaMa2將能在高通芯片上運行,打破市場上英偉達、AMD處理器對AI算力市場的壟斷。
雖然現在大模型格局模糊不清,但參考過去科技產業的發展,未來可能只會剩下國內外各數家的寡頭競爭格局。
四、結語
從產業孵化環境,到算力基礎建設,再到底層大模型,是AI競賽最火熱也是最重要的幾個領域。
無論AI未來以什麼形式存在,底層的東西需要把握在手裡。(乘風)