AI大模型開源閉源的路線之爭誰贏誰輸?
相信不少關注AI動態的朋友們已經聽說了,就在上周,Meta發布了其最新開源模型Llama 3,號稱是目前最強大的開源大語言模型。
這隻「羊駝」一亮相,立刻在AI圈引發了不小的震動。
那麼這個Llama 3到底有多強呢?
根據大模型競技場評估數據顯示,Llama3 70B猛升到第5位,性能已經超過了部分早期版本的GPT4和絕大部分閉源模型!
關於性能(如下),基本上就是秒殺,一個字牛!直接對標GPT4。
跑分5個評測集:MMLU(學科知識理解)、GPQA(一般問題)、HumanEval(程式碼能力)、GSM-8K(數學能力)、MATH(比較難得數學)
下面的圖表顯示了對Claude Sonnet,Mistral Medium和GPT-3.5進行的這些類別和提示的人工評估的總結結果。
META的騷氣:為了防止我們的模型在這個評估集上意外過度擬合,即使我們自己的建模團隊也無法存取它
Meta發布全新Llama 3系列模型僅僅4天后,這個模型在Hugging Face的開源庫中就衍生出了多達1013種的Llama變體,獲得了開發者的熱烈追捧和響應。
除此之外,Meta的下一步,正在開發一款超過4000億參數的Llama3模型,期待到底有多強!
吳恩達,有史以來最好禮物。
馬斯克,一句「Not bad」 表達認可,有點酸有點醋。
Jim Fan英偉達資深科學家,認為即將推出的Llama 3-400B+模式將是社群獲得GPT-4等級模式的重要里程碑。
Meta首席AI科學家楊立昆也在推特上喊話:“Llama3-400B+將標誌著社區獲得GPT-4級模型的分水嶺時刻!”
看來這隻"羊駝"的實力確實不容小覷。
不過,Llama家族目前只發行了8B和70B兩個版本,更多的兄弟姊妹還在路上。
Meta方面表示,未來幾個月內,還會陸續有更多型號的Llama模型面世。看來Meta這是要將開源進行到底了。
除了語言模型,最近Meta又宣布向第三方開放自家的VR/AR作業系統-Meta Horizon OS,聯想、微軟、華碩等大廠都已入列為首批合作夥伴。
這不禁讓人聯想到當年谷歌對安卓系統的開放,雖然Gmail、谷歌地圖等核心應用依然是閉源的,但開放的安卓系統本身卻成為了行動互聯網時代的重要基礎設施。
當然,Meta的開源並非完全無私,其商業野心也是明確的。
透過開源吸引更多開發者參與最佳化模型,同時這些改進成果也可以反哺到自家的閉源模型中。等生態建設得差不多了,Meta就可以透過提供技術支援、API等方式向開發者們收費了。商業模式可謂清晰明了。
對標Llama的,除了Meta自己的閉源模型之外,OpenAI、Anthropic、DeepMind這些巨頭們也都在默默發力。
就拿最近大火的國產AI“月之暗面”為例,其CEO楊植麟就直言不諱地表示:“開源模型會越來越落後,未來還是閉源模型的天下。”
原因無他,閉源模型背後有持續的資金和人才投入,而開源社群的貢獻品質參差不齊。
月之暗面雖然也推出了自己的開源模型——Dark Moon,但楊植麟坦言這更多是一種行銷手段,為的是吸引更多開發者上自己的平台,真正的核心還是閉源的。
對於這場開閉源之爭,業界大佬們也是見仁見智。
周鴻禕就曾表示,沒有開源就沒有今天的網路。但百度CEO李彥宏卻認為,大模型開源的意義有限,閉源模型在效果和性價比上反而更有優勢。
李彥宏還打了一個比方:就像自己做飯,從超市買來現成的食材(開源模型)總歸沒有自己從農場精心挑選培育(閉源訓練)出來的食材更新鮮美味。
不過在我看來,開源和閉源並非水火不容,而是可以相輔相成的。
一方面,頭部大廠們肯定還是會持續投入閉源模型的研發,這就是他們的核心競爭力所在。
但另一方面,開源模型的存在,恰恰為眾多中小企業、創業家提供了一個很好的"跳板"。
站在巨人的肩膀上,他們只需在開源的基礎模型上,針對特定垂直領域進行微調,就能以較低成本快速推出有競爭力的產品,而不必從0到1啃下龐大的預訓練這塊"硬骨頭"。
事實上,目前不少火熱的AI應用,底層都用的是開源模型。
以Stable Diffusion為例,基於它衍生出的AI繪畫、AI影片工具數不勝數,為一般使用者都帶來了極大的創作便利。
當然,僅僅套殼肯定是不夠的。關鍵在於要找準市場需求,為開源模型"賦能"出有價值的垂直化應用。
這其中既包括針對細分領域進行適配的能力,也包括在產品設計、使用者體驗上多下功夫。
總的來說,我對這場大模型開閉源之爭持樂觀態度。
放眼全局,無論是開源的"羊駝"們,還是閉源的"獨角獸"們,他們的終極目標都是一致的——那就是推動人工智能技術造福人類。
在這個過程中,頭部玩家的深耕和垂直領域的百花齊放同樣不可或缺。
身為一個AI從業者和深度用戶,我由衷感慨,能生活在這樣一個人工智慧蓬勃發展的時代,見證並參與這場轟轟烈烈的技術革命,是我們這一代的幸運。
AI的故事才剛開始,未來可期,就讓我們拭目以待吧!
對了,Llama3大模型位址:llama.meta.com/llama3/
官網也提供了體驗環境:www.meta.ai,不過需要魔法和facebook帳號。
國內直接用的話推薦這個AI工具站:BotGo·機器國,關注下面的公眾號即可使用。
這個工具站技術實力很強,但凡有最新的AI大模型或AI機器人一推出,它總是能緊跟著上線,例如最近熱門的Claude3系列、Kimi、Suno音樂創作,包括這次的Llama3也是。
還有很香的地方在於大部分的模型都可以永久免費無限用,比如這次的Llama3就是,還有GPT3.5、Kimi等很多國內外大模型,高級模型每天簽到也都有免費額度贈送。 (AI邦)