祖克柏掀桌子了! Meta的Llama3開源模型爆火,硬剛李彥宏的閉源路線


AI大模型開源閉源的路線之爭誰贏誰輸?

相信不少關注AI動態的朋友們已經聽說了,就在上周,Meta發布了其最新開源模型Llama 3,號稱是目前最強大的開源大語言模型。

這隻「羊駝」一亮相,立刻在AI圈引發了不小的震動。

那麼這個Llama 3到底有多強呢?

迄今為止最強的開源大模型

根據大模型競技場評估數據顯示,Llama3 70B猛升到第5位,性能已經超過了部分早期版本的GPT4和絕大部分閉源模型!


關於性能(如下),基本上就是秒殺,一個字牛!直接對標GPT4。

跑分5個評測集:MMLU(學科知識理解)、GPQA(一般問題)、HumanEval(程式碼能力)、GSM-8K(數學能力)、MATH(比較難得數學)


下面的圖表顯示了對Claude Sonnet,Mistral Medium和GPT-3.5進行的這些類別和提示的人工評估的總結結果。

META的騷氣:為了防止我們的模型在這個評估集上意外過度擬合,即使我們自己的建模團隊也無法存取它


Meta發布全新Llama 3系列模型僅僅4天后,這個模型在Hugging Face的開源庫中就衍生出了多達1013種的Llama變體,獲得了開發者的熱烈追捧和響應。

除此之外,Meta的下一步,正在開發一款超過4000億參數的Llama3模型,期待到底有多強!


AI大佬評價

吳恩達,有史以來最好禮物。


馬斯克,一句「Not bad」 表達認可,有點酸有點醋。


Jim Fan英偉達資深科學家,認為即將推出的Llama 3-400B+模式將是社群獲得GPT-4等級模式的重要里程碑。


Meta首席AI科學家楊立昆也在推特上喊話:“Llama3-400B+將標誌著社區獲得GPT-4級模型的分水嶺時刻!”


開源閉源之爭

看來這隻"羊駝"的實力確實不容小覷。

不過,Llama家族目前只發行了8B和70B兩個版本,更多的兄弟姊妹還在路上。

Meta方面表示,未來幾個月內,還會陸續有更多型號的Llama模型面世。看來Meta這是要將開源進行到底了。

除了語言模型,最近Meta又宣布向第三方開放自家的VR/AR作業系統-Meta Horizo​​​​n OS,聯想、微軟、華碩等大廠都已入列為首批合作夥伴。

這不禁讓人聯想到當年谷歌對安卓系統的開放,雖然Gmail、谷歌地圖等核心應用依然是閉源的,但開放的安卓系統本身卻成為了行動互聯網時代的重要基礎設施。


當然,Meta的開源並非完全無私,其商業野心也是明確的。

透過開源吸引更多開發者參與最佳化模型,同時這些改進成果也可以反哺到自家的閉源模型中。等生態建設得差不多了,Meta就可以透過提供技術支援、API等方式向開發者們收費了。商業模式可謂清晰明了。

對標Llama的,除了Meta自己的閉源模型之外,OpenAI、Anthropic、DeepMind這些巨頭們也都在默默發力。

就拿最近大火的國產AI“月之暗面”為例,其CEO楊植麟就直言不諱地表示:“開源模型會越來越落後,未來還是閉源模型的天下。”

原因無他,閉源模型背後有持續的資金和人才投入,而開源社群的貢獻品質參差不齊。

月之暗面雖然也推出了自己的開源模型——Dark Moon,但楊植麟坦言這更多是一種行銷手段,為的是吸引更多開發者上自己的平台,真正的核心還是閉源的。

對於這場開閉源之爭,業界大佬們也是見仁見智。

周鴻禕就曾表示,沒有開源就沒有今天的網路。但百度CEO李彥宏卻認為,大模型開源的意義有限,閉源模型在效果和性價比上反而更有優勢。


李彥宏還打了一個比方:就像自己做飯,從超市買來現成的食材(開源模型)總歸沒有自己從農場精心挑選培育(閉源訓練)出來的食材更新鮮美味。

不過在我看來,開源和閉源並非水火不容,而是可以相輔相成的。

一方面,頭部大廠們肯定還是會持續投入閉源模型的研發,這就是他們的核心競爭力所在。

但另一方面,開源模型的存在,恰恰為眾多中小企業、創業家提供了一個很好的"跳板"。

站在巨人的肩膀上,他們只需在開源的基礎模型上,針對特定垂直領域進行微調,就能以較低成本快速推出有競爭力的產品,而不必從0到1啃下龐大的預訓練這塊"硬骨頭"。

事實上,目前不少火熱的AI應用,底層都用的是開源模型。

以Stable Diffusion為例,基於它衍生出的AI繪畫、AI影片工具數不勝數,為一般使用者都帶來了極大的創作便利。

當然,僅僅套殼肯定是不夠的。關鍵在於要找準市場需求,為開源模型"賦能"出有價值的垂直化應用。

這其中既包括針對細分領域進行適配的能力,也包括在產品設計、使用者體驗上多下功夫。

總的來說,我對這場大模型開閉源之爭持樂觀態度。


放眼全局,無論是開源的"羊駝"們,還是閉源的"獨角獸"們,他們的終極目標都是一致的——那就是推動人工智能技術造福人類。

在這個過程中,頭部玩家的深耕和垂直領域的百​​花齊放同樣不可或缺。

身為一個AI從業者和深度用戶,我由衷感慨,能生活在這樣一個人工智慧蓬勃發展的時代,見證並參與這場轟轟烈烈的技術革命,是我們這一代的幸運。

AI的故事才剛開始,未來可期,就讓我們拭目以待吧!

對了,Llama3大模型位址:llama.meta.com/llama3/

官網也提供了體驗環境:www.meta.ai,不過需要魔法和facebook帳號。

國內直接用的話推薦這個AI工具站:BotGo·機器國,關注下面的公眾號即可使用。

這個工具站技術實力很強,但凡有最新的AI大模型或AI機器人一推出,它總是能緊跟著上線,例如最近熱門的Claude3系列、Kimi、Suno音樂創作,包括這次的Llama3也是。

還有很香的地方在於大部分的模型都可以永久免費無限用,比如這次的Llama3就是,還有GPT3.5、Kimi等很多國內外大模型,高級模型每天簽到也都有免費額度贈送。 (AI邦)