祖克柏掀桌子了！ Meta的Llama3開源模型爆火，硬剛李彥宏的閉源路線

2024/04/27

•

AI大模型開源閉源的路線之爭誰贏誰輸？

相信不少關注AI動態的朋友們已經聽說了，就在上周，Meta發布了其最新開源模型Llama 3，號稱是目前最強大的開源大語言模型。

這隻「羊駝」一亮相，立刻在AI圈引發了不小的震動。

那麼這個Llama 3到底有多強呢？

迄今為止最強的開源大模型

根據大模型競技場評估數據顯示，Llama3 70B猛升到第5位，性能已經超過了部分早期版本的GPT4和絕大部分閉源模型！

關於性能（如下），基本上就是秒殺，一個字牛！直接對標GPT4。

跑分5個評測集：MMLU（學科知識理解）、GPQA（一般問題）、HumanEval（程式碼能力）、GSM-8K（數學能力）、MATH（比較難得數學）

下面的圖表顯示了對Claude Sonnet，Mistral Medium和GPT-3.5進行的這些類別和提示的人工評估的總結結果。

META的騷氣：為了防止我們的模型在這個評估集上意外過度擬合，即使我們自己的建模團隊也無法存取它

Meta發布全新Llama 3系列模型僅僅4天后，這個模型在Hugging Face的開源庫中就衍生出了多達1013種的Llama變體，獲得了開發者的熱烈追捧和響應。

除此之外，Meta的下一步，正在開發一款超過4000億參數的Llama3模型，期待到底有多強！

AI大佬評價

吳恩達，有史以來最好禮物。

馬斯克，一句「Not bad」表達認可，有點酸有點醋。

Jim Fan英偉達資深科學家，認為即將推出的Llama 3-400B+模式將是社群獲得GPT-4等級模式的重要里程碑。

Meta首席AI科學家楊立昆也在推特上喊話：“Llama3-400B+將標誌著社區獲得GPT-4級模型的分水嶺時刻！”

開源閉源之爭

看來這隻"羊駝"的實力確實不容小覷。

不過，Llama家族目前只發行了8B和70B兩個版本，更多的兄弟姊妹還在路上。

Meta方面表示，未來幾個月內，還會陸續有更多型號的Llama模型面世。看來Meta這是要將開源進行到底了。

除了語言模型，最近Meta又宣布向第三方開放自家的VR/AR作業系統－Meta Horizon OS，聯想、微軟、華碩等大廠都已入列為首批合作夥伴。

這不禁讓人聯想到當年谷歌對安卓系統的開放，雖然Gmail、谷歌地圖等核心應用依然是閉源的，但開放的安卓系統本身卻成為了行動互聯網時代的重要基礎設施。

當然，Meta的開源並非完全無私，其商業野心也是明確的。

透過開源吸引更多開發者參與最佳化模型，同時這些改進成果也可以反哺到自家的閉源模型中。等生態建設得差不多了，Meta就可以透過提供技術支援、API等方式向開發者們收費了。商業模式可謂清晰明了。

對標Llama的，除了Meta自己的閉源模型之外，OpenAI、Anthropic、DeepMind這些巨頭們也都在默默發力。

就拿最近大火的國產AI“月之暗面”為例，其CEO楊植麟就直言不諱地表示：“開源模型會越來越落後，未來還是閉源模型的天下。”

原因無他，閉源模型背後有持續的資金和人才投入，而開源社群的貢獻品質參差不齊。

月之暗面雖然也推出了自己的開源模型——Dark Moon，但楊植麟坦言這更多是一種行銷手段，為的是吸引更多開發者上自己的平台，真正的核心還是閉源的。

對於這場開閉源之爭，業界大佬們也是見仁見智。

周鴻禕就曾表示，沒有開源就沒有今天的網路。但百度CEO李彥宏卻認為，大模型開源的意義有限，閉源模型在效果和性價比上反而更有優勢。

李彥宏還打了一個比方：就像自己做飯，從超市買來現成的食材(開源模型)總歸沒有自己從農場精心挑選培育(閉源訓練)出來的食材更新鮮美味。

不過在我看來，開源和閉源並非水火不容，而是可以相輔相成的。

一方面，頭部大廠們肯定還是會持續投入閉源模型的研發，這就是他們的核心競爭力所在。

但另一方面，開源模型的存在，恰恰為眾多中小企業、創業家提供了一個很好的"跳板"。

站在巨人的肩膀上，他們只需在開源的基礎模型上，針對特定垂直領域進行微調，就能以較低成本快速推出有競爭力的產品，而不必從0到1啃下龐大的預訓練這塊"硬骨頭"。

事實上，目前不少火熱的AI應用，底層都用的是開源模型。

以Stable Diffusion為例，基於它衍生出的AI繪畫、AI影片工具數不勝數，為一般使用者都帶來了極大的創作便利。

當然，僅僅套殼肯定是不夠的。關鍵在於要找準市場需求，為開源模型"賦能"出有價值的垂直化應用。

這其中既包括針對細分領域進行適配的能力，也包括在產品設計、使用者體驗上多下功夫。

總的來說，我對這場大模型開閉源之爭持樂觀態度。

放眼全局，無論是開源的"羊駝"們，還是閉源的"獨角獸"們，他們的終極目標都是一致的——那就是推動人工智能技術造福人類。

在這個過程中，頭部玩家的深耕和垂直領域的百花齊放同樣不可或缺。

身為一個AI從業者和深度用戶，我由衷感慨，能生活在這樣一個人工智慧蓬勃發展的時代，見證並參與這場轟轟烈烈的技術革命，是我們這一代的幸運。

AI的故事才剛開始，未來可期，就讓我們拭目以待吧!

對了，Llama3大模型位址：llama.meta.com/llama3/

官網也提供了體驗環境：www.meta.ai，不過需要魔法和facebook帳號。

國內直接用的話推薦這個AI工具站：BotGo·機器國，關注下面的公眾號即可使用。

這個工具站技術實力很強，但凡有最新的AI大模型或AI機器人一推出，它總是能緊跟著上線，例如最近熱門的Claude3系列、Kimi、Suno音樂創作，包括這次的Llama3也是。

還有很香的地方在於大部分的模型都可以永久免費無限用，比如這次的Llama3就是，還有GPT3.5、Kimi等很多國內外大模型，高級模型每天簽到也都有免費額度贈送。 (AI邦)