開源與閉源爭論的背後，是大模型未來商業生態演進的嚴肅思考

2024/04/23

•

「開源模式會越來越落後。」Create 2024百度AI開發者大會上，百度創辦人、董事長兼執行長李彥宏的這句話，以及在大會上發布的PPT，在網路上廣為流傳，並引起了科技圈關於大模型開源vs閉源的辯論。

引起對大模型是否要開源的系統性討論的，還有李彥宏發表的關於大模型開源的多個看法：

“開源模型已經很多了，不缺百度一家。”

“大家以前用開源覺得開源便宜，其實在大模型場景下，開源是最貴的。”

「而且模型開源也不是一個眾人拾柴火焰高的情況。這跟傳統的軟體開源一比如Linux、安卓等等很不一樣，由於是模型帶來的開源，我們也不知道參數為什麼變成了那個樣子，這種情況下很難實現眾人拾柴火焰高。真正由大家一起來協同開發的產品。

360創辦人周鴻禕一直是開源的信徒，很巧的是，他4月13號在哈佛有個演講，在演講中也提到了關於開源的態度「沒有開源就沒有Linux，沒有PHP，沒有MySQL，甚至沒有網路。

網民猜測週鴻禕在「暗懟」李彥宏。週鴻禕隨後在4月20日再次發文澄清，“這兩天有人挑事兒，說我攻擊李廠長，我不是針對李廠長，我還是從產業發展的角度來看開源和閉源。”

其實，兩位科技企業的創辦人關於大模型開源vs閉源的爭論，不是簡簡單單的開源好、還是閉源好的二元論問題，而是一個關於複雜系統的爭論，涉及到多個問題：

①在大模型領域，開源模型的能力是否永遠落後於閉源模型的能力？

②開源模型，是否可能有商業化落地的閉環？

③真正應用大模型的時候，究竟是開源還是閉源性價比更高？

④從科技發展的角度來講，大模型的開源和傳統意義的開源，究竟有什麼不同？

開源（Open Source）的起源可以追溯到電腦科技初期，那時軟體和硬體就像是一對連體嬰，使用者常常得自己動手編寫或修改軟體來解決問題。到1955年，IBM為了讓大家都能深入研究他們的作業系統，搞了一個「IBM用戶群分享」。

70年代中葉，隨著電腦科技的發展，軟體開始成為一種商品，而不再免費地與硬體一起提供。這種變化導致了軟體的共享文化開始受到限制。為了反對這種趨勢，自由軟體運動（Free Software Movement）開始興起，Richard Stallman在1983年發起了GNU項目，並在1985年創立了自由軟體基金會（Free Software Foundation, FSF），推動自由軟體的發展。

1998年，Eric Raymond和Bruce Perens成立了開源促進會（Open Source Initiative, OSI），並提出了「開源定義」（Open Source Definition），這是對開源軟體的正式定義。 OSI的目標是推廣開源軟體，並為開源專案提供認證。

根據開源促進會的說法，開源軟體不只是把原始碼公開那麼簡單，它還得滿足一些條件，例如允許大家自由地用、改和分享這個軟體，甚至基於它創造新的東西。但是，開源軟體也不是啥都不管，它得在某種開源許可證下發布，例如我們常聽到的GPL、Apache、BSD和MIT這些許可證。

為何週鴻禕會特別提到，沒有開源就沒有Linux、PHP、和MySQL，這三者和開源的關係是什麼？和現在的科技產業有什麼關係？

● Linux：Linux是一個開源的作業系統內核，由Linus Torvalds在1991年首次發布。L inux核心是許多現代作業系統的基礎，包括Android和大多數伺服器作業系統。Linux的開發模式——開放原始碼、社群驅動、協作開發——成為了開源軟體運動的一個標誌性案例。

● Apache HTTP Server：一個強大的Web伺服器軟體，處理HTTP請求並提供Web頁面。 Apache HTTP Server是網路上最常用的Web伺服器之一，以其效能和可設定性而受到青睞。

● PHP：PHP是一種開源的伺服器端腳本語言，特別適用於Web開發，並且是創建動態網站和Web應用的常用工具。 PHP的開源特性讓開發者可以自由地使用、修改和增強其功能，從而推動了Web開發技術的發展。

● MySQL：MySQL是一個流行的開源關係型資料庫管理系統（RDBMS），廣泛用於網站和線上應用的資料儲存。 MySQL的開源性質使得它能夠被社群廣泛採用和客製化，成為許多網站和網路應用後端的關鍵元件。

這三者共同構成了所謂的LAMP（Linux, Apache, MySQL, PHP/Python/Perl）堆疊的一部分，這是創建動態網站和網路應用的常用技術組合。 Linux作為作業系統，Apache作為Web伺服器，MySQL作為資料庫，而PHP（或其他語言如Python或Perl）則作為腳本語言，共同支援了網路上大量的網站和應用程式。

用通俗的語言解釋就是，LAMP就像是團隊，裡面有打地基的Linux，接待使用者的Apache，管理資料的MySQL，也有寫程式的PHP（或Python、Perl）。這個團隊合作無間，可以說是網路世界的基礎。

除了這些技術的發展和普及，開源也為全球開發者社群提供了一個共享知識、協作創新的平台。透過開放原始碼，這些專案能夠快速迭代，聚集全球開發者的智慧，形成了強大的生態系統，推動了整個軟體產業的進步。

那麼，來到大模型時代，開源有什麼不同了嗎？在早期的軟體時代，開源主要是由個人和小型團隊推動的，重點在於共享程式碼和協作解決問題。開源專案通常是由愛好者和志工社群維護的，商業化程度較低。例如，Linux作業系統的誕生和GNU計畫的推動，都是這段時期開源生態的代表。

隨著網路的興起，開源生態開始加速發展，開源專案開始得到更廣泛的認可和使用，如上文提到的LAMP，它們成為了建立網站和網路應用的基石。此外，開源也開始與商業模式結合，例如透過提供技術服務和支援來獲利。

到了雲端運算時代，雲端服務供應商開始大量採用和貢獻開源技術，如OpenStack和Docker等，它們成為了雲端運算基礎設施的重要組成部分。開源軟體開始與雲端服務緊密結合，提供更靈活且可擴展的解決方案。同時，雲端服務商透過提供基於開源軟體的雲端服務來創造商業價值，如AWS、Azure等。

大模型的技術浪潮，某種程度上也由開源開啟，Google開源了Transformer，才有了後來OpenAI引爆產業的ChatGPT。

但OpenAI不再Open，Google也不再那麼Open，大模型的開源大旗，反而被Meta以其Llama系列模型扛起，馬斯克開源Grok模型，位於法國巴黎的Mistral AI，成為另外兩股最被關注的大模型開源力量。

但是，Llama2剛發布後不久，就有批評說，Llama2並不符合開源促進會（OSI）設定的定義，Llama2的許可證包含了一定的限制，例如禁止使用Llama2去訓練其它語言模型，如果該模型用於每月用戶超過7億的應用程式和服務，則需要獲得Meta的特殊許可證。

大模型時代的開源，也變得更複雜。

首先是開源的方式，單單從最具代表性的Llama系列模型和Mistral系列模型，它們的開源方式就不太相同。一位熟悉開源生態的專家表示，它們的差異主要在於Restrict License（限制授權）VS Apache。 Llama的開源屬於前者，從前面描述的Llama2的限制方式可以看出，這種開源方式是指在開放原始碼的同時，對使用、修改和分發該模型的行為施加一定的限制。

這與完全開放的開源許可證（如MIT、Apache 2.0等）不同，後者通常允許用戶在幾乎不設限的情況下使用和修改軟體，而Mistral、谷歌的開源模型Gemma都採取了這種方式，既開源了模型的權重也開源了模型的架構。但是對於訓練的資料和訓練過程並不開源。

除了開源方式的不同，訓練一個大模型通常需要大量的資料、運算資源和專業知識來進行訓練和最佳化，這些資源往往只有大型科技公司或研究機構才能提供。所以，大模型時代的開源主體，往往是大型科技公司，或資源優勢強的創業公司，而不是個體；這也造成了，開源雖然可能吸引更廣泛的社區參與，但由於技術門檻和資源需求，實際貢獻可能集中在有限的專家群體；某些大公司的開源，還有佔據競爭生態位的考量，所以對於開源條款的設計，也會有更複雜的考量。

這些變化呼應了文章開頭提到的李彥宏的觀點，「模型開源不是一個眾人拾柴火焰高的情況。這跟Linux、安卓等傳統的軟體開源很不一樣，由於是模型帶來的開源，我們也不知道參數為什麼變成那個樣子了。協同開發的產品。

但大模型的生態剛萌芽，從目前看來，確實是能夠獲取有限資源的少部分人，推動了大部分的技術進步，但是隨著算力資源成本的降低及門檻的下降，是否未來還能呈現「眾人拾柴火焰高」的情況，目前也無法下定論。

但是，大模型的生態發展究竟會如何演變？相對於開源歷史，又會呈現哪些不同的特質？這是值得科技界長期關注、深入討論的問題。

基於大模型開源生態的演進，還有一個討論的焦點，“開源大模型的能力，真的會越來越落後嗎？”

被稱為最強開源大模型的Llama3在4月19日發布，有8B和70B的版本，並預告大版本的超過4000億參數的模型也將在稍後發布。 Llama 3 在多項性能基準上展現了最先進的性能，提供了包括改進的推理能力在內的新功能。

從Benchmark看，僅僅70B的Llama 3在各項指標上已經能和據推測參數量為175B的Gemini Pro1.5相抗衡，聯合Claude 3給出的數據，70B的Llama3即使對敵GPT4，在各項benchmark上比較也已經非常接近。這還是在Llama3未進行微調的情況下達成的，這說明它後續還有很大的提升空間。

同樣的，開源界的另外兩個巨頭Mistreal 和Grok近期放出的模型也都顯示出與GPT-4「同代」的水平。 Grok1.5V具有多模態能力，各項指標與GPT4不分伯仲。 Mistreal近期流出的基於Llama2訓練的Miqu 70B模型據EQbenchmark測試也和GPT4能力相近。

2023年，外國媒體報道谷歌曾經流出一份文件，主題是“我們沒有‘護城河’，OpenAI 也沒有。當我們還在爭吵時，第三方已經悄悄地搶了我們的飯碗——開源。”

這份文件認為，現在的一些開源和閉源模型的差距正在以驚人的速度縮小。開源模型更快、可自訂性更強、更私密，而且功能性也不落下風。「幾乎任何人都能按照自己的想法實現模型微調，到時候一天之內的訓練週期將成為常態。以這樣的速度，微調的累積效應將很快幫助小模型克服體量上的劣勢。 ”

連Google都必須面對這樣的難題，開源模型，正在從能力上不斷接近閉源模型，而從商業上，也在蠶食威脅閉源模型的護城河。

從科技發展的歷史規律來看。技術發展的曲線必然會經歷從陡峭到放緩的階段，這就意味著，即使領先者一開始“遙遙領先”，後來者也會逐漸追上，並逐漸縮短與領先者的差距。

隨著Llama3一起發布的，還有祖克柏的一個專訪，他對於大模型的Scaling law這條路持有比較悲觀的態度，他認為從現在開始,進展將是漸進式的。 2025年前不會有通用人工智慧(AGI)出現。

這也意味著大模型技術迭代速度可能會慢下來，是否開源也會慢下來？開源和閉源之間的差距，會縮小嗎？

選擇開源還是閉源？對於企業用戶來講，最優先的問題只有一個，哪個性價比更高？

清華大學汪玉教授曾經在一次公開演講上給出了使用GPT系列模型的推理成本，如下圖所示：

如果使用閉源模型做API運營，假設GPT-4 Turbo每天要為10億活躍用戶提供服務，每年的算力成本可能超過兩千億。目前很多公司的收入規模也就在億級，即使用戶規模不會有這麼大，但是算力的成本也很難支撐自身業務，從而形成有盈利的商業閉環。

但如果用GPT3.5的話，推理價格會大大降低。 OpenAI在定價策略上為了打壓競爭對手，將GPT3.5的定價定的非常低廉，100萬token只需要1美元，而與其對應的同水平Llama2 70B模型在大多數情況下使用快速API，定價都要1美元/100萬token乃至更高。 Mixtral-8x7b的價格也要0.7美元/100萬token，相對OpenAI的報價優勢有限。當然開源模型還有本地部署的優點。在本地運作的情況下，其成本就只有硬體費用和電費了，這對於有雲端服務能力或硬體基礎的大公司來說肯定是最經濟的選擇。當然這種底子並非人人都有。

對於新創公司來講，想做個人化應用，更多是先要擁有自己的專有微調模型。這就牽涉到微調訓練費用的問題。在開源模型上進行相應的訓練和微調的話，Llama2 的優勢就很明顯了。雲端服務商Anyscale 提供的價格中，70b版本只需4美元/100萬token。 GPT3.5則比它整整貴一倍8美元/100萬token。所以當你想真正為自己的業務建構專用模型時，從成本角度來看，開源模型還是有一定優勢的。

在節省成本這方面，新創公司還能再精進一步。很多公司都選擇了多種模型混用。通用大模型的效能固然出色，但是在實際應用中，使用中小型開源模型，並用特定資料微調，最終達到的效果可能會更好。

如果用閉源模型，100萬token消耗速度很快，成本遠高於0.6美元每小時。 LeptonAI創辦人賈揚清曾經在一次閉門活動中分享過：在北美，很多企業都是先用閉源大模型來做實驗（例如OpenAI的模型）。實驗規模大概在幾百個million（百萬token），成本大概幾千美元。一旦資料飛輪運轉起來，再把已有資料存下來，用較小的開源模型微調自己的模型。現在這已經變成了相對比較標準的模式。

國內另外一家使用大模型建構業務的公司的相關負責人也表示，「企業級應用，不太會用到單一模型，現在已經開始按照應用目的分模型了，但是跨系統調度的頻寬成本更高。所以，一個系統裡面，有高中低（參數）模型混合的模式是企業應用現在合理的方案。

開源與閉源，並不是企業考量的最核心因素，最適性價比、企業的資料安全，能助力企業未來策略的發展，可能才是選擇的優先點。

李彥宏的開源觀點，之所以引起這麼大的關注，也是因為，目前各家企業都在探索在大模型時代，如何找到PMF（Product Market Fit）。

百度對於公有大模型生態的佈局，是比較早的，對百度來說，模型本身也是產品。

根據媒體消息，金沙江創投主管合夥人朱嘯虎在產業微信群中表示：「GPT-4能實現90%以上的商業需求，開閉源無所謂了，以後大模型API就是自來水的價格。但用戶需要的是純淨水，氣泡水，烏龍茶…”

純淨水、氣泡水、烏龍茶是多樣化的產品形態思考，針對了使用者多樣化的需求。

發表會的第二天，賈揚清在朋友圈發表了一個觀點「我覺得Robin這一點說得非常對，在初始的應用嘗試過去之後，模型的特化會是一個從效果上和從性價比上更加make sense的選擇。打造商業閉環，未來的成長空間在哪裡。 “以平台化產品，實現模型的特化部署、從訓練到商業化落地、到模型迭代再訓練，實現最高效率和最優性價比。”

而開源模型的頭部企業，如Meta，提供的是未經封裝的更原始的技術創新。他們本身有雄厚的算力資源、研發團隊及資金實力，能夠以技術影響力，實現生態佈局。最終帶來商業價值的，可能不是產品本身，而是基於生態衍生出來的更多的技術服務費用、諮詢費用等。

祖克柏專訪中表示，如果模型本身就是產品, Meta會考慮停止開源，“也許模型最終更像是產品本身。我認為這時候,是否開源就是一個更棘手的經濟考慮了。”

堅持Scaling law的閉源模型面對一個難解的矛盾，一方面，scaling law（規模定律）的路還沒走到盡頭，巨大的投入還將持續，而且不能公開技術的秘密；另一方面，免費、高品質、有極高性價比的開源模型，又讓持續燒錢的閉源大模型壓力巨大。

就在最近，OpenAI頂著壓力修改了API付費模式，從先用後付，改成了pre-paid。對OpenAI來說，這樣的模式減少了壞帳率、增加了資金回籠的速度，從某些方面來講，可以稍微緩解資金的壓力。但從應用API的企業來講，按照之前的最長60天左右的帳期，等於企業增加了60天的資金佔用成本。 OpenAI變相漲價了。

在這個定價策略推出不久，Llama3就發布了中小規模版本。一個能和GPT-4差不多，而且優化過性能，可以在小算力硬體下運行的模型，甚至直接為閉源模型帶來了一堆競爭對手。

性能優異的大規模開源模型，為其它科研機構及有更宏大目標的商業機構，提供了更好的技術參考路徑，可能大大提高科研效率、縮短到達目標的時間。而中小規模模型，確是商業上閉源大模型的競爭對手。

企業看到了基於開源中小模型，自己擁有私有模型、保障資料安全、建構應用、上下游通吃，完成自我閉環的希望。

這全部的鏈條，其實也可以在模型公司的平台上一站式完成，這部分的市場，其實被開源模型「無心」侵占了很多。

從競爭的角度來講，如果Meta採取閉源的策略，在同一個賽道上，可能永遠都不能顛覆OpenAI成為引領者，而另闢蹊徑的開源策略，讓Meta搶到了開源大模型的頭把交椅，暫時坐穩了另外一個生態的王座。而快速開源Grok模型的馬斯克，也許暫時只是想為「Closed AI」和Sam Altman製造另一個的競爭對手…

這場開源與閉源之爭的另一個焦點人物是，「開源的堅決擁護者」週鴻禕。其實週鴻禕和李彥宏，兩個人根本不存在對立的觀點。週鴻禕主要從產業發展的宏觀方向來講，「我們要善用開源、利用開源，透過開源來學習，快速提高人工智慧的核心能力。」他也補充了自己的觀點，開源和閉源是兩種不同的商業模式，沒有必要互相貶低。安卓和iOS，Linux和Windows都是一個開源一個閉源，也都活得很好。」

從商業角度來講，360並不是一家模型公司，而模型也不是360的主要產品，這和百度是有本質差異的。 360目前推出了AI瀏覽器，和AI辦公全家桶等以模型為基礎的應用。開源生態越繁榮，這意味著，公司可以有更多樣的選擇。

也有公司選擇了既開源又閉源的雙輪驅動模式，以開源切入大模型賽道的百川智能，在發布完Baichuan-7B、Baichuan-13B開源大模型後，又拿出了Baichuan-53B閉源大模型。在Baichuan-53B發布會的媒體溝通會上，王小川被問到為什麼沒有繼續開源，他回答稱：「模型變大之後沒有走開源的這樣一種方式，因為大家部署起來成本也會非常的高，就使用閉源模式讓大家在網路上呼叫API」。

「1.關於開閉源之爭，核心是要看誰在開源。2.雙輪驅動，是一線創業AGI公司的唯一解。」根據第一財經報道，百川智能CEO王小川在行業微信群討論中發表了以上觀點。王小川認為，「從To B角度，開源閉源其實都需要。未來80%的企業會用到開源的大模型，因為閉源沒有辦法對產品做更好的適配，或者成本特別高，閉源可以給剩下的20%提供服務。

開源和閉源，本來就不是單選題，而是一個綜合應用題。如果資源夠、決心夠，完全可以既透過開源顯示技術實力、獲得更多的技術和數據回饋、打造開源生態；又透過強大的閉源模型將其封裝為產品，直接實現商業化變現。

王小川也認為，開源和閉源並不像手機中iOS或安卓作業系統只能二選一，開源確實容易“建立人品”，“朋友多多的”，讓大家迅速了解和評測大模型的好壞。同時開源也是為商業化做準備，如果大家用起來覺得不錯，當需要更好的服務和更大的參數時，可以探索進一步的商業化路徑。

一場關於開源與閉源的爭論背後，其實是科技公司在大模型時代的開端認真思考的生態演進過程。在科技產業變革的開端，騰訊科技關注到來自各方面的理性思考和建設性的觀點，也持續將各方的討論收錄入我們的專題中（點擊文末閱讀原文，進入專題頁）。

大模型的生態發展究竟會如何演化？大模型時代的開源，又會呈現哪些不同的特色？(騰訊科技)