麥肯錫 & Mozilla:2025 人工智慧時代下的開源技術研究報告

在當今科技飛速發展的宏大背景下,人工智慧(AI)無疑是最引人矚目的驅動力之一,它正以前所未有的速度和深度滲透到各行各業,重塑著商業模式、社會結構乃至人類生活的方方面面。從自動化流程到複雜決策支援,從個性化服務到前沿科學探索,AI的應用場景日益廣泛,其戰略重要性已成為全球共識。

然而,支撐這場智能化革命的基石,並不僅僅是少數科技巨頭所掌握的尖端技術或龐大算力,一股同樣強大且日益重要的力量正在其中扮演著關鍵角色——那就是開源技術。開放原始碼軟體,以其協作開發、公開透明、自由使用、修改和分發的特性,長久以來一直是軟體技術生態系統的重要組成部分。它打破了傳統商業軟體的封閉模式,降低了創新門檻,促進了技術的普及與迭代。

如今,隨著AI技術的蓬勃發展,特別是生成式AI的突破性進展,開源模式再次展現出其獨特的價值和強大的生命力。眾多企業和開發者不再僅僅依賴於需要高昂許可費用且核心技術不透明的專有AI解決方案,而是將目光投向了日益豐富和成熟的開源AI技術堆疊。

這份由麥肯錫諮詢公司、Mozilla基金會以及帕特里克·J·麥戈文基金會(Patrick J. McGovern Foundation)聯合進行的研究報告——《人工智慧時代下的開源技術》,正是基於這一時代背景,進行了一次前所未有的大規模、深度調研。

該研究旨在全面、細緻地剖析全球範圍內企業和開發者在AI領域對開源技術的應用現狀、核心驅動因素、感知價值、面臨的風險挑戰以及未來發展趨勢。通過對來自41個國家、超過700位技術領導者和資深開發者的問卷調查(調研時間為2024年12月9日至2025年1月24日),報告首次為我們描繪了一幅關於開源AI在全球企業級應用中的詳盡圖景。

研究結果清晰地表明,開源AI不再是邊緣或補充性的選擇,而是正在迅速成為企業建構其AI能力、驅動創新、尋求競爭優勢的核心組成部分。從資料處理、模型訓練到工具應用,開源技術的身影無處不在,其影響力已深深嵌入現代AI技術堆疊的各個層面。報告強調,無論是商業領袖還是技術專家,都應充分認識並擁抱開源技術的巨大潛力,否則可能在未來的AI競爭格局中失去一個重要的戰略支點。

正如帕特里克·J·麥戈文基金會主席Vilas S. Dhar所言,開源通過將創造工具交到每個人手中,而非僅僅是資金雄厚者,從而將使用者轉變為建設者,將消費者轉變為創造者,它所代表的協作智能和自由流動的專業知識,將是解決人類最緊迫挑戰的關鍵。因此,理解並戰略性地運用開源AI,已成為企業在智能化時代生存和發展的必修課。

開源AI的應用現狀:廣泛滲透與結構性差異

報告深入探討了開源AI技術在企業實際應用中的普及程度和具體採用模式。研究首先界定了AI技術堆疊的七個關鍵領域:資料(用於訓練和評估模型)、模型(核心演算法及權重)、託管/推理計算(運行模型的伺服器或雲基礎設施)、修改(如微調、介面卡等,用於特定場景最佳化)、API與提示處理(使AI模型可用的介面)、工具(支援開發部署流程,如編排、安全、評估工具)以及使用者體驗/應用(最終面向使用者的AI產品)。

調研結果顯示,開源技術在AI技術堆疊的多個層面都實現了顯著的滲透。超過半數的受訪者表示,他們在資料、模型和工具這三個核心領域都不同程度地利用了開源技術。這反映出企業在建構其AI能力時,已經廣泛接受並採納了來自社區的開源資源。

特別是在模型層面,諸如Meta的Llama系列、Google的Gemma系列、艾倫人工智慧研究所(Allen Institute for Artificial Intelligence)的OLMo系列,乃至Nvidia的NeMo系列、DeepSeek-R1和阿里巴巴的Qwen 2.5-Max等開源或部分開源模型,憑藉其快速提升的性能,正在積極追趕甚至在某些基準測試中超越了部分專有模型,成為了企業的重要選擇。

然而,開源技術的應用並非在所有層面都均衡分佈。在模型修改(如微調、介面卡應用)以及託管/推理計算方面,開源技術的採用率相對較低。報告分析認為,這可能與相關領域的開放原始碼專案相對較新有關,例如,備受關注的推理引擎vLLM是在2024年4月才由伯克利大學Sky計算實驗室開發出來。同時,這也可能意味著企業更傾向於使用內部開發的工具包和專有資料來對模型進行定製化修改,以滿足其特定的業務需求和安全合規考量。

在探討“開放”程度時,報告特別關注了AI模型的複雜性所引發的關於“開源”定義的討論。Mozilla基金會支援開源促進會(OSI)提出的開源AI定義,該定義要求在資料資訊、程式碼和參數等多個維度都達到開放標準。調研中,符合OSI標準的被視為“開源”,而那些擁有開放元件(如開放權重)但不完全滿足OSI標準的(例如存在商業使用限制或未使用OSI批准的開源許可證)則被歸類為“部分開放”。

有趣的是,調研發現,受訪者最常選擇使用的是“部分開放”的模型。這在很大程度上反映了當前的市場格局——許多知名且資源雄厚的模型,如Llama 3和4系列,以及Stable Diffusion等,屬於此類。它們雖然在權重上開放,但在資料透明度或使用許可上可能存在限制,但這並未阻礙它們成為企業實踐中的熱門選項。

報告還揭示了開源AI應用在不同行業和地區之間的顯著差異。科技、媒體和電信(TMT)行業是開源AI應用的領頭羊,其使用率高達70%。這可能得益於該行業天然的技術基因、對新技術的敏感度以及相對成熟的技術基礎設施。

相比之下,其他行業的應用程度雖也普遍,但存在梯度差異。從地域上看,印度(77%)和英國(75%)的受訪者報告的開源AI模型使用率最高,美國(62%)、法國(60%)、巴西(63%)等也表現出較高的採用水平。

此外,報告發現,技術成熟度和開發者經驗對開源AI的使用有著重要影響。擁有豐富AI開發經驗的開發者使用開源技術的可能性要高出40%。這表明,有效地利用開源AI資源,往往需要一定的技術門檻和實踐積累。

價值感知與權衡:成本、性能、效率與開發者體驗

企業和開發者之所以積極擁抱開源AI,其背後有著多重價值驅動因素。報告對此進行了深入分析,並將其與專有AI解決方案進行了對比。最突出的優勢之一是成本效益。高達60%的受訪者認為,開源AI的實施成本低於專有方案;46%的受訪者認為其維護成本更低;51%的受訪者認為相關的軟體工具成本也更低。這對於預算有限或希望最佳化IT支出的企業而言,無疑具有巨大的吸引力。開源模式通常免除了高昂的許可費用,並允許企業根據自身需求靈活調整和部署,從而有效控制總體擁有成本。

除了成本優勢,性能和易用性也是使用者選擇開源AI的重要原因。報告指出,絕大多數受訪者對他們使用的開源AI模型表示滿意,滿意者數量是表示不滿意者的近十倍。其中,高性能和易於使用是驅動滿意度的首要因素。這表明,許多開源AI項目在技術上已經達到了相當高的水準,能夠滿足企業在實際應用中的性能要求,並且其介面和文件也越來越友好,降低了開發者的使用門檻。社區驅動的快速迭代和創新,也使得開源模型能夠緊跟技術前沿,不斷提升能力。

然而,開源AI並非完美無缺。在“價值實現時間”(time to value)方面,專有工具似乎更具優勢。有48%的受訪者認為專有工具能夠更快地帶來價值,而僅有33%的受訪者認為開源工具在這方面表現更好。這可能與專有解決方案通常提供更完善的整合服務、技術支援以及開箱即用的特性有關,使得企業能夠更快地將AI能力部署到業務流程中並產生回報。

相比之下,使用開源工具可能需要企業投入更多的內部資源進行整合、偵錯和最佳化。此外,雖然開源工具在使用者友好性方面獲得了30%受訪者的認可,但仍有41%的受訪者認為專有工具更易用,這表明開源社區在提升使用者體驗方面仍有改進空間。

對於開發者而言,開源AI的價值則體現在更深層次的職業發展和工作滿意度上。高達81%的開發者表示,擁有開源工具的經驗在他們的領域受到高度重視。這意味著掌握和運用開源AI技術已成為提升開發者市場競爭力的重要砝碼。

同時,66%的開發者認為,使用開源工具對他們的工作滿意度至關重要或非常重要。這反映了開源文化所倡導的開放、協作、共享精神,以及能夠直接接觸、修改和貢獻底層技術的自由度,對技術人員具有強烈的吸引力。他們不僅是技術的使用者,更是社區的參與者和貢獻者,這種歸屬感和成就感是專有技術生態系統難以比擬的。

因此,企業在選擇AI技術路徑時,需要在開源與專有之間進行審慎的權衡。開源提供了顯著的成本優勢、有競爭力的性能以及對開發者的強大吸引力,但在價值實現速度和某些情況下的易用性方面可能稍遜一籌。理解這些差異,並結合自身的業務需求、技術能力和風險偏好,做出明智的決策至關重要。

未來展望與風險管理:增長預期、混合策略與安全挑戰

展望未來,報告揭示了開源AI持續增長的強勁勢頭。高達75%的受訪者預計,他們的組織將在未來幾年內增加對開源AI技術的使用。這一普遍預期反映了市場對開源價值的廣泛認可,以及對其未來發展的充足信心。隨著開源模型性能的不斷提升、工具生態的日益完善以及社區的持續活躍,開源AI有望在更廣泛的領域和更深層次的應用中扮演更加核心的角色。

2024年見證了開源AI領域的諸多里程碑事件,例如Meta的Llama 3在基準測試中表現優異,DeepSeek-V3在推理速度上媲美頂級專有系統,蘋果(OpenELM)、微軟(Phi-3-mini)等巨頭也紛紛加大開源力度,這些都為開源AI的未來發展注入了強大動力。

然而,報告同時指出,未來的AI技術格局並非非黑即白的選擇,而更可能是一種混合模式的共存。近四分之三(超過70%)的受訪者表示,他們在AI技術堆疊的各個層面都對採用開源或專有技術持開放態度。極少有受訪者是純粹的開源或專有擁護者。這意味著企業將根據不同場景的具體需求,靈活地組合使用開源和專有元件,建構混合式的AI解決方案。

例如,可能會在成本敏感或需要高度定製化的場景中使用開源模型和工具,而在需要快速部署、強力支援或特定高性能要求的場景中選擇專有方案。這種“混合雲”式的策略,將有助於企業在利用開源優勢的同時,彌補其短板,實現整體效益的最大化。正如Mozilla基金會主席Mark Surman所強調的,開源AI的目標是建構像“AI樂高盒子”一樣易於使用的工具和技術堆疊,使其成為更具競爭力、創造力和創新性未來的基礎,而非僅僅是封閉系統的替代品。

儘管前景光明,開源AI的發展並非沒有隱憂。風險管理是企業在採用開源技術時必須面對的關鍵課題。報告顯示,受訪者普遍認為開源AI工具在某些方面比專有AI風險更高。最受關注的風險領域包括:網路安全(62%的受訪者表示擔憂)、法規遵從性(54%)和智慧財產權問題(50%)。

這些擔憂不無道理。開放原始碼軟體的開放性可能使其更容易受到惡意攻擊或被發現漏洞;複雜的許可證和貢獻者協議可能帶來合規和IP方面的挑戰;模型訓練資料的來源和質量問題也可能引發偏見、隱私洩露或版權爭議。值得注意的是,不同國家和地區的受訪者對風險的感知程度存在差異。例如,巴西受訪者更關注網路安全,而印度受訪者則對法規遵從性和智慧財產權侵權的擔憂程度顯著高於全球平均水平,這可能與其特定的監管環境、風險容忍度和AI成熟度有關。

為了應對這些潛在挑戰,企業正在積極採取一系列風險緩解措施。報告中提到了幾種關鍵策略:

一是建立強健的“護欄”(Guardrails),例如使用自動化內容過濾、輸入/輸出驗證、人工監督等機制,確保AI模型的使用符合倫理和法規要求,並控制輸出的安全性。諸如Nvidia的NeMo Guardrails、Llama Guard等開源工具本身也提供了這方面的支援。

二是進行第三方評估,通過標準化的基準測試和認證,特別是採用隱私保護的評估方法(如私有基準測試),來確保模型的可靠性和安全性,防止資料污染。

三是加強文件管理和監控,例如使用軟體物料清單(SBOM)來跟蹤開源元件的版本和已知漏洞,利用通用漏洞評分系統(CVSS)等工具評估風險嚴重性。

四是強化網路安全實踐,包括在可信執行環境(TEE)中運行模型以保護敏感資料,在訓練中採用差分隱私和聯邦學習技術防止資料記憶,實施嚴格的存取控制、網路隔離、持續安全監控以及加密雜湊驗證等。正如安全與技術研究所(Institute for Security and Technology)CEO Philip Reiner所建議的,組織需要回歸基本的網路安全原則,重視開源工具可能存在的維護不足和軟體過時問題,並設立專門團隊負責風險跟蹤和更新。

此外,報告還指出了一個值得關注的現象:儘管開源AI的使用日益廣泛,但企業對開放原始碼專案的貢獻率卻相對較低。只有13%的受訪者表示他們曾為開放原始碼專案做出過貢獻,而50%的人不確定未來是否會參與。

貢獻意願低可能源於多種因素,包括資源投入、智慧財產權顧慮以及貢獻行為往往更多基於利他主義而非直接商業回報。然而,一個健康繁榮的開源生態系統離不開包括企業、學術機構和基金會在內的多方參與和貢獻。缺乏廣泛的貢獻可能會限制開源技術在某些前沿領域的突破速度,並影響其長期可持續發展。因此,如何激勵和促進更廣泛的社區參與和企業貢獻,將是開源AI未來發展需要思考的重要議題。

結語:將開源AI融入企業核心戰略

麥肯錫與Mozilla基金會、帕特里克·J·麥戈文基金會聯合發佈的這份《人工智慧時代下的開源技術》報告,以其詳實的資料和深入的分析,為我們揭示了開源AI在全球企業應用中的真實圖景及其深遠影響。

報告的核心結論是明確而有力的:開源技術已經不再是AI領域的邊緣選擇或備用方案,而是正在成為驅動創新、降低成本、吸引人才、建構差異化競爭優勢的關鍵要素。企業對開源AI的採納已相當普遍,覆蓋了從資料處理、模型訓練到應用工具的整個技術堆疊,並且未來幾年內有望持續增長。開源AI在成本效益、性能表現以及開發者社區吸引力方面展現出顯著優勢,儘管在價值實現速度和某些風險感知上可能面臨挑戰。

面對開源AI帶來的機遇與挑戰,報告為企業決策者和技術領導者提供了清晰的指引。首先,企業應將開源AI視為其整體AI戰略不可或缺的一部分,積極評估和擁抱開源技術帶來的可能性。其次,應採取務實和靈活的混合策略,根據具體業務需求和場景特點,在開源與專有解決方案之間做出明智的組合與權衡。

再次,必須高度重視並有效管理開源AI相關的風險,特別是網路安全、合規性和智慧財產權方面,建立完善的風險評估、緩解機制和治理框架。最後,企業也應考慮如何更積極地參與和貢獻於開源社區,這不僅有助於提升自身技術能力和品牌形象,更能促進整個生態系統的健康發展,最終惠及自身。

總之,人工智慧時代已經到來,而開源正以前所未有的力量塑造著這個時代的科技格局。那些能夠深刻理解、戰略性運用並有效管理開源AI的企業,無疑將在未來的智能化競爭中佔據更有利的位置。這份報告不僅是對現狀的一次全面掃描,更是對未來趨勢的一次深刻洞察,為所有希望在AI浪潮中乘風破浪的組織提供了寶貴的參考和啟示。 (歐米伽未來研究所2025)