8月6日凌晨(美東時間8月5日),AI 巨頭 OpenAI 扔下一顆 “炸彈”:兩款能在筆記型電腦上流暢運行的開放權重推理模型正式發佈。這是該公司自 2019 年 GPT-2 後,時隔 6 年再度回歸 “開放” 賽道,不僅讓普通開發者能用個人裝置玩轉高級 AI,更給白熱化的開源大模型競爭添了一把火。
何謂 “開放權重模型”?看完秒懂
簡單說:
開放權重模型僅公開訓練好的 “參數權重”(相當於模型的 “知識儲備”),開發者可直接用這些權重微調模型,無需原始訓練資料;而開源模型會公開完整程式碼、訓練資料和方法論,開放程度更高。
OpenAI 聯合創始人格雷格・布羅克曼強調:“開放模型的獨特價值在於本地化部署 —— 企業能在自家防火牆內、個人可在筆記本上運行,資料隱私和安全更可控。”
模型硬實力:小身材,大能量
兩款模型針對性最佳化,覆蓋不同場景:
1200 億參數,單張 GPU 即可運行,適合中小型企業的專業級任務;
200 億參數,體積小巧到能直接在普通筆記本(甚至 MacBook)上運行,門檻極低。
性能上,官方稱其可對標自家閉源的 o3-mini 和 o4-mini 模型,尤其在三大領域表現突出:
訓練資料則聚焦純文字,除通用知識外,重點強化了科學、數學和程式設計領域內容 —— 但 OpenAI 暫未公佈與 DeepSeek-R1 等競品的直接對比資料。
幾乎同步,亞馬遜宣佈這兩款模型已登陸 AWS 的 Bedrock 生成式 AI 市場。這是 OpenAI 模型首次入駐該平台,Bedrock 產品總監阿圖爾・迪奧直言:“它們會成為客戶在開放模型領域的優質選擇。”
值得注意的是,AWS 近期因增長放緩導致亞馬遜股價波動,此次合作被業內解讀為 “提振雲服務競爭力” 的訊號,但雙方未披露具體合作條款。
2024 年的開源大模型賽道早已不是一家獨大:
作為微軟支援的獨角獸,OpenAI 當前估值已達 3000 億美元,正由軟銀領投新一輪融資,規模最高 400 億美元。
此次開放模型的發佈,被視為其建構 “開放生態” 的關鍵一步:既降低開發者門檻,又能通過 AWS 等平台擴大影響力,最終在商業化與技術普及間找到平衡。
目前,Hugging Face 已上線模型卡,官方提供 PyTorch、Transformers 一鍵載入工具,社區正加速迭代量化方案和微調指令碼 —— 預計未來兩天內,“筆記本本地部署教學” 將扎堆出現。
從 “只能用雲服務” 到 “裝進背包隨時跑”,OpenAI 這步棋不僅讓 AI 更 “親民”,更可能倒逼整個行業向 “輕量化、本地化” 加速進化。
接下來,就看全球開發者如何用這兩款模型玩出更多新花樣了。 (元透社)