ChatGPT文生圖功能迎重大升級;Google正式推出Gemini 2.5;DeepSeek發佈模型更新|AIGC周觀察第八十五期

一周看點
ChatGPT文生圖功能迎重大升級;Google正式推出Gemini 2.5;DeepSeek發佈模型更新;蘋果被指誇大AI功能遭使用者集體訴訟;寶馬與阿里巴巴宣佈戰略合作;螞蟻集團推出新款MoE大語言模型;輝達有意收購賈揚清的創企Lepton AI;小鵬汽車公佈雙足機器人新專利……
讓我們一起來回顧一下吧。



當地時間3月25日,OpenAI首席執行官山姆·阿爾特曼在直播活動中表示,正式推出基於GPT-4o模型的原生圖像生成功能——模型直接從文字提示生成圖像,不再呼叫獨立的DALL-E文生圖模型。利用GPT-4o的多模態能力,ChatGPT在圖像生成時能更加精確地遵循指示、更精確地渲染圖像上的文字,同時支援多輪迭代最佳化圖像時保持角色形像一致。從官方給出的更多示例來看,不管是生成黑板板書,還是印刷體、展示科學常識的繪圖,ChatGPT在生成圖像文字領域終於從完全不能用,達到接近商用的程度。

該功能一推出就迅速引爆了社交媒體,全球網際網路平台上湧現大量由個人照片、知名梗圖轉變而來的“吉卜力”卡通風格圖片。不論是川普在白宮力挺特斯拉的現場照片,還是黃仁勳展示“晶片盾牌”的場景,都能被生動形象地轉化成吉卜力工作室的經典畫風。就連阿爾特曼也將自己的頭像換成了用ChatGPT生成的“吉卜力”風格圖像。吉卜力工作室是曾製作過《龍貓》和《千與千尋》等熱門電影的日本動畫工作室。


3月26日凌晨,Google正式推出新一代人工智慧推理模型Gemini 2.5,該模型基於多型大語言框架升級,顯著增強了推理能力、多語言支援及長文字處理能力。

據官方介紹,Gemini 2.5通過最佳化演算法架構,將響應速度提升40%,能耗降低25%。在關鍵指標測試中,其複雜邏輯任務完成度較前代提升65%,尤其在醫療診斷輔助、法律文書生成等垂直領域展現出更高精度。

Gemini 2.5系列模型是Google挑戰OpenAI“o”系列模型最重磅的嘗試。其旗艦版本Gemini 2.5 Pro Experimental在多項基準測試中超越OpenAI、Anthropic等競爭對手。


3月24日晚間,DeepSeek發佈了更新後的模型DeepSeek-V3-0324,開源版本已上線。本次更新為DeepSeek-V3模型的版本更新,並非市場此前一直期待的DeepSeek-V4或R2。

同日,DeepSeek在其官方交流群宣佈稱,DeepSeek-V3模型已完成小版本升級,該版本的最新模型也已經同步至官網、APP和小程序,關閉“深度思考”就可體驗。此次發佈的版本更新,在性能上,程式設計能力的最佳化成了最大亮點,新版本DeepSeek-V3-0324生成前端程式碼的能力大幅提升。


日前,一家名為克拉克森律所的機構代表消費者在美國加州聖何塞地區法院對蘋果公司發起集體訴訟,指控該公司存在不正當競爭、虛假廣告和過失性虛假陳述:“誇大了人工智慧的能力,導致消費者相信他們購買的裝置具有實際上不存在或被嚴重誤述的功能。”投訴稱,蘋果公司欺騙了使用者關於其iPhone16的AI功能,誘使人們購買他們本可能會放棄的手機而不是選擇其競爭產品。

據悉,訴訟檔案顯示,蘋果自去年夏天起通過電視、網路等多種管道投放廣告,重點展示了具備“革命性AI能力”的升級版Siri語音助手。而蘋果公司在今年3月7日確認推遲語音助手Siri對話式版本的發佈時間,“我們一直在努力打造更具個性化的Siri,而實現新功能所需的時間比我們想像的長,預計將在明年推出”。


3月26日,寶馬集團宣佈與阿里巴巴集團深化戰略合作,基於阿里通義AI大模型,聯合開發AI引擎,將應用於中國市場的寶馬新世代系列車型。

此次戰略合作,主要聚焦在AI大模型、智能語音互動等前沿技術領域。基於通義大模型和斑馬元神AI,全新BMW智能個人助理採用寶馬與阿里共同開發的AI引擎,計畫搭載於中國生產的BMW新世代系列車型上,預計2026年在中國市場交付。AI引擎支援的智能座艙及智能出行互動場景,將於今年4月首次亮相上海車展。


3月24日消息,近日,螞蟻集團Ling團隊發表了一篇技術成果論文。論文顯示,螞蟻集團推出了兩款不同規模的MoE大語言模型——百靈輕量版(Ling-Lite)與百靈增強版(Ling-Plus),前者參數規模為168億(啟動參數27.5億),Plus基座模型參數規模高達2900億(啟動參數288億),兩者性能均達到行業領先水平。

除了自研性能領先的大模型以外,該技術論文最大的突破在於提出了一系列創新方法,以提升資源受限環境下AI開發的效率與可及性。實驗表明,其3000億參數的MoE(混合專家)大模型可在使用國產GPU的低性能裝置上完成高效訓練,性能與完全使用輝達晶片、同規模的稠密模型及MoE模型相當。


3月28日消息,據外媒報導,輝達計畫收購阿里雲前副總裁賈揚清的AI初創公司Lepton AI,這筆交易價值數億美元。對此,賈揚清向媒體回應稱“無法評論”。

根據公開資料,Lepton AI成立於2023年,公司總部位於美國加利福尼亞州帕洛阿托,是一家提供GPU算力租賃服務的初創公司。外媒猜測,輝達收購Lepton可能是想進軍雲端運算和企業軟體市場,與AWS和Google等主要雲服務商競爭。


3月25日,據天眼查智慧財產權資訊顯示,廣州小鵬汽車科技有限公司申請的“雙足機器人的控制方法及電子裝置”專利公佈。

摘要顯示,該方法包括:響應於接收到雙足機器人的控制指令,採集雙足機器人的當前姿態;基於當前姿態和期望單腳點地姿態,確定擺動腳的擺動腳移動軌跡和雙足機器人對應機身的機身移動軌跡;基於擺動腳移動軌跡和機身移動軌跡控制雙足機器人運行。本發明解決了相關技術中無法實現雙足機器人單腳點地姿態的技術問題。 (中國企業家雜誌)