DeepSeek引發的開源大模型熱潮依然在持續,今天一天共有超過五款新的AI 模型對外開源。
鈦媒體AGI獲悉,2月18日上午,「大模型六小虎」之一 AGI 公司的階躍星辰,與吉利汽車集團聯合宣布,將雙方合作的階梯兩款Step系列多模態大模型向全球開發者開源。
其中,首先開源的是,目前全球參數量最大、性能最好的開源視訊生成模型階躍Step-Video-T2V,參數量達到300億,可直接產生204幀、540P解析度的高品質視訊。
階躍星辰第二款開源模型,是業界首款產品級開源語音交互大模型階躍Step-Audio,高達1300億參數規模,能夠根據不同的場景需求生成情緒、方言、語種、歌聲和個性化風格的表達,能和用戶自然地高質量對話。模型產生的語音具有超自然、高情緒智商等特徵,同時也能實現高品質音色復刻並進行角色扮演,滿足影視娛樂、社交、遊戲等產業場景下應用需求。在主流公開測試集中,階躍Step-Audio模式表現表現突出,尤其事HSK-6(漢語程度考試六級)評測下。此外,階躍星辰也自建並開源了多維度評估體系StepEval-Audio-360 基準測試。
階躍星辰第三款開源模型,是發布並開源了針對文生視頻質量評測的新基準數據集Step-Video-T2V-Eval,包含128條源自真實用戶的中文評測問題,旨在評估生成視頻在運動、風景、動物、組合概念、超現實、人物、3D 維度動畫、電影攝影等11 個內容質量。評測結果顯示,階躍Step-Video-T2V 的模型表現在指令遵循、運動平滑性、物理合理性、美感度等方面優異。
目前,在躍問網頁端和躍問App 上都可以體驗階躍Step-Video-T2V 的影片產生能力。值得注意的事,早前階躍星辰「躍問」產品正式接入DeepSeek模型,提供「深度思考」服務。
不只是階躍星辰。 2月18日上午,崑崙萬維宣布,聯合開源中國發布首個面向AI短劇創作的視頻生成模型SkyReels-V1,以及中國首個SOTA級別基於視頻基座模型的表情動作可控演算法SkyReels-A1。
算力層面,崑崙萬維稱,在自研推理優化框架「SkyReels-Infer」的加持下,V1大幅提升推理效率,實現544p分辨率,推理基於單台4090只需80s,還支持分佈式多卡並行。在同等RTX4090資源情況下,SkyReels-Infer版本比騰訊混元HunyuanVideo官方版本端對端延遲減少58.3%(293.3s vs 464.3s)。此外,採取新的技術可滿足低顯存用戶層級顯示卡運行需求,以及支援模型編譯最佳化等,進一步最佳化延遲,而基於開源diffuser函式庫,提升易用性。
崑崙萬維表示,同時將SOTA級別的SkyReels-V1和SkyReels-A1進行開源,是AI短劇行業首例,也是崑崙萬維SkyReels回饋行業邁出的一小步,更是促進AI短劇創作和視頻生成行業枝繁葉茂的一大步。未來,短劇與遊戲、虛擬實境等領域的跨界發展,將會加速產業融合,而AI短劇也有希望從“技術實驗”邁向“主流創作”,成為全球文化輸出的新載體。
事實上,自1月中旬起,中國開源AI 模型DeepSeek橫空出世,震動了整個AI科技行業,其成本便宜,DeepSeek-V3僅用兩個月就完成了訓練,成本為560萬美元,僅為OpenAI等公司所花費金額的一小部分。另一方面,DeepSeek是開源模式,迅速吸引了包括網路科技公司及其他領域使用者介入,尤其對於算力、AI人才都會有新的促進作用。
2月16日,IDC與浪潮資訊共同發布的《中國人工智慧運算力發展評估報告》顯示,2024年,中國智慧算力規模、市場規模分別較去年成長74.1%、86.9%,預估2025年,中國智慧算力規模較2024年將成長43%;
鈦媒體AGI從企查查處獲悉,截至目前,中國現存算力相關企業647家。近十年相關企業註冊量呈現整體成長態勢,2024年,全年註冊207家相關企業,年增52.21%,而2025年國內則已註冊15家AI 算力相關企業。
從註冊資本分佈來看,超40%算力相關企業註冊資本在千萬元以上,從產業上看,超四成相關企業歸屬於科學研究和技術服務業。
人才層面,智聯招聘發布的最新報告顯示,從求職端看,電腦硬體、電腦軟體產業第二周求職人數較上季增速分別為49.9%、38.6%,位列產業前二,IT服務、通訊/電信/網路設備產業求職也較上季成長3成;從職涯看,前端開發、軟體開發、行動開發/電信/網路設備產業求職也較上季成長3成;從職涯看,前端開發、軟體開發、行動開發電腦軟體、電腦硬體產業平均招聘月薪分別為11,360元、10,660元,較第一周分別上漲8.3%、5.9%。
報告指出,AI發展對整個資訊科技產業提振效果顯現,電腦硬體/軟體人才供需、薪資待遇走高。
就在2月18日,OpenAI CEO奧爾特曼(Sam Altman)表示開源下一代模型,詢問大家希望下一個開源專案是那一種,是做一個“相當小但仍需要在GPU上運行的o3-mini級模型”,或者“能做的最好的手機大小的模型”。
這意味著,OpenAI 即將開源某個大模型,而這項舉措,無疑是對當前AI開源趨勢的正面回應。
就在奧特曼發文的同一天,也是馬斯克宣布要發布「世界上最聰明的人工智慧」的時間。
2月18日中午,馬斯克旗下的人工智慧新創公司xAI發布了最新版Grok 3聊天機器人,公佈推理AI模型Grok3 mini(Reasoning,精簡版),基於Grok 3的「深度思考」(Deep thinking)的Agent智能搜尋引擎,以及基於Grok App的獨立訂閱服務「Super Grok」等。
Grok3模型訓練運算量(能力)比上一代高10倍,使用了20萬張GPU卡集群,第一階段122天使用10 萬個GPU 全面訓練同步,第二個階段,92天擴展到20萬張GPU卡再次訓練、推理,性能表現優於OpenAI o3-mini-high和DeepSReek R1等模型。儘管比原計劃推遲了數月,但仍引起外界高度關注,共有超過200萬人觀看直播。(鈦媒體AGI)