#開源策略
輝達一口氣開源多項機器人技術,與迪士尼合作研發物理引擎也開源了
輝達在機器人學習大會(CoRL)上一口氣發佈了多項開源技術,其中最引人注目的是聯合Google DeepMind和迪士尼研究院開發的物理引擎Newton。這次輝達可謂是“全家桶”式發佈:不僅有讓機器人擁有”物理直覺”的Newton引擎,還有賦予機器人人類推理能力的Isaac GR00T N1.6基礎模型,以及能夠生成海量訓練資料的Cosmos世界基礎模型,直接瞄準了機器人研發中最頭疼的幾個問題。包括Boston Dynamics、Figure AI在內的頂尖機器人公司,以及史丹佛、蘇黎世聯邦理工等知名高校都已經開始使用這些技術。Newton物理引擎:讓模擬環境”真實”起來全球超過25萬機器人開發者都面臨著同一個難題:如何讓機器人在模擬環境中學到的技能,能夠安全可靠地遷移到現實世界?人形機器人的關節結構極其複雜,平衡控制難度極高,現有的物理引擎已經跟不上需求了。輝達Omniverse與模擬技術副總裁Rev Lebaredian認為:”人形機器人是物理AI的下一個前沿領域,需要在不可預測的世界中進行推理,適應環境並安全行動。”Newton引擎的出現恰好解決了這個痛點。這個由Linux Foundation管理的開放原始碼專案,基於輝達的Warp和OpenUSD框架建構,採用GPU加速技術。最厲害的是,它能夠模擬非常複雜的機器人動作,比如在雪地或碎石路面行走,操控杯子和水果等細膩動作。蘇黎世聯邦理工學院機器人系統實驗室、慕尼黑工業大學、北京大學等頂尖高校已經率先使用Newton。光輪智能和模擬引擎公司Style3D也加入了早期使用者行列。Isaac GR00T N1.6:機器人的“深度思考大腦”讓機器人理解“幫我拿杯水”這樣的模糊指令,一直是業界的難題。輝達最新發佈的Isaac GR00T N1.6開源模型,通過整合Cosmos Reason視覺語言模型,讓機器人擁有了接近人類的推理能力,即將在Hugging Face平台上線。它能夠利用已有知識、常識和物理原理,將模糊指令轉化為逐步執行的計畫。更重要的是,機器人可以同時完成移動和物體操控動作,軀幹和手臂擁有更大的活動自由度,甚至能夠推開較重的房門。目前Cosmos Reason下載量已超過100萬次,在Hugging Face的物理推理模型排行榜上穩居榜首。輝達還貼心地提供了開源物理AI資料集,包含數千條合成及真實世界的軌跡資料,目前下載量已經突破480萬次。AeiROBOT、Franka Robotics、LG Electronics等領先機器人製造商正在評估採用Isaac GR00T N系列模型。訓練革新:從抓取技能到全面測試教會機器人抓取物體是機器人領域最具挑戰性的任務之一。基於輝達Omniverse建構的Isaac Lab 2.3開發者預覽版,新增了靈巧抓取工作流。這個工作流的巧妙之處在於採用了”自動化課程體系”:從簡單任務開始,逐步提升難度,同時調整重力、摩擦力、物體重量等參數,讓機器人在不可預測的環境中也能掌握技能。Boston Dynamics的Atlas機器人就是通過這個工作流學習抓取技能,操控能力得到了顯著提升。為瞭解決測試場景零散且簡單化的問題,輝達與光輪智能聯合開發了Isaac Lab Arena,一個用於大規模實驗和標準化測試的開源策略評估框架,讓開發者無需從零建構系統,就能在模擬環境中開展複雜、大規模的評估。全新AI基礎設施加持,機器人開發全面提速硬體層面,輝達也是下足了功夫。GB200 NVL72機架式系統整合了36個Grace CPU和72個Blackwell GPU,各大雲服務提供商已經開始採用。RTX PRO伺服器為機器人開發的各類工作負載提供統一架構,RAI Institute已經率先使用。最讓人期待的是搭載Blackwell GPU的Jetson Thor,它能夠支援機器人運行多個AI工作流,實現即時智能互動。Figure AI、銀河通用、Google DeepMind、宇樹科技等合作夥伴已經開始採用這款產品。在CoRL收錄的論文中,近半數引用了輝達的相關技術。卡內基梅隆大學、華盛頓大學等頂尖研究機構都在使用輝達的GPU、模擬框架和CUDA加速庫。史丹佛視覺與學習實驗室的BEHAVIOR機器人學習基準測試項目,以及北京大學開發的觸覺機器人模擬平台Taccel,都基於輝達技術開發。從開源物理引擎到基礎模型,從訓練工作流到硬體基礎設施,輝達這次的”全端式”佈局,正在重新定義機器人研發的遊戲規則。機器人從實驗室走向日常生活的道路,可能比我們想像的要短得多。 (量子位)
馬斯克宣佈:開源!還稱中國公司將是最強大的對手
馬斯克的AI大動作曝光。據券商中國報導,美東時間23日,特斯拉CEO埃隆·馬斯克宣佈,旗下的人工智慧(AI)初創公司xAI已開源其Grok 2.5模型。在前一天,馬斯克還表示,成立一家名為 Macrohard(意為“巨硬”)的新公司,利用AI的力量來對抗微軟的軟體業務。馬斯克 圖/新華社馬斯克開源Grok-2台北時間8月24日,特斯拉CEO馬斯克在X上官宣,xAI去年最好的模型Grok-2.5(實際上是Grok-2)正式開源,同時,Grok-3也將在大概6個月內開源。馬斯克同時發表觀點表示,xAI很快就會超越除Google外的任何公司,然後也將超越Google,“但中國公司將是最強勁的競爭對手,因為他們的電力比美國多得多,而且在硬體建設方面實力超強。”關於開源權限,xAI公司明確,僅當關聯公司年收入低於一百萬美元時,才可用於商業用途,超過此門檻的商業用途需獲得xAI的單獨許可。除非本協議條款允許對Grok 2進行修改或微調,否則不得使用材料、衍生品或輸出(包括生成的資料)來訓練、建立或改進任何基礎、大型語言或通用人工智慧模型。與此同時,Grok App推出了 v1.1.58版本更新,新增功能如 Imagine生成圖像速度提升、Companions功能更加生動有趣,Vision模式也已面向所有Android使用者開放,使用體驗全面升級。值得注意的是,就在前不久,Grok AI聊天平台被曝出隱私問題。Grok網站上已有超過37萬條AI聊天記錄被發佈並被搜尋引擎索引,這意味著這些聊天內容已經對公眾開放。除了聊天記錄本身,Grok還發佈了使用者上傳的照片、電子表格和其他文件。該平台提供了一個分享按鈕,使用者可以通過生成獨特的URL連結將對話分享給他人。然而,這些連結可被搜尋引擎獲取,導致任何人都可以查看這些聊天記錄,而不僅僅是那些收到連結的人。馬斯克:X平台計畫在Grok回覆中引入廣告21世紀經濟報導此前報導,8月7日,在X平台的一場直播活動中,埃隆·馬斯克向廣告商宣佈了一項重大變革:將在其人工智慧聊天機器人Grok的回覆中嵌入廣告內容。馬斯克表示,當使用者向Grok尋求問題解決方案時,系統將推薦相關產品或服務作為“特定解決方案”。馬斯克為廣告融入聊天體驗描繪了一幅看似和諧的圖景,在使用者尋求解決方案的時刻,廣告將成為答案的自然組成部分而非干擾。廣告展示形式將不同於傳統數字廣告,Grok的AI系統會根據使用者查詢的上下文深度定製推薦內容,將品牌資訊無縫編織進幫助性答案中。xAI計畫讓這一過程高度自動化,馬斯克向廣告商承諾,他們將能夠“上傳廣告後無需任何額外操作”,AI將處理從定位到最佳化的全部流程。驅動這一變革的不僅是創新熱情,還有嚴峻的經濟現實。馬斯克坦言,運行高級AI模型的GPU成本是天文數字。“我們目前的重點是讓Grok成為全球最聰明、最準確的AI,我認為我們基本已經做到了”,馬斯克在直播中表示,“接下來我們會思考,如何為那些昂貴的GPU買單”。今年5月,xAI已在田納西州孟菲斯的計算設施部署了20萬塊GPU,並計畫在郊區新建配備100萬塊GPU的超算中心。這些硬體投入需要可持續的資金支援,廣告收入被視為解決這一挑戰的關鍵方案。整個行業都在探索可持續的AI商業模式,馬斯克的舉措將X置於AI商業化實驗的前沿。在這之前,X平台在向廣告商傳送的一份郵件中還表示,平台已利用xAI的技術提高了廣告的相關性,並重新訓練了用於衡量廣告點選轉化為銷售的模型。自6月以來,網路廣告的轉化量增長了40%。此前Meta就已經證明大模型有助於提升廣告效果,不久前季報電話會上Meta透露,本季度Instagram的廣告轉化率在AI的加持下大約提升了5%,Facebook提升了3%。 (21世紀經濟報導)
揭秘:OpenAI選擇開源,背後的7個驚人真相(內行人都看傻了​​)
在科技巨頭們爭奪AI霸權的競技場上,OpenAI剛剛投下了一枚重磅炸彈! 🔥想像一下:一邊是創紀錄的400億美元融資、3000億美元估值的巔峰時刻,一邊是CEO山姆·奧特曼(Sam Altman)突然宣佈將開源他們的模型——這看似矛盾的兩幅畫面,究竟隱藏著什麼秘密?當全球5億使用者每周都在使用ChatGPT,當無數人沉浸在GPT-4o生成的宮崎駿風格圖片中,OpenAI卻決定放棄自2019年以來堅持的封閉模式策略,這一180度大轉彎背後,遠比你想像的更加複雜和深刻。🔍 表面原因:中國DeepSeek的崛起乍看之下,OpenAI突然改變策略似乎是受到中國新創公司DeepSeek今年1月的開源舉措影響。但有多位AI產業內部人士透露,這只是冰山一角。💡 深層原因:價值重心的轉移隨著AI技術深入商業應用,一個關鍵趨勢正在形成:價值正從模型本身轉嚮應用系統和客制化能力。 Databricks人工智慧副總裁Naveen Rao指出:"開源不是某種好奇心驅動的嘗試,它已成為AI使用的重要組成部分。OpenAI希望透過其品牌和模型成為這一領域的參與者。"想像一家金融公司,它不希望客戶資料離開自己的基礎設施流向外部雲端;或者一家製造企業,希望在不聯網的工廠硬體中嵌入AI。在這些場景下,開源模型正是解決方案。🌐 企業需求:靈活性勝過精確度福雷斯特研究公司(Forrester Research)高級分析師Rowan Curran解釋說,企業對開源AI模型的熱情不僅來自於精準性,更源於其靈活性和可移植性。"它們可以在不同的雲端平台上運行,甚至可以在公司自己的資料中心、工作站、筆記型電腦或機器人上運行,而不是繫結到一個供應商,」Curran說。這種從雲端到邊緣的端對端解決方案能力,正是OpenAI目前缺少的一環。⚖️ 艱難的平衡術雖然Rao不認為OpenAI的開源模型是對DeepSeek的直接回應,但"DeepSeek時刻"確實表明中國新創公司在AI競賽中已不落後。 "我們行業內的許多人早已知道這一點,"他說。如果OpenAI現在不瞄準開源社區,"它將失去大量影響力、goodwill和社區創新。"這也造成了OpenAI傳遞矛盾訊息的尷尬局面。一方面強調開源模式的危險性,一方面又需要利用開源社群的影響力。商業上,他們還需要確保開源模式不會與自己的付費產品競爭。🏆 與Meta的暗戰如果說OpenAI的開源策略不全是針對DeepSeek,那麼它很可能是為了與另一個強大的開源競爭對手——Meta一決高下。 Meta計畫在本月底發佈其開源模型系列Llama的第四個版本。"Meta已成為西方開源AI的標準bearer,"Rao說。"如果OpenAI想奪回生態系中的影響力,就必須挑戰Meta。"奧特曼在X平台上暗諷Meta的限制條款:"我們不會做任何愚蠢的事情,比如說如果你的服務擁有超過7億月活躍使用者,就不能使用我們的開源模型。"🔮 OpenAI開放原始碼的未來展望儘管奧特曼的言論模糊,但福雷斯特的Curran表示,沒有理由認為OpenAI的開源模型會比Meta或Mistral的任何商業開源版本更加透明——無論是在資料還是訓練方法方面。"我預計它會比其他開源模型更加不透明和封閉,"他說,"透明度將顯著降低。"身為AI技術的關注者,您如何看待OpenAI這項策略轉變?是商業必然,還是技術進步的自然結果?這是否意味著AI領域將進入一個更開放、更具協作性的新時代? (澤問科技)