輝達出手即王炸！重磅開源Nemotron大模型：擊敗GPT-4o、僅次於o1！

2024/10/17

•

輝達悶聲幹大事！什麼炒作也沒有，直接開源媲美GPT-4o、僅次於o1的模型！

輝達（Nvidia）在周二悄然發佈了一款新型人工智慧模型，性能超越了行業領導者OpenAI和Anthropic的產品，這標誌著公司人工智慧戰略的重大轉變，並可能重新塑造該領域的競爭格局。

這款名為Llama-3.1-Nemotron-70B-Instruct的模型悄無聲息地出現在熱門的人工智慧平台Hugging Face上，憑藉其在多個基準測試中出色的表現，迅速引起了關注。

項目地址：

https://huggingface.co/nvidia/Llama-3.1-Nemotron-70B-Instruct-HF

輝達報告稱，新的產品在關鍵評估中取得了優異成績，包括在 Arena Hard 基準測試中得分85.0，在 AlpacaEval 2 LC 中得分 57.6，以及在 GPT-4-Turbo MT-Bench 中得分 8.98 。

這些得分超過了OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet等備受推崇的模型，使輝達躋身人工智慧語言理解與生成的前沿。

這一發佈代表了輝達的一個關鍵時刻。該公司主要以圖形處理單元（GPU）的巨頭身份聞名，這些GPU為人工智慧系統提供動力，但現在它展示了開發複雜人工智慧軟體的能力。這一舉措標誌著輝達戰略擴張的開始，可能會改變人工智慧行業的格局，挑戰傳統的軟體公司在大語言模型開發中的主導地位。

輝達開發Llama-3.1-Nemotron-70B-Instruct的方式是，利用先進的訓練技術，包括“從人類反饋中學習的強化學習”（RLHF），對Meta的開源Llama 3.1模型進行了最佳化。這種方法使人工智慧能夠從人類的偏好中學習，可能會帶來更加自然和符合語境的回應。

憑藉其卓越的性能，這款模型有潛力為企業提供一個更有能力且更具成本效益的替代方案，挑戰市場上一些最先進的模型。

該模型能夠在無需額外提示或特殊標記的情況下處理複雜查詢，這是它的一個突出特點。在一次演示中，它正確地回答了“草莓裡有多少個r？”這個問題，給出了詳細且精準的回應，展示了對語言的深刻理解和提供清晰解釋的能力。

這些結果的特別重要之處在於強調了“對齊”（alignment）這一概念，這是人工智慧研究中的一個術語，指的是模型輸出與使用者需求和偏好的匹配程度。對企業來說，這意味著減少錯誤、提供更有幫助的回應，最終提高客戶滿意度。

對於企業和組織而言，輝達的這一模型提供了一個非常有吸引力的新選項。該公司通過其build.nvidia.com平台提供免費的託管推理服務，並配有與OpenAI相容的API介面。

這種可訪問性使得先進的人工智慧技術更加普及，允許更多公司實驗並實現先進的語言模型。

這一發佈還突顯了人工智慧領域逐漸向不僅強大而且可定製的模型轉變。如今，企業需要能夠根據其特定需求量身定製的人工智慧，無論是處理客戶服務查詢，還是生成複雜報告。輝達的模型提供了這種靈活性，並且具有頂級的性能，使其成為各行業企業的有力競爭選項。

然而，隨著這些強大的技術的推出，也伴隨著責任。如同任何人工智慧系統一樣，Llama-3.1-Nemotron-70B-Instruct也無法避免風險。輝達已提醒使用者，該模型並未針對數學或法律推理等專業領域進行調優，這些領域對準確性要求至關重要。企業需要確保合理使用該模型，並採取必要的保障措施以防止錯誤或濫用。

輝達最新的模型發佈顯示了人工智慧領域變化的速度。儘管Llama-3.1-Nemotron-70B-Instruct的長期影響尚不確定，但這一發佈無疑標誌著在建構最先進人工智慧系統的競爭中一個明顯的轉折點。

通過從硬體向高性能人工智慧軟體的轉型，輝達迫使其他廠商重新考慮他們的戰略，並加快自己的研發步伐。這一切發生在公司推出NVLM 1.0系列多模態模型之後，其中包括72億參數的NVLM-D-72B。

這些最新的發佈，特別是開放原始碼的NVLM項目，表明輝達的人工智慧雄心不僅僅是與競爭對手抗衡——它們挑戰了像GPT-4o這樣專有系統在從圖像解析到解決複雜問題等領域的主導地位。

這些發佈的快速接連突顯了輝達在人工智慧軟體開發領域的雄心。通過提供與行業領導者競爭的多模態和文字專用模型，輝達正在將自己定位為一個全面的人工智慧解決方案提供商，利用其硬體專長開發出強大且易於獲取的軟體工具。

輝達的戰略似乎很明確：它正在將自己定位為一個全方位的人工智慧服務提供商，結合硬體專長與高性能的軟體。這一舉措可能會重塑整個行業，迫使競爭對手加速創新，並可能激發更多開源合作。

隨著開發者對Llama-3.1-Nemotron-70B-Instruct的測試，我們很可能會看到該模型在醫療、金融、教育等領域的新應用出現。它的成功將最終取決於是否能夠將令人印象深刻的基準得分轉化為實際的解決方案。

未來幾個月，人工智慧社區將密切關注Llama-3.1-Nemotron-70B-Instruct在現實應用中的表現，超越基準測試。其能否將高得分轉化為實際的、具有價值的解決方案，將最終決定其對行業和社會的長期影響。

輝達深入開發人工智慧模型，已經加劇了競爭。如果這是人工智慧新紀元的開始，那麼它是一個完全整合的解決方案可能會為未來的突破定下節奏。 (51CTO技術堆疊)