Anthropic公司正式發佈了他們最新的AI王牌組合—— Claude 3.7 Sonnet 和 Claude Code!各種能力超群,只是數學能力還是不及DeepSeek等,感覺Claude所有重點都在程式碼能力
第一時間(熬夜🤣)給大家劃個重點
Anthropic毫不掩飾對Claude 3.7 Sonnet的自信,直接稱其為 “迄今為止最智能的模型”,更重要的是,它還開創性地成為了 “市場上首個混合推理模型”!
與以往模型不同,Claude 3.7 Sonnet 的獨特之處在於其 “混合” 能力:
如果你是一名開發者,尤其是專注於 程式設計和前端Web開發,那麼Claude 3.7 Sonnet 和 Claude Code 的組合絕對會不失所望! Anthropic 明確指出,新模型在 “編碼和前端Web開發” 領域取得了 “特別強勁的改進”
更重要的是“Claude Code” —— 一個跨時代的 “智能體編碼命令列工具”! 這不僅是 Claude 系列的首款程式碼工具,更預示著AI輔助程式設計進入了一個全新的階段。 目前 Claude Code 以 “限量研究預覽版” 的形式推出
Claude Code 的強大之處在於,它將 AI 的程式碼智能直接融入開發者的工作流中,讓你能夠在熟悉的 終端環境 下,“直接委託實質性的工程任務給 Claude”。 想像一下,你只需在命令列輸入指令,就能讓 AI 智能體完成程式碼搜尋、檔案編輯、測試編寫和運行、程式碼提交和推送等一系列複雜的程式設計任務
Claude Code 的核心能力包括:
Anthropic 強調,Claude Code 在 測試驅動開發、複雜問題偵錯和大規模重構 等場景中尤其得心應手。 在早期測試中,Claude Code 能夠在 “單次操作中完成通常需要 45 分鐘以上的手動工作”,顯著縮短開發時間和成本
Claude Code 目前處於研究預覽的 beta 階段:
https://docs.anthropic.com/en/docs/agents-and-tools/claude-code/overview
性能是檢驗 AI 模型實力的硬指標。Anthropic 在公告中展示了 Claude 3.7 Sonnet 在多個權威基準測試上的卓越表現,用資料說話,實力盡顯:
通用benchmark測試
總而言之,Claude 3.7 Sonnet 在 指令跟隨、通用推理、多模態能力和智能體編碼 等多個關鍵領域都展現出了卓越的性能,在 數學和科學 方面,擴展思考模式帶來了顯著的提升但是沒有超越deepseek等模型。 在 Anthropic 內部的 Pokémon gameplay tests (寶可夢遊戲測試) 中,Claude 3.7 Sonnet 也超越了以往的所有模型
按照Anthropic的說法:Claude 3.7 Sonnet 和 Claude Code 的發佈,是在 “建構真正增強人類能力的 AI 系統” 道路上邁出的重要一步。 Anthropic 堅信,憑藉其強大的 “深度推理、自主工作和有效協作” 能力,AI 將把我們帶向一個更加美好的未來,在那裡,AI 將 “豐富和擴展人類所能成就的一切”
Anthropic 也在公告中展望了 Claude 的發展藍圖,描繪了 Claude 從 “助手 (assists)” 到 “合作者 (collaborates)” 再到 “先鋒 (pioneers)” 的進化路徑,預示著 AI 在未來將扮演越來越重要的角色,最終將能夠 “找到突破性的解決方案,解決需要團隊數年才能完成的挑戰性問題”。 (AI寒武紀)