DeepMind表示,儘管基於自然語言的方法可以訪問更多資料,但會產生看似合理但不正確的中間推理步驟和解決方案。而形式語言提供了一個重要優勢,即涉及數學推理的證明可以被形式化地驗證其正確性。
DeepMind人工智慧系統在IMO 2024上相對於人類競爭者的表現。在42分的總分中,人工智慧系統獲得了28分。
GoogleDeepMind的AI模型解決了今年國際數學奧林匹克競賽(IMO)六個問題中的四個問題,人工智慧首次達到了銀牌標準。
當地時間7月25日,GoogleDeepMind公佈專用於數學推理的模型AlphaProof,以及專注於幾何的模型更新版本AlphaGeometry 2。DeepMind表示,AlphaProof和AlphaGeometry 2解決了數學中的高級推理問題,具有先進數學推理能力的通用人工智慧或開啟科學和技術的新領域。