Google的gemini 3.0一出,各家都坐不住了,前天就傳聞Opus4.5要出
今天凌晨果然不負眾望,正式發佈了,綜合評測很強
首次在SWE bench上超越了80%,並且API價格也大幅下降66%,感謝OpenAI和google啊
在Arc-AGI上也是SOTA
SVG能力也很出眾
不過在基礎科學上一般,這是一個基礎物理視覺推理評測
年底了,御三家都不甘寂寞,據說oai的5.2也馬上要出 (大道至簡不簡單)