登入
關鍵字
#大模型競技場
官方認證
RexAA
2024/09/01
•
GPT-4o mini排名雪崩,大模型競技場規則更新,奧特曼刷分小技巧無效了
大模型競技場規則更新,GPT-4o mini排名立刻雪崩,跌出前10。 新榜單對AI回答的長度和風格等特徵做了降權處理,確保分數反映模型真正解決問題的能力。 想用漂亮的格式、增加小標題數量等技巧討好使用者、刷榜,現在統統沒用了。 在新規則下,奧特曼的GPT-4o mini、馬斯克的Grok-2系列排名顯著下降,GoogleGemini-1.5-flash小模型也有所回落。
#GPT-4o mini
#大模型競技場
#奧特曼
208人
讚
留言
分享