#Yi-Large
2024/05/22
•
李開複批“作秀式大模型排名”,中國大模型與全球頂尖大模型僅差6個月
剛在上週開過發布會的零一萬物創始人李開復,時隔一周再一次在線上親自和小部分媒體溝通,並在溝通會的開始就表示“難掩興奮,希望馬上開發布會和大家分享這個消息。 這個讓李開復無比興奮的消息就是,零一萬物提交的「Yi-Large」 千億參數閉源大模型在LMSYS Org發布的Chatbot Arena取得了總榜排名第七的成績。 過去一年的模型能力大戰中,伴隨每次新模型的發布,Benchmark評分就會作為標準動作同時公佈。但是,究竟該如何解讀這些分數呢?哪些才是有公信力的?業界並沒有統一的標準。 在Gpt-4o發布後,我們注意到OpenAI CEO Sam Altman親自轉帖,引用的也是LMSYS arena 盲測擂台的測試結果。