在AI時代,Token成了通用貨幣,但沒人能弄清它們最終到底值多少錢。企業客戶一頭霧水,華爾街也摸不著頭腦。
當下AI應用落地遭遇的最新難題,來自“token經濟學”(tokenomics),以及AI使用成本管控——倘若企業疏於規劃,相關開支會迅速滾雪球式暴漲。
Token(詞元)是AI模型輸入和輸出的基本計量單位。舉例來說,用OpenAI的模型來統計,這句話包含17個token。通常,100個token大約相當於75個單詞。你也可以在OpenAI官網上親自體驗AI的token計數。
Token已經成了AI時代的“貨幣”。問題在於,token的價值會因使用方式不同而不同。客戶之所以感到困惑,是因為他們無法制定預算。華爾街也覺得摸不著頭腦,因為它沒法像在零售商店甚至雲計算中那樣輕鬆追蹤定價。
Anthropic讓情況變得更複雜,因為它對token的計數方式與AI行業其他公司不同。該公司最近調整了部分產品對文字的分詞方式,這意味著同樣的文字現在要比以前多消耗30%到40%的token,而它的舊款模型仍沿用更標準的計數方法。
消費者已經習慣了ChatGPT和Claude每月20美元的不限量使用套餐,但企業客戶是按token計費的。以ChatGPT最強的模型為例,每100萬個token的費用從0.5美元至30美元不等。
表面上看這似乎不算多少錢,但有兩件事改變了這筆帳的演算法,讓AI變成了一種昂貴的“習慣”。
第一件事是2024年“推理模型”的興起,這類模型讓聊天機器人在回答時採取了更具自省的方式。與早期ChatGPT那種迅速給出答覆不同,推理模型會自我對話,一步步推演問題。為撰寫本文做準備時,我讓ChatGPT“梳理所有公司在token開支上過度消費的案例”。該模型先和自己“對話”了32秒,期間進行了多次網頁搜尋、閱讀了幾十篇文章,最後才生成了一段約一千個token的回答。而它內部的自我對話所消耗的token遠不止這些。
而更新、也更大的問題,是AI智能體的興起:只需一句簡單的對話式指令,它們就能完成一連串複雜任務。與會受自身精力約束的人不同,智能體會瘋狂消耗token。每一次提示都會引發成堆的對話——需要越來越多的token,而且這一切都在沒有人工干預的情況下發生。
今年4月,Google、微軟及多所頂尖高校的研究人員發佈的一項研究顯示:在完成同樣的任務時,程式設計智能體消耗的token數量是人類程式設計師的上千倍。如今,智能體最常見的用途是軟體程式設計。研究人員還發現,token成本在不同任務之間、不同模型之間差異很大。研究指出,無論是人還是AI模型,都不擅長估算一項工作會消耗多少token。這就好比錢包裡有一張20美元的鈔票,卻不知道它能買到多少個熱狗。
Token消耗越多,不代表最終效果越好。而失敗的任務必須重做,這又需要額外消耗更多token。
如果這一趨勢持續下去,企業網路上的智能體很快就會超過人類數量,並最終遠遠多於人類使用者。正是預期到智能體的爆發式增長,以及這類應用恐怖的token消耗能力,海量資本才持續湧入新建AI資料中心,明年還將計畫建設更多。
程式設計智能體的快速進步促使企業CEO們紛紛擁抱其應用,也許在他們完全瞭解成本之前就已開始。今年早些時候,企業建立了儀表盤來追蹤員工的使用情況,結果可想而知——巨額帳單接踵而至,隨後企業迅速轉向更節儉的使用方式。
這些預算擔憂出現之際,各家公司仍在爭論AI本身的實際效用。在今年5月的一次播客採訪中,優步科技(Uber Technologies)總裁安德魯·麥克唐納(Andrew Macdonald)道出了這種新的謹慎態度。“有多少原本已經被擱置的項目因為生產力提升而被重新提上日程?”他說,“這種關聯目前還不存在。”
與此同時,華爾街在AI變現問題上也正經歷一場信心危機。分析師原本希望用“token”作為衡量AI交易熱度與健康狀況的替代指標,但上述種種定價問題讓情況變得模糊不清。
隨著美國最頂尖的前沿模型成本不斷上升,企業正在尋找其他方式來控制AI預算,其中一個方向就是選用低價模型,比如使用來自中國的高性價比模型。長遠來看,激烈的市場競爭或許會倒逼OpenAI、Anthropic下調高端模型定價,但現階段這一幕尚未發生。
眼下,追蹤AI供需平衡的最佳方式是通過雲服務。投資者應更多關注亞馬遜雲服務(AWS)、微軟Azure以及Google雲的定價動態。就在本周,AWS今年第二次上調了輝達GPU租賃價格。
歸根結底,AI要想具備可行性,就必須帶來更高的生產率,而生產率本質上是利潤除以人類工作小時數。勞動力成本容易核算,但這個等式中的“利潤”部分,則需要對token成本有更深入的理解。
在那之前,企業會盡一切努力把token支出控制住。而這對AI經濟的受益者——從晶片製造商到能源公司,再到OpenAI、Anthropic這樣的模型提供方——可能都不是好消息。
正如史丹佛大學經濟學家埃瑞克·布林約爾弗森(Erik Brynjolfsson)去年對我所說:“技術本身很少在你剛接入時就能立刻帶來生產力提升。幾乎總是需要重新思考業務流程。要把所有可能性真正梳理清楚,可能需要幾年甚至幾十年。” (Barrons巴倫)
