外網投資圈最近傳播了一張圖片,這張圖片是對美股SAAS公司的市銷率和未來一年預測淨利潤增速的關係進行建模。
圖片顯示,Palantir當前處在遠離SAAS股集中的區域,(估值)高高在上,但從增速來看,也不算鶴立雞群。有一個直觀的洞察是處在右下方的企業的投資性價比最好,但這張圖片實際上並不能提供任何統計上的顯著性支援。
即使在美國,Palantir一直以來也是很有爭議性的公司。公司最出名的事件是為美國政府提供本拉登的藏匿線索。知名矽谷投資人Peter Thiel是聯合創始人,也是矽谷科技圈中最早倒向右派且認為川普會勝出的知名人物之一。Peter Thiel很聰明和智慧,但Palantir從2020年上市以來股價大部分時間處在比較低迷的狀態,直到2023年AI新浪潮才重新將Palantir股價拱起來直到最近突破了1700億美元,而它2023年的營收才22.25億美元,2024前三季度為20.38億美元。按P/S估計接近80倍。
Palantir一直維持很高神秘性,是因為過去它一直做各種軍方和政府背景的項目,不少項目某種意義上類似dirty works。因此它有必要也不得不保持低透明度。
Palantir最早的投資人就包含了CIA的風險投資機構In-Q-Tel。而國防部Maven項目最早就是尋求利用人工智慧分析無人機拍攝的視訊。它也為美國移民與海關執法局(ICE)提供軟體幫助追蹤非法移民。即使是公司的商業軟體Gotham和Foundry,演算法也是不開放的,運作機制是黑盒,使用者通常無法完全理解資料的處理過程或洞察的生成方式。Palantir擅長整合和分析其他工具難以處理的非結構化或“暗資料”,如截獲的通訊記錄或機密檔案。
Dirty works的一個內生性的特質就是高利潤率。由於做dirty works使得公司不透明,容易遭受公關危機和輿論質疑,高毛利高利潤作為補償非常合理。這也是之所以Palantir作為一個典型的項目型公司仍能維持高毛利的主要原因。同樣規模的人馬,一年接10個500萬美元價值的非標準化項目,與一年接1個5000萬美元的項目,大機率是後者的毛利和利潤更高。一種接近本質的解釋就是這當中的摩擦成本大幅減少了。
但Dirty works並不代表項目難度很高,只能說明項目有相當高的非標性和排他性。Maven項目就是由於Google員工強烈反對而放棄然後被Palantir接手的。事實上,就項目想實現的功能來說,找任何一個在美國排名靠前的電腦系實驗室都有機會勝任。但長期做政軍項目,對企業也會有反噬,即在商業上擴展時會遭遇很高的信任度考驗。
由於信任度的限制,Palantir很難成為全球性軟體公司,它的商業地域擴展潛力僅限於北美和少部分親美國家比如五眼聯盟。在商業領域,Palantir提供的服務基本可歸為所謂的數智化轉型。數智化項目傳統的難題是自證價值。Palantir過去的北美大客戶業務基本是非標項目,既沒有持續性,也很難證明公司服務的獨特性,因此很多業務收入都是周期性的。
自2003年成立以來到2017年左右,Palantir業務起起伏伏,雖然神秘性有餘,可是成長性不足。之所以2017年之後開始崛起,營收連年增長,2019至2023年增長了200%,其緣由主要還是成為了MAGA和俄烏戰爭的受益品。
2020年上市就搭上聯準會大放水的順風車,但之後Palantir有兩年時間股價低迷持續回落。從2023年推出AIP(Artificial Intelligence Platform)平台以來,Palantir股價先於基本面走牛且持續跑贏SAAS公司。而AIP認真深究起來,和大語言模型的關係並不密切,但市場似乎很偏愛Palantir在AI領域的規劃和定位。
Palantir究竟在以什麼規劃實現CEO Alex Karp說的“我們在人工智慧上的戰略就是贏得整個市場”?
大語言模型訓練的語料主要是公開資料,以幾十年的網際網路文字為主,所以它的首次商業落地是在通用領域,而過去兩年LLM在ToB的進展並不如很多人預期顯著,這是由於垂直領域知識的專有性和複雜性導致的。大模型目前最適合用來程式設計就是因為程式設計是垂直領域中最通用的部分。
Palantir一直以來強調自己在建構商業軟體和體系中的本體論思想。什麼是本體論?其實是一種原子化的、概念化的、規則化的世界觀。在本體論中,世界是以有層級結構的、相互聯絡、具有不同程度的資訊量所定義的實體建構起來的。在製造業中,本體論是很好理解的,所有的零件都可以以數量、價格、外觀、規格、性質、材質、位置等維度來定義,所有的裝置和流程亦然。生產線就是元件、裝置、關係、流程等這些事物的集合。
將這些東西數位化就是所謂的數字孿生。在任意一個層級的本體上,對應的觀測可以被建立,以產生資料。
可能很多人都不知道的是,人工智慧在視覺上(具體來說是圖像識別)的突破,其訓練就與基於本體層級結構資料庫分不開關係。華人科學家李飛飛曾經所帶領的ImageNet項目就是基於一個有本體層級結構的大型圖像資料庫。
Palantir很早就以本體論思想建構自己的核心產品Foundry,2016年發佈第一個版本。而Palantir創始人Alex Karp認為,他們的對手是在與一個打磨了20年的產品競爭。這意味著可能早在21世紀第一個十年,Palantir就已經在思索如何將人工智慧用於商業了。
我們該如何理解Foundry?
在某種意義上,Foundry可以類比於LLM大模型,它也是新發佈的平台產品AIP的基座。Foundry的實質是對商業世界的抽象表達,從物理/化學/生物工程語言、管理學語言、會計學語言等多個層面抽象並整合出一套內部互相聯絡的語義體系。這就是本體論在商業世界的形式化。
製造業歷史悠久,管理理論也非常完善,作為有雄心發揮人工智慧潛力的Palantir,選擇製造業作為Foundry產品的實驗場所也是理所當然。因此Palantir這幾年的商業客戶都集中在了大型製造業中,比如飛機、造船、能源運輸等。
Foundry在相當程度上與工業4.0是異曲同工。如果工業4.0隻是在於對全生產過程進行數位化,那麼工業4.0就很難大幅改進製造業的效率。但理想的工業4.0礙於各種壁壘,別說在上下游之間,在同一個企業內部打通也面臨各種約束。因為企業是一個不同層級資訊的有機構造的實體。想要對企業營運獲得高層級的感知和理解,打通不同的資料庫是一個絕對前提。
如果沒有一個本體論的基座,上面圖中所列出的企業內部各類本體就很難被整合起來。但對於Palantir來說,想要Foundry儘可能進入生產,提高Foundry的通用性和適用性是真正的考驗。
大語言模型的出現,理論上是為企業的主要生產過程賦能。然而由於大模型無法充分獲得企業使用者的環境資訊,而企業使用者也因為隱私和保護企業智慧財產權原因不能隨意向大模型洩露內部資訊,因此大模型的ToB場景面臨許多掣肘。
Palantir進一步推出AIP,其意向是創造模型和生產之間的橋樑。比如,Palantir的宣傳語言是基於Foundry的AIP可以協助商業客戶合規使用外部大模型。因為Foundry可以用來協助企業定義自己的資訊和知識邊界,借助AIP可以識別出涉及企業專有知識的情形並實施類似防火牆的功能。
Palantir用了傳統的行銷方法,在官網上羅列了上百個用例(user case)對AIP進行詳細推介。好像一個AI超市,有種任君挑選的感覺。這使得AIP更多的像是一個一個的專家系統應用。儘管如此,AIP的業務模式實際仍然不是賣軟體,而是賣服務。當客戶認為AIP提供的用例足夠滿足自己的需求時,客戶才會與Palantir對接產生業務聯絡,接下去則是一個定製化部署落地的過程,Palantir需要派駐工程師進駐項目以提供服務。這通常是一個歷時長久充滿摩擦的過程。而這個業務類型將對Palantir本就不高的營業利潤率施加一個容易觸摸到的天花板限制。
Palantir的競爭對手並不單一,首先是軟體類諮詢公司,比如西門子、IBM。這類公司存在已久,領域經驗極廣,涉足各種傳統和非傳統的行業,並且有相當長迭代歷史的專有企業級軟體。其次是新興的資料分析處理雲平台,比如Databricks,Synapse和Snowflake。最後一類也包括客戶內部IT尤其是大公司的IT部門。
由於Palantir並不是一個很純的軟體公司,它的商業模型相當程度上還是以項目諮詢結構為主的。假如一種革新有潛力產生長期積極效果,越大的公司一定會尋求辦法在內部集合資源做成這件事情,而不是向外部尋求高昂的諮詢專家。但反過來,如果我們正處於一個AI-Powered的技術轉型期,那這意味著由大企業開始到中小企業將會前仆後繼地尋求一次大的技術遷徙,就如網際網路帶來的建設浪潮一樣。這意味著Palantir的儲備有機會使得它站上AI技術浪潮的潮頭。這個洞察符合Palantir2023年以來的業務拓展情況,即主要由現有大客戶新增擴展業務所驅動的增長。
某種程度上,AIP很像利用AI技術給客戶的各種大大小小的業務情形設計專家系統。可以品嚐下這句話。而從商業客戶的付費意願來說,專家系統類型的產品理論上比通用大模型更容易被接納。所以IBM Watson早在20世紀90年代就有了第一批商用客戶。只是由於時代的技術限制,後續發展不順利,作為符號主義流派的成果並沒有創造時代潮流。
現在,通用大模型的落地和成熟使專家系統再一次可能成為大多數有意滿足商業客戶的AI轉型需求的公司的選擇。為什麼這麼說?
大模型的黑箱性質很難滿足很多領域的要求。比如醫療診斷、法律、工業生產營運維護、交通管理。即使在專業程度沒那麼高的領域裡,大模型的適用性也不是常常令人滿意。現在需要借助多步推理/思維鏈來誘導大模型給出足夠完善的答案,既有成本和技術問題,更多的是無法消除的“背景”原因。
在神經網路還沒有展現它的威力的年代裡,專家系統的建構是基於高度整合的領域知識的,接著需要選擇一定的語法規則對知識進行編碼,然後以特定的組織方式對知識編碼進行儲存形成規則庫,還要設計完善的推理機制以協助使用者從規則庫中正確提取知識。因此,專家系統本質上也是本體論的。
乍一看感覺這套方法論和作為聯結主義成果的神經網路方法是大相逕庭的。尤其是今天我們都瞭解了大語言模型基於自回歸方法、大規模算力和龐巨量資料建構的“預測下一個token”的範式,似乎正是大模型產生幻覺的根源。即使大語言模型成了很多人的得力助手,但要真正邁過生產的鴻溝,沒有人對什麼才是下一個迭代方向有充分的信心。
與此相反,專家系統的提出卻是基於人類社會很多領域要麼是經驗主導的,高度規則化的,或者決策高度依賴背景情形的。因此專家系統不會產生“幻覺”,因為我們在建構它的時候輸入的是基於人類現存的知識庫。可信度要求可解釋性和可追溯性,這是專家系統具備但大模型很難提供的東西。但專家系統本質上只是一套複雜度很高的規則庫,它又嚴重依賴於你提取它知識的路徑和方法。
最直接的改進路徑,就是利用大模型的自然語言理解能力。如果利用大模型作為語義理解入口,專家系統就能夠突破它過去的限制:以過於制式化的推理規則提取答案。
將注意力機制引入到專家系統的推理過程中,可以使其像大語言模型一樣動態地聚焦於不同的知識元素和問題的不同部分,並根據上下文資訊為每個知識元素分配不同的權重,從而更準確地捕捉知識之間的關聯和語義資訊,生成更合理、更有針對性的解決方案。
此外,大模型儲存知識是在模型參數的權重上以及相關參數權重的分佈上,並且以token為單位,這實在不符合人類對知識的經驗直覺。如果借鑑大模型的持續訓練模式,專家系統也能夠即時或定期地更新知識。當有新的知識產生或舊的知識需要修正時,系統可以及時調整和最佳化儲存的知識參數。
如果這個挖掘神經網路融合專家系統潛力的路徑可行,Palantir和其他類似的產品應該會展現持續多年的增長,這在一定程度上解釋了為什麼2023年以來美國經濟持續強勁,因為美國企業正在發生大規模的技術遷徙,這些遷徙要求巨額的資本支出。
對於Palantir來說,合理的企業戰略應該是將潛在大客戶的信任和合作慾望放到重心中的重心來關注,並以此創造出鮮明的user cases,利用Foundry、AIP這個產品組合提高在大公司群體中的滲透率,提高與大客戶的重複合作機率進而穩定預期現金流。這在很長時間內可以成為一個正向的反饋機制。大模型在ToB領域的受阻,意味著ToB的AI應用在範式上有很大的真空地帶,我們可能不需要更多的scaling up,而是充分的drill down。 (通向澄明之境)