#工具人
華盛頓郵報:ChatGPT被高估了,以下是一些替代選擇
ChatGPT is overrated. Here’s what to use instead.當我需要人工智慧的幫助時,ChatGPT 不再是我的首選。(插圖:Elena Lacey/《華盛頓郵報》;Adobe Stock)你那位喜歡嘗鮮的朋友對 ChatGPT 的膳食計畫讚不絕口。你的老闆認為 Microsoft Copilot 能“提升 10 倍生產力”。你的社交媒體動態則認為 Meta AI 簡直就是個垃圾機器。他們大多隻是憑感覺行事。我可以告訴你那些人工智慧工具值得使用,那些應該避免使用,因為我一直在營運一個聊天機器人實戰俱樂部。我根據人們使用人工智慧進行的實際活動,進行了數十項機器人挑戰,包括撰寫分手簡訊和工作郵件、解讀法律合同和科學研究、回答棘手的研究問題以及編輯照片和創作“藝術作品”。包括暢銷書作家、參考圖書館員、一位著名科學家,甚至一位普利策獎得主攝影師在內的人類專家對結果進行了評判。經過一年的機器人大戰,有一點顯而易見:沒有絕對最好的AI。如今使用聊天機器人的最明智方式是針對不同的任務選擇不同的工具,而不是指望一個機器人就能包攬一切。舉個例子:聊天機器人界的“舒潔”——ChatGPT,在我所有的直接對決中都敗下陣來。即使是那些最終獲勝的機器人,也很少能達到人類及格的水平。評委們表示,Anthropic公司的Claude機器人寫出的分手簡訊比我寫的還要好。大多數機器人被“iPhone有多少個按鈕?”這個問題難住了。ChatGPT在一個真實的醫學問題上擊敗了一位頂尖醫生——但它給出的建議也可能對你造成嚴重傷害。讓人類專家來評判這些測試,改變了我對聊天機器人的看法,以及我在生活中使用它們的方式。即使你擔心人工智慧會搶走工作、破壞環境或侵犯隱私,但拋開炒作,瞭解當今人工智慧工具的實際表現仍然很有價值。提升人工智慧素養可以幫助你認識到,機器人並非真正“智能”,但同時又能最大限度地發揮它們的實際功能。那款聊天機器人最適合你?三年前,ChatGPT 開啟了生成式人工智慧的競賽,如今它的開發商 OpenAI 表示,它每周的使用者量高達 8 億。過去,每當我想尋找同義詞或冷知識時,它都是我的首選。但當我開始系統地進行測試後,發現 ChatGPT 在最受歡迎的聊天機器人中排名從未超過第二。(《華盛頓郵報》與 OpenAI 有內容合作關係。)OpenAI 近期發佈了內部“紅色警報”,指示員工將工作重心從網頁瀏覽器等項目轉移到改進 ChatGPT 的響應能力上。“我們很高興能在 2026 年繼續提升 ChatGPT 的性能,”發言人 Taya Christianson 表示。根據我的機器人格鬥俱樂部經驗,我現在會針對不同類型的任務選擇不同的機器人。以下是實際操作中的具體情況:我用Claude來寫作和編輯。它的措辭更優美,偶爾還能開個玩笑,而且不太可能像 Claude 那樣,在郵件開頭就用“希望你一切都好”這種令人心碎的客套話。在我的一項測試中——用 Claude 寫一封道歉信——評委Pamela Skillings說 Claude “能夠傳達真實的人類情感和周到的考慮”。為了進行研究和快速尋找答案,我使用Google的AI模式,而不是普通Google搜尋結果中彈出的AI概覽,後者可靠性遠不及前者。AI模式是一款聊天機器人式的搜尋工具,它可以在給出答案之前進行數十次搜尋。這也有助於它提供更及時的資訊:在我的研究測試中,它正確識別出了目前推薦的乳腺炎(一種乳房感染)治療方法,而其他機器人提供的卻是過時的方案。在處理文件方面,我使用Claude。在我的文件分析測試中,它是唯一一個從不捏造事實的機器人。資深公司律師斯特林·米勒法官表示,當我讓機器人就一份租賃協議提出修改建議時,Claude 的回答最接近“律師的良好替代品”。對於圖像處理,我使用Google的Gemini,它在我設計的所有測試中都遙遙領先於其他競爭對手。當我讓機器人從照片中移除兩個主體中的一個時,結果非常逼真——甚至連裙子上亮片反射的光線等細節都完美呈現——以至於評委、攝影記者大衛·卡森驚嘆不已。他根本看不出Gemini的輸出是由人工智慧生成的。我已經介紹了一些主要的AI應用案例,但並非全部。(如果您有關於更公平的機器人測試的建議,請給我發郵件。)我的測試比科技公司喜歡吹捧的行業基準測試需要更多的人為判斷。他們通常使用自動化測試,讓機器人回答一系列問題,就像醫學或法律考試一樣。但機器人可以被訓練成在這些測試中取得高分,掩蓋了它們在實際問題中表現不佳的事實。你可能不會同意我提出的每一個問題或個別評委的觀點,但人類的評估方式更接近我們現在實際使用人工智慧的方式。這就引出了另一個問題:什麼時候應該使用聊天機器人?當機器人讓我們失望時在我的AI格鬥俱樂部裡,機器人有時表現令人印象深刻。但只有一次,裁判給機器人的總分超過了70%——這是通常的及格分數線。那一項得分——84%——是 Gemini 在圖片製作和編輯方面的得分。大多數獲勝者的得分都在 50% 到 65% 之間。“問題是,沒有那個工具能全都拿到 10 分,”擔任我們摘要測試評委的律師米勒說道。這並不意味著如今的人工智慧工具毫無用處。但這確實意味著,你需要對它們的侷限性抱持懷疑態度。將人工智慧應用於某項任務並不總是能提升其效果。當我們測試人工智慧回答冷知識問題的能力時,我們的圖書管理員評委表示,他們完全可以通過傳統的Google搜尋找到大部分答案。人工智慧確實加快了給出答案的速度,但問題在於,其中一些答案是錯誤的。最有效的AI素養訓練方式莫過於觀察機器人的失敗。在我的知識問答測試中,它們連iPhone上有多少個按鈕都答不上來。ChatGPT說是四個,Claude和Meta AI說是三個,而Copilot說是六個。正確答案是五個,指的是最新的高端iPhone機型。為什麼會有這樣的困惑呢?因為機器人過度依賴文字,而且目前還不擅長識別圖片。如今的聊天機器人極力想要立即給你一個看似答案的答覆。它們非常不擅長表達不確定性。例如:在我舉辦的知識競賽中,我問機器人:“《神奇四俠》在爛番茄上的評分是多少?”當時,它是票房冠軍。但即使是最終的獲勝者——AI模式,也答錯了,給出了2015年一部臭名昭著的《神奇四俠》電影的評分。它甚至都沒問我指的是那一部。在我的寫作測試中,當機器人無法將措辭與上下文相符時,它們常常顯得不夠真誠。ChatGPT 就曾有過一次令人尷尬的經歷,它在分手簡訊中使用了帶有被動攻擊意味的短語“that said”:“我覺得你是個很棒的人。話雖如此,我意識到我們之間沒有未來。”如果我可以改變當今人工智慧工具的一件事,我會讓它們更擅長提出後續問題,這些問題可能會徹底改變答案。當我請加州大學舊金山分校醫學系主任鮑勃·瓦赫特(Bob Wachter)評價ChatGPT對真實醫療問題的回答時,他的一番話讓我印象深刻。他指出,擁有無限知識的機器人與一位優秀的醫生之間的區別在於,醫生懂得如何用更多的問題來回答問題。這才是真正解決問題的方法。瓦赫特建議了一種我現在經常使用的AI策略:在向聊天機器人提出問題之前,儘可能詳細地提供所有資訊,因為AI可能不會主動詢問某些資訊就嘗試回答。例如,與其說“總結這份租賃合同”,不如說“為華盛頓特區的租戶總結這份租賃合同,並標記有關費用、續租和提前終止的條款”。我還向我的聊天機器人加入了一條“自訂指令”,告訴它們“如果提示含糊不清,則在回答之前先請求澄清”。我希望這些技巧能幫助你從人工智慧中獲得更有用的答案。這些工具會不斷發展——它們的問題也會隨之而來。基於你的資料來個性化機器人回覆的做法,增加了隱私侵犯和操縱的風險。我總是會更改機器人的默認設定來保護我的資料。2026年及以後,我們必然會面臨更多的人工智慧產品。我們該如何應對?對我來說,答案和今年以來一樣:讓機器人格鬥俱樂部持續運轉——並且讓人類坐在裁判的位置上。 (invest wallstreet)
Coinbase 2025 年的收購清單
進入 2025 年以來,Coinbase 持續通過併購擴展其產品能力與組織邊界。相關交易橫跨鏈上基礎設施、衍生品交易、代幣管理、收益工具、發行平台以及預測市場,且多數以團隊吸收或功能整合為主。年初,Coinbase 相繼收購鏈上瀏覽與搜尋項目 Roam,以及鏈上廣告技術團隊 Spindl。兩筆交易均未披露金額,被收購團隊隨後併入 Coinbase 或 Base 體系,原有產品不再以獨立品牌營運。這類交易更側重於使用者發現、分發與增長工具,而非直接的交易收入。在隱私與基礎設施層面,Coinbase 通過 Base 網路吸收了 Iron Fish 的開發團隊,但明確未收購其區塊鏈或原生代幣。同期,公司還收購了代幣管理平台 Liquifi,並以人才併購方式引入 DeFi 期權協議 Opyn 的核心成員,用於補強發行管理與衍生品能力。5 月,Coinbase 完成年度金額最大的一筆交易,以約 29 億美元收購加密期權平台 Deribit,將現貨、期貨與期權交易納入同一體系。這一收購顯著提升了其在衍生品市場的深度與覆蓋範圍。進入下半年,Coinbase 的併購重點進一步延伸至發行與交易入口。公司以約 3.75 億美元收購 Launchpad 平台 Echo,並在隨後併入 Solana 生態交易平台 Vector.fun,補充特定生態的使用者入口與流動性來源。最新一筆交易發生在預測市場領域。Coinbase 同意收購 The Clearing Company,該團隊由 Kalshi 與 Polymarket 的前員工創立,Coinbase 此前已參與其 1500 萬美元種子輪融資。交易條款未披露。截至目前,Coinbase 在 2025 年完成的多數收購未公佈具體價格,且被收購項目在完成技術或人員整合後,通常不作為獨立業務單元繼續營運。 (方到)
聯準會副主席:四個維度研判 AI 泡沫
人工智慧(AI)正以前所未有的速度重塑全球經濟與金融圖景。隨著資本市場對AI相關公司的熱情持續高漲,一個不可避免的問題浮出水面:我們是否正在見證一場類似上世紀90年代末網際網路泡沫的投機狂潮?2025年,聯準會副主席菲利普·N·傑斐遜在克利夫蘭聯準會金融穩定會議上,系統闡述了他對當前AI熱潮與網際網路泡沫時代的比較分析,並提出了判斷AI是否存在泡沫的四個關鍵指標。這一講話不僅反映了全球最重要央行對新興技術的審慎觀察,也為市場參與者提供了理性評估AI熱潮的清晰框架。一、聯準會的觀察基點:雙重使命與金融穩定聯準會的一切政策與觀察均圍繞其法定“雙重使命”——最大化就業與價格穩定展開。傑斐遜明確指出,評估人工智慧的影響必須從這一根本任務出發。這意味著,聯準會關注AI不僅在於其技術突破或市場表現,更在於它如何影響整體就業水平、勞動生產率、經濟增長潛力以及通貨膨脹走勢。從就業角度看,AI展現出雙重效應。一方面,它通過提升工作效率、創造新崗位(如AI研發、部署與維護)促進就業;另一方面,其自動化替代效應可能導致部分職業萎縮,尤其對年輕、經驗較少的勞動者衝擊可能更大。傑斐遜指出,若AI僅替代現有勞動力而未能同步創造新崗位,可能引發短期經濟放緩。這種“替代與補充”的動態平衡,是判斷AI對勞動力市場結構性影響的核心。從價格穩定視角,AI提高生產率有助於降低生產成本,對物價構成下行壓力。高效資源配置、供應鏈最佳化、決策輔助等應用都可能抑制通膨。但同時,AI基礎設施(如資料中心)建設推高土地、能源等投入品價格,AI人才薪資上漲也可能帶來成本推動型通膨。這種雙向影響使AI對通膨的淨效應充滿不確定性,需持續監測。為實現雙重使命,穩健且有韌性的金融體系至關重要。聯準會通過半年度的《金融穩定報告》(FSR)持續監測系統性風險。最新調查顯示,30%的市場聯絡人將“對AI的態度轉變”視為金融體系顯著風險,較春季的9%大幅上升。這似乎警示,若市場對AI的樂觀預期突然逆轉,可能引發金融條件收緊與經濟下行。因此,聯準會將AI納入金融穩定監測框架,正是為了防範技術熱潮可能滋生的資產泡沫與金融脆弱性。二、監測框架:FSR與市場情緒跟蹤聯準會對AI的監測並非孤立進行,而是嵌入其整體金融穩定評估體系中。FSR不僅關注傳統風險如槓桿率、資產估值、融資風險等,也將新興技術帶來的結構性變化納入視野。傑斐遜強調,政策制定者必須區分“周期性波動”與“結構性變化”,而AI很可能屬於後者。這意味著,AI帶來的生產率提升可能改變就業與通膨間的關係,進而影響貨幣政策傳導機制。市場情緒是FSR關注的重點之一。調查顯示,近三分之一的市場參與者已意識到AI情緒逆轉的潛在風險。這種共識本身可能成為“自我實現的預言”——一旦樂觀敘事轉向,資本快速撤離可能導致資產價格劇烈調整。相比網際網路泡沫時期,今天的資訊傳播速度與演算法交易普及可能放大市場波動。因此,聯準會對情緒指標的跟蹤,實質是對潛在系統性風險的早期預警。此外,AI在金融業自身的應用也帶來新的監測挑戰。高頻交易、智能投顧、風險模型等AI工具在提升效率的同時,也可能引發新的同質化風險與順周期性。聯準會正通過擴展分析工具包(包括利用AI技術自身)來加強對這些新興風險的識別與評估。三、四個核心指標:判斷AI泡沫的試金石傑斐遜通過對比當前AI熱潮與1990年代末網際網路泡沫,提煉出四個關鍵差異點,這些差異可以成為判斷當前AI領域是否存在嚴重泡沫的核心指標。(一)盈利基礎:從“故事驅動”到“盈利支撐”網際網路泡沫時期,大量公司僅憑“.com”概念上市,缺乏可持續的盈利模式,收入微薄甚至為零,依賴外部融資與市場狂熱維持營運。相比之下,當前AI領域的領頭企業(如部分科技巨頭)普遍擁有堅實且多元的盈利管道。它們不僅通過AI服務直接創收,更將AI深度嵌入現有產品體系,提升核心業務競爭力。這種“盈利支撐”的發展模式,使AI投資更具基本面依據,降低了純投機炒作的空間。然而,傑斐遜也指出,私募市場的活躍可能部分掩蓋了早期AI公司的盈利困境。大量風險資本湧入AI初創企業,這些公司雖未上市,但估值高企,若未來無法實現盈利,仍可能成為風險源。因此,盈利指標的觀察需兼顧公開與私募市場。(二)估值水平:市盈率相對克制網際網路泡沫巔峰期,網際網路公司市盈率常達數百甚至上千倍,反映出市場對遠期增長的非理性樂觀。當前,儘管AI概念公司股價大幅上漲,但其市盈率仍遠低於歷史峰值。這一定程度上表明,投資者在追捧AI的同時,仍在一定程度上錨定企業實際盈利與現金流。當然,估值合理性需結合行業特點與增長階段綜合判斷。AI作為通用目的技術,其長期價值創造潛力巨大,適度溢價有其合理性。但若估值脫離基本面過快上漲,仍可能滋生泡沫。聯準會關注估值指標,正是為了辨別市場熱情中的理性成分與過熱訊號。(三)上市公司數量:投機廣度有限1999-2000年,超過1000家網際網路公司上市,形成“遍地開花”的投機盛況,甚至更名加入“.com”即能推高股價。當前,被明確歸類為“AI核心企業”的上市公司約50家左右(依據特定指標),數量遠少於網際網路泡沫時期。這表明市場投機行為相對集中,尚未蔓延至整個市場。但傑斐遜也提醒,私募市場可能隱藏著大量AI初創公司,它們雖未公開交易,但融資活動活躍。若這些公司未來批次上市或融資環境突變,可能成為新的不穩定因素。因此,“公司數量”指標需動態觀察,涵蓋公募與私募領域。(四)金融槓桿:債務依賴程度較低網際網路泡沫時期,許多公司依賴股權融資,債務槓桿有限,這某種程度上減少了泡沫破裂對金融體系的直接衝擊。當前,AI公司同樣較少依賴債務融資,這有利於限制風險傳導。然而,近期趨勢顯示,為支撐AI基礎設施(如資料中心、算力叢集)的巨額投資,部分企業開始增加債券發行與信貸融資。傑斐遜特別指出,隨著AI從軟體層面向硬體基礎設施擴展,資本投入需求急劇上升,可能導致槓桿率逐步攀升。若AI情緒逆轉,高槓桿公司將面臨更大償債壓力,進而通過信貸管道將風險擴散至更廣經濟領域。因此,槓桿指標需密切關注其演變趨勢。四、對市場從業者的啟示傑斐遜的論述不僅為政策制定者提供分析框架,也為投資者、企業及研究人員帶來重要啟示:第一,觀察問題需從觀察者的根本任務出發。 投資者應超越短期市場情緒,深入分析AI技術對企業基本面(盈利能力、成本結構、競爭壁壘)的實質影響。企業則需聚焦AI如何提升自身生產率與長期競爭力,而非盲目追逐概念。第二,辨別周期性波動與結構性變化。 AI代表的是可能持續數十年的技術革命,其影響是結構性的。市場波動中應區分長期趨勢與短期噪音,避免將結構性機會誤判為周期性泡沫,或反之。第三,關注整體市場反應與系統性風險。 單個公司或類股的上漲未必構成泡沫,需評估市場整體估值水平、資金集中度、槓桿情況與情緒一致性。尤其需警惕AI敘事從“盈利支撐”轉向“故事驅動”的跡象。第四,善用分析工具,包括AI本身。 AI技術可被用於更精準地評估市場風險、企業價值與經濟影響。從業者應積極利用資料分析、機器學習等工具提升決策質量,同時警惕模型同質化可能帶來的新風險。五、以理性與熱情持續、多維、動態參與傑斐遜最終結論相對審慎樂觀:基於盈利基礎、估值水平、公司數量與金融槓桿四個維度的比較,當前AI熱潮與網際網路泡沫存在顯著區別,重演1990年代末劇烈崩盤的可能性較低。AI發展根植於一批盈利穩健的成熟企業,且整體金融體系韌性較強。然而,不確定性依然存在。AI對就業、通膨、生產率的長遠影響仍需時間驗證;市場情緒可能逆轉;私募市場活躍度可能掩蓋風險;基礎設施投資推高槓桿的可能性值得警惕。因此,聯準會將持續監測AI發展,確保其在一個穩定、有韌性的金融環境中展開,最終服務於最大化就業與價格穩定的根本目標。對市場而言,傑斐遜的分析提供了理性評估AI投資的工具箱。在技術革命與資本熱情的浪潮中,保持清醒、區分本質與表象、聚焦長期價值,或許是避免泡沫、擁抱變革的最佳姿態。AI是否為泡沫?答案不在簡單的是與否,而在持續、多維、動態的觀察與判斷之中。 (數字新財報)
GPT-5.2絕地反擊,能否撼動Gemini 3的地位?
AI領域的角逐從未停歇,OpenAI的GPT-5.2在“紅色警報”下強勢登場,直接叫板Google的Gemini 3。這場技術巨頭間的較量,不僅關乎模型性能,更預示著未來AI生態的格局與紅利走向。👉 GPT-5.2的技術深度與突破點:重塑專業知識工作流OpenAI此次推出的GPT-5.2並非簡單升級,而是圍繞推理、記憶、工具使用和長上下文理解進行了全面強化,旨在解決企業級工作流中的痛點。它細分為Instant、Thinking和Pro三個版本,滿足不同場景需求。•核心推理能力質變: GPT-5.2 Thinking版本在GDPval知識工作評估中,對44種職業的專業任務表現達到或超越人類專家水平,勝率高達70.9%。 這意味著它能更高效地完成電子表格製作、簡報建構、程式碼編寫等複雜任務,且速度比人類專家快11倍,成本不到1%。 在ARC-AGI-2抽象推理基準測試中,Thinking版本達到52.9%,Pro版本更是高達54.2%,遠超Gemini 3 Deep Think的45.1%,展現了在解決新穎、抽象問題上的卓越能力。•長上下文理解的“記憶”革命: GPT-5.2在處理長文件方面表現出色,尤其在MRCR v2基準測試中,對256k tokens的長上下文幾乎達到100%的精準率。 這對於分析報告、合同、研究論文等超長文字至關重要,極大地提升了處理複雜、多檔案項目的能力,避免了上下文丟失的痛點。•程式碼與科學領域的降維打擊: 在軟體工程領域,GPT-5.2在SWE-Bench Verified測試中取得80%的高分,並在更嚴苛的SWE-Bench Pro中達到55.6%,顯著提升了程式碼生成、偵錯和大規模程式碼庫重構的可靠性。 在數學領域,GPT-5.2在AIME 2025(無工具)中實現100%的完美得分,並在FrontierMath專家級數學問題上達到40.3%的解決率,展現了突破性的數學推理能力。•多模態與工具呼叫: GPT-5.2 Thinking是目前最強的視覺模型,圖表推理和軟體介面理解的錯誤率降低了約一半。它在Tau2-bench Telecom工具呼叫基準測試中達到98.7%的精準率,進一步提升了多輪、多工具工作流的可靠性。💡 Gemini 3的生態護城河與多模態優勢Google的Gemini 3憑藉其原生多模態能力和深度生態整合,建構了強大的護城河。•原生多模態的“大腦”: Gemini 3從底層設計上就支援文字、圖像、視訊、音訊甚至程式碼的無縫融合理解。 尤其在視訊-MMMU基準測試中達到87.6%,展現了其在處理複雜多模態資訊上的領先優勢。•超長上下文與“深度思考”: Gemini 3擁有高達100萬tokens的巨大上下文窗口,這使其在處理超長對話、研究論文或大型程式碼庫時,能保持更強的連貫性和理解力。其Deep Think模式更是將推理邊界推向極致,用於解決最複雜的難題。•生態整合與Agentic能力: Gemini 3深度整合於Google的各項產品中,如Gemini App、Google Search的AI模式、Workspace應用(Docs, Sheets等)以及Google AI Studio和Vertex AI等開發者工具。 它的Agentic能力讓AI不再只是“知道”,而是能“行動”,通過定義目標,Gemini 3能自主決定並呼叫工具完成多步驟工作流,例如自動預訂服務或整理收件箱。 尤其值得關注的是其Generative UI功能,能直接通過自然語言生成互動式應用程式,從概唸到應用的轉化效率實現指數級提升。✅ 終極對決與未來趨勢:認知突圍的關鍵GPT-5.2的發佈,是OpenAI在面對Gemini 3的強大攻勢下,一次“程式碼紅色”的絕地反擊。 儘管Gemini 3在多模態和生態整合方面保持領先,尤其在LMArena的文字、視覺、圖像編輯和搜尋等多個多模態榜單上佔據首位,但GPT-5.2在專業知識工作、編碼、數學和抽象推理等核心能力上實現了顯著的認知突圍。價格方面,GPT-5.2的API定價 ($1.75/百萬輸入token, $14/百萬輸出token) 相較GPT-5有所上漲,但其90%的快取輸入折扣和Batch API的50%折扣,旨在提高複雜任務的成本效益。 而Gemini 3 Pro的API定價 ($2.00/$12.00/百萬token,超過200K上下文則更高) 則更強調按使用量付費,並有免費試用層級。 最終選擇,取決於具體應用場景對模型深度、生態整合度及成本效率的權衡。這場AI巨頭間的激烈競爭,正加速推動通用人工智慧的演進。無論是GPT-5.2的“思維引擎”,還是Gemini 3的“行動代理”,都在為我們描繪一個AI深度賦能的未來。真正的贏家,將是那些能有效利用這些底層技術,建構自身資料和應用護城河的企業,抓住這波前所未有的AI紅利。 (澤問科技)
Reid Hoffman 談 AI:真正的機會,正在離開矽谷最熟悉的地方
Reid Hoffman是 LinkedIn 的聯合創始人,也是矽谷最早一代以“平台”和“網路效應”著稱的投資人之一。過去二十多年,他幾乎參與了每一輪網際網路結構性轉折,從社交網路到平台化擴張,再到企業級軟體的規模化落地。在生成式 AI 被資本和創業者高度追捧的當下,這位長期站在“增長與規模”一側的矽谷代表人物,卻在最近一場長時間訪談中,把注意力放在了一個不太符合矽谷直覺的判斷上:AI 時代最重要的機會,可能並不在那些增長最快、也最容易被看見的地方。顯眼的賽道,正在變得擁擠Hoffman 並沒有否認聊天機器人、生產力工具或程式設計助手的商業價值。在他的判斷中,這些方向仍然可以賺錢。但問題在於,它們過於顯眼。當一個機會對所有人都是顯而易見的,資本、人才和算力就會沿著最低摩擦路徑迅速集中,結果往往不是長期優勢,而是更快的同質化競爭、更激烈的分發爭奪,以及更短的窗口期。這並非技術失效,而是競爭結構本身在壓縮回報。在 AI 語境下,“人人看得見”正在從優勢轉化為約束。入口在變,約束並沒有消失訪談中,Hoffman 多次回到一個被反覆忽略的判斷維度:那些東西會變,那些東西不會變。平台入口可以改變,產品形態可以重寫,敘事方式也可以不斷翻新,但一些底層約束始終存在,包括網路效應的累積方式、企業系統的整合成本、信任的遷移路徑,以及分發背後的組織慣性。AI 並不會消除這些約束,只會讓它們以更快、更集中的方式重新顯現。所謂“新世界”,最終仍然要回到這些舊問題上,只是整合失敗的代價更高,贏家通吃的程度也更明顯。矽谷的盲點,不在技術而在節奏Hoffman 將自己最重要的判斷,放在他所說的“矽谷盲點”上。這些盲點並非源於能力不足,而是源於耐心不足。矽谷長期擅長低摩擦、可快速迭代的數字系統,卻對發展節奏慢、驗證成本剛性、又受到監管與倫理約束的系統缺乏投入意願。生物與醫療是最典型的例子。藥物發現和醫療研發看起來像資訊問題,但真正的節拍器並不在程式碼倉庫裡,而在實驗室、倫理審查、臨床試驗和審批流程中。AI 可以提升篩選和預測的效率,卻無法取消實驗本身。失敗率是結構性的,周期也無法被壓縮到軟體速度。原子世界的瓶頸,是經濟而不是演算法在機器人和自動化領域,Hoffman 指出了另一種常被忽視的現實約束。看似簡單的物理動作——抓取、整理、疊放——在現實環境中充滿不確定性。材料的柔性、觸覺反饋、環境變化以及長期維護成本,使得技術可行性並不等同於經濟成立。由此出現一個反直覺現象:白領世界中更複雜的工作,反而更早被 AI 改造;而物理世界中看起來更簡單的動作,卻因為資本支出與營運支出的不匹配,遲遲難以規模化。決定成敗的,並不是演算法是否足夠聰明,而是成本曲線是否真正交匯。醫生不會消失,但角色正在被重寫關於“AI 是否取代醫生”的討論,Hoffman 給出的判斷並不激進,卻相當明確。如果醫生的價值只是知識儲存,那麼這個角色已經開始被削弱。AI 在知識覆蓋、檢索和交叉驗證方面的能力,已經超過任何單一人類個體。但醫生並不會消失。未來的核心價值,將更多體現在非共識問題的判斷、情境理解以及責任承擔上。AI 改變的不是職業是否存在,而是職業內部的分工結構。回報正在向高摩擦系統轉移把這些判斷連在一起,Hoffman 勾勒出的並不是一個關於 AI 的樂觀敘事,而是一張重新定價風險與回報的地圖。隨著顯眼賽道的競爭加速,資本和能力正在被迫進入那些節奏更慢、驗證成本更高、也更難被快速複製的系統——包括醫療、生物、勞動力、自動化、政府治理以及教育等領域。在這些地方,技術本身不再是決定性變數,時間、監管和組織慣性開始重新進入定價體系。生成式 AI 並沒有讓世界變得更簡單,它只是重新分配了複雜性。而真正的長期機會,正在這些複雜性尚未被消化的地方,緩慢浮現。 (方到)
當 AI 遇上區塊鏈:GPU 從挖礦工具到通用算力資源
在以太坊轉向 PoS 之後,顯示卡挖礦迅速退出主流舞台。大量 GPU 裝置不再用於區塊鏈共識計算,這一變化一度被視為“顯示卡時代的終結”。但事實恰恰相反。這些 GPU 並未消失,而是進入了另一個增長更快的技術領域——人工智慧計算。本文將解釋一個關鍵問題:為什麼 GPU 會在區塊鏈挖礦結束後,重新成為 AI 時代的重要基礎資源?一|以太坊合併之後,GPU 並沒有“失業”在 PoW 時代,以太坊大量依賴 GPU 執行雜湊計算。當共識機制切換至 PoS 後,這一需求迅速消失。從表面看,GPU 的區塊鏈用途被削弱;但從計算結構上看,GPU 的核心優勢並未改變:高平行計算能力對矩陣運算與向量計算高度友好適合處理非結構化、高複雜度任務這些特性,恰恰是現代 AI 模型所依賴的計算基礎。二|AI 模型對算力的需求正在迅速擴張大模型訓練與推理帶來的算力需求,已遠超傳統網際網路應用。當前 AI 行業面臨的核心問題並非演算法,而是計算資源的獲取:高端 GPU 供給有限中心化雲服務成本持續上升資源集中於少數大型雲廠商這使得算力逐漸成為一種稀缺的基礎設施資源,而不僅是技術元件。三|Web3 的角色:協調分佈式算力資源在這一背景下,Web3 的價值不在於“挖礦”,而在於其擅長解決的問題類型:如何在沒有中心調度者的情況下,協調分散、異構、地理分佈的計算資源。區塊鏈在此扮演的角色包括:任務分配與結算資源使用的可驗證性激勵與懲罰機制跨主體的信任協調這使得分佈式 GPU 資源可以被組織為可用的計算網路。四|GPU 與 ASIC 的功能分化正在加速在當前技術結構下,GPU 與 ASIC 的分工更加明確:ASIC:專用於特定演算法(如 SHA-256),適合長期、穩定、安全優先的系統(如比特幣)。GPU:通用平行計算裝置,適合 AI 推理、訓練、圖形渲染等高複雜度任務。這並不是“誰取代誰”的關係,而是計算資源專業化的結果。五|算力正在成為新的基礎設施層無論是在區塊鏈安全、AI 模型推理,還是分散式運算領域,算力都正在從“技術細節”轉變為“基礎設施”。在這一過程中:區塊鏈提供協調與結算機制AI 提供持續增長的算力需求GPU 成為連接兩者的關鍵硬體節點這並不意味著所有算力都會被代幣化,而是意味著算力本身正在被系統性組織與定價。結語GPU 從以太坊挖礦中退出,並不代表其價值消失。相反,它進入了一個需求更廣泛、用途更明確的計算時代。在 Web3 與 AI 的交匯點,真正發生變化的不是“挖礦方式”,而是算力在整個數字系統中的角色定位。 (方到)
蘋果年度 App 出爐!女兒想學單詞,他直接做了個 AI 神器 | 對話 CapWords
2025 年接近尾聲,蘋果2025 年 App Store Awards 獲獎名單也揭曉了,年度 App 給了《CapWords》這個國產寶藏應用。CapWords 是一款語言學習工具,在今年的蘋果設計獎中它就是獲獎名單上第一個國產應用。它憑什麼呢?你隨手拍張照,AI 就能幫你把身邊的東西變成單詞卡。比如拍個咖啡杯 ,它直接告訴你英文、法文怎麼說,還能生成設計感線上的貼紙。不知道大家有沒有同感,很多時候在 app 上背的單詞總感覺離生活太遠,和自己關係不大,彷彿學的是一個個抽象的英文字母組合而不是一個單詞。而 CapWords 反客為主,讓使用者主動去學習生活中物品的單詞,還能有助於聯想記憶,整個玩法也很有樂趣,頗有《寶可夢》中小智收集寶可夢圖鑑的感覺。APPSO 之前對 CapWords 做過體驗,大家可以感受一下👇除了名詞,現在動詞形容詞都能認,甚至 Live 圖和視訊也能識別。還能列印成實體卡片,儀式感拉滿。APPSO 也專訪了 Capwords 開發者,聊聊語言的門檻被 AI 「踏破」之後,我們和語言之間,究竟還剩下些什麼。這不只關於技術和產品,Capwords 創始人 Ace 最開始是為了幫女兒 Dorothy 學習才做的這個 App,他從生活場景中尋找記憶錨點,這大概就是技術的浪漫。對話 Capwords 開發者:詞彙是和生活「摩擦」這款接連斬獲蘋果設計大獎和 App Store Awards 的產品叫做「英語學習工具」,顯然太過侷限。Capwords 更像是一件關於語言、記憶和生活場景的裝置:拍照即識別,貼紙設計,搭配活潑輕盈的視覺風格,讓人忍不住多看幾眼,也順手就多認識幾個單詞。在 Capwords 近乎直覺般的設計背後,是一個簡單卻深刻的理念:語言的學習回歸生活,它可以從一次指認、一次散步、一次「這個怎麼說」的好奇心開始。APPSO:最早是因為小朋友有一個很簡單的需求,指著東西問「這個用英語怎麼說」,這就是整個靈感的來源和項目開端是吧?DTD:對,我女兒大概三歲左右,不到三歲。我經常在夏天帶她出去玩,我們會去公園,或者一些寫字樓前的廣場上。在玩的過程中,她會問我一些問題,比如「這個植物叫什麼?」「這個路牌怎麼念?」我就會一邊陪她玩,一邊跟她解釋,有時也會用一些識別類的產品幫她查。可能是因為在她好奇心爆發那個階段,這樣的場景其實非常多。印象比較深的一次,是在一個寫字樓的地磚縫裡,長出了一種叫「狗芽根」的植物。她很偶然地指著說:「爸爸,那有個狗芽根!」類似的場景讓我特別觸動。再結合她之前也會問我一些「這個用英文怎麼說」的問題,我就在想:這種「場景 + 圖像 + 資訊「的結合」,可能會讓她的記憶更好。我自己本身也是一個設計師出身,所以對於圖像或者資訊的這種感受會更敏感一點。圖片來自:小紅書@DTD.STUDIOS所以跟女兒互動的這些場景,很多都會給我這樣的感受:語言本身應該是在生活裡的,我們能用什麼辦法能幫助到這件事。大概就是這樣一個過程。APPSO:你們當時有意識到類似的需求,並不只是出現在孩子身上,其實更廣泛的使用者群都有這種需求嗎?DTD:沒有,因為我自己英語就不好,我不太擅長去背,或者把一個個知識點硬塞到腦子裡。我也不是學教育的,所以對於語言學習,我的理解是語言發生在生活裡。如果有一個環境,比如聊天時看到了、聊到了,看到一個東西和圖像時,會有關聯記憶。我會自己總結一些原則,比如為什麼某個圖像會吸引我,或者一個彩色的樓,或者我們城市裡看到的有特點的建築物,引起我注意的可能就是我腦海中圖形的關聯性,這一點非常重要。這也許是我作為設計師的個人總結,不一定完全科學。圖片來自:小紅書@DTD.STUDIOSAPPSO:市面上大部分的查詞軟體都比較臃腫,但 Capwords 把路徑做得非常簡單,一拍就可以完成。但你們擔心過對學習效果的影響嗎?DTD:這個 CLU 要不你來講講。CLU:其實我們在產品立項的時候,出發點並不是語言學習。回到剛剛說的,我們就是為了給我的乾女兒解答問題——這是一切的種子。慢慢我們會意識到,圖像會跟我們的生活形成一種「摩擦」。也就是說,通過與現實世界中的物品產生摩擦,可以強化記憶點。這些記憶點結合當時所處的場景以及全新的單詞或事物進入大腦時,我們對這些資訊的記憶會更加深刻。我們在日常生活中觀察到,人從小時候起就有天然的好奇心,會自然地記住所有新鮮的東西。比如去到日本,儘管我們可能不會說一句日語,但會說「謝謝」這種簡單的話和一些詞。或者描述可愛的事物時,會用到「卡哇伊」這樣的詞,因為這些東西對我們而言有新鮮感。所以,我們在立項開始就沒有定位為一個單純學習英文或者單詞的產品。並且根據我們的觀察、使用者反饋,還有實際落地的情況來看,我們在做的一件事情就是把接觸一個新的語言的這個門檻降低,讓大家會更感興趣。對一個語言的這種感興趣程度提高了,然後慢慢的,大家自己會再去找到一個更加系統化學習的方式。APPSO:目前接到過那些印象特別深刻的使用者反饋嗎?@61:這個我可以來說一下。我之前的一個 mentor 有個上小學的女兒。測試階段我給了他一個兌換碼,他就帶著女兒用 iPad 玩 Capwords,把家裡所有東西都掃了一遍,甚至還掃了他爸的光頭(笑)。第二天,他爸來跟我反饋,說女兒居然把昨天掃到的所有單詞,都寫在了自己的日記本上,還自己開始複習了。接下來幾天,女兒每天放學回家的第一件事,不是玩蛋仔派對,而是拿著 iPad 在家裡到處找「還有什麼沒掃過的」。DTD:有一些使用者的反饋我確實印象很深,我看過一個使用者說這是他用過最不像 AI 的 AI 產品,還有一個說這是他今年用過最溫暖的 AI 產品。這也就是我們想達到的效果。APPSO:確實,模型完全融入到了使用過程中,AI 的存在感並不強。你們在研發的時候碰到過什麼挑戰嗎?CLU:其實我覺得 AI 還是有一些邊界和條件,但是 AI 本身的這種判斷力和我們人本身的一些常識,其實是差不多的。比如我們之前測試過,一杯棕色的液體,AI 會識別成為咖啡,但是如果我親手做的這杯飲料,我就知道它其實是涼茶,那識別結果就跟我的認知不符。但這並不是 AI 的問題,只是誤認確實會出現。所以我們在設計的時候加了調整項,如果系統識別出來的結果和認知不符合,使用者可以輸入調整成正確的物品。DTD:關於識別速度上的問題,其實大模型都需要時間。把圖像傳過去,再回傳資料回來,整個過程其實是有五六秒時間的。去年我們第一個版本發出來,我們一起玩的時候感覺沒什麼問題,大家都覺得非常神奇。尤其是我老婆和女兒都覺得太厲害了。但是我自己在用的時候,還是覺得那個 6 秒鐘很煎熬。後來我們最佳化了一些提示詞,調整了圖片的大小,通過各種互動上的設計來減少使用者的感知,把這個時間藏在不同的互動形式後面。所以我的理解是從體驗層面,去解決一些目前模型本身解決不了的問題。CLU:還有一個是你會看到當一個物品的識別完成之後,會有一個被撕下來的貼紙的效果,我們當時就想說做成一個把現實世界裡的物品,從貼紙上摳下來的效果。在摳的過程中,其實已經在做完整的載入了,只是使用者沒有意識到,最後就可以有一個很絲滑的體驗。圖片來自:小紅書@DTD.STUDIOS我相信到最後,AI 肯定是融入或者變成一個基建,不存在說要體現具體的技術實現,使用者只需要關注 AI 帶來的效果就好了,而且這個結果是使用者所期待的,甚至超出期待的。 (APPSO)
信用卡 正從年輕人錢包裡消失
我上周末收拾錢包,發現一張信用卡神秘失蹤。不是丟了,而是我主動註銷了它——這已經是我近兩年註銷的第三張信用卡。仔細一想,我和信用卡的“感情破裂”早有徵兆。上次用它還是半年前買機票,而日常消費,它早已被支付寶、微信支付和各類網際網路信用產品擠到了錢包最底層。像我這樣的人不在少數。央行資料顯示,2025年二季度末,全國信用卡和借貸合一卡總量為7.15億張,較上季度減少600萬張,已連續11個季度下滑。比起2022年的峰值,這個數字更是銳減了約9200萬張。1 、規模萎縮,信用卡從“香餑餑”變“休眠卡”曾經,信用卡是銀行零售業務的王牌,如今卻成了許多人錢包裡的“休眠卡”。北京市民馬女士的經歷頗具代表性:她持有的信用卡從5年前的5張縮減到1張。“大部分都不常用,覺得沒必要保留了。”這種心態在持卡人中蔓延,導致全國信用卡數量持續下降。睡眠卡問題尤為突出。中國銀行業協會資料顯示,截至2023年末,信用卡活卡量為6.4億張。與央行統計的7.15億張在用卡量相比,意味著市場上有約8000萬張睡眠卡有待清理。銀行業績也反映出這一趨勢。2025年三季度報告顯示,多家銀行信用卡貸款餘額下降:招商銀行信用卡貸款餘額約9276億元,較去年末減少約200億元;中信銀行下降4.87%;平安銀行下降7.9%。2管道整合,銀行被迫“斷臂求生”面對市場萎縮,銀行不得不採取“瘦身”策略。中國銀行於2024年率先關停“繽紛生活”App,將功能遷移至綜合型手機銀行,成為國有大行中首個完成獨立信用卡APP撤並的機構。這一動作引發連鎖反應:北京農商銀行、“渤海銀行信用卡”等中小銀行相繼關閉同類產品。物理網點也在收縮。2024年全年超過40家信用卡分中心被裁撤,交通銀行單月關停10余家分支機構。截至2025年6月,交通銀行已累計關閉了29家信用卡分中心。銀行整合管道的核心邏輯在於降低維運成本、提升使用者體驗並強化資料協同能力。通過統一入口管理信用卡與儲蓄帳戶的互動場景,金融機構可更精準地識別客戶消費行為,並動態調整授信策略。3 、多方夾擊,信用卡遭遇“中年危機”信用卡的頹勢,是多方因素共同作用的結果。2022年,原銀保監會和央行聯合發佈《關於進一步促進信用卡業務規範健康發展的通知》,要求銀行不得以發卡量、客戶數量等作為單一或主要考核指標,長期睡眠信用卡佔比不得超過20%。這一政策於2024年7月全面落地,成為行業轉向的“發令槍”。網際網路支付的崛起更是對信用卡形成降維打擊。博通諮詢金融行業首席分析師王蓬博指出,支付寶、微信支付這些平台,依託強大的支付生態,逐步嵌入花唄、微粒貸等信用產品,實現了“支付+金融”的有效閉環。22歲的李博文代表了年輕一代的態度:“對於小額高頻的支付需求,網際網路金融產品已經夠用了。”在他看來,信用卡的帳單日、還款日、最低還款、循環利息、年費政策就像一套需要背誦的使用說明,感覺有點麻煩。4風險攀升,逾期創五年新高隨著經濟環境變化,信用卡資產質量也面臨考驗。截至2024年末,信用卡逾期半年未償信貸總額達1239.64億元,較上年增長約8%;不良率升至1.43%,創近五年新高。區域性銀行受衝擊尤為明顯。2025年以來,銀行業加速處置信用卡不良資產包,頻繁出現數億元規模的轉讓項目,這也進一步折射出資產質量承壓的嚴峻現實。金融機構正通過強化巨量資料風控模型、動態調整授信額度及最佳化催收機制控制風險敞口。例如,某股份制銀行將AI演算法應用於即時交易監測,使可疑交易識別精準率提升40%以上。5轉向高端,銀行打響“客群爭奪戰”面對困局,銀行紛紛轉換打法,從“規模導向”轉向“價值深耕”。素喜智研高級研究員蘇筱芮表示,信用卡發力高淨值客戶,主推高端類卡片,本質上是從狠抓“發卡獲客”到“精耕存量”的經營策略轉變。多家銀行積極強化信用卡與財富管理的聯動,打出“信用卡+私銀+財富管理”的組合拳。中信銀行早在2023年就推出了“少年行”主題信用卡,面向私人銀行客戶,聚焦留學生家庭從出國到歸國的全旅程金融需求。廣發銀行在2025年推出了“臻稀鑽石卡”,將年費、權益與客戶財富管理規模深度繫結,其權益包含道路救援、酒後代駕、陪診掛號等服務。該卡年費為12000元,若客戶資產達600萬元且消費滿30萬元,可享年費全免。為提升高端卡的吸引力,銀行還著力為信用卡附著社交屬性。金融機構頻繁冠名熱門演唱會,為私行客戶預留演唱會的“最佳觀賞位”,強化卡屬“情緒價值”。6從支付工具到綜合金融平台未來,信用卡行業將呈現三大趨勢:管道整合加速、風險防控升級、場景生態重構。信用卡研究人士董崢認為,造成目前這種情況的原因是多方面的。除了前期粗放擴張的遺留問題外,產品創新嚴重滯後也是關鍵因素。當前信用卡產品同質化程度高,如同“在iPhone時代售賣老年機”般缺乏吸引力,難以滿足使用者差異化需求。中央財經大學副教授劉春生建議,銀行需推出面向年輕客群的定製化產品並最佳化服務,監管層也應規範市場並鼓勵創新,以推動信用卡業務健康發展。王蓬博認為,展望未來,信用卡不應僅是支付工具,更應成為集信用管理、財務規劃、消費權益於一體的綜合金融服務載體。曾經,信用卡是身份象徵;如今,它成了許多年輕人眼中的“累贅”。當我註銷最後一張信用卡時,沒有一絲留戀,反而有種解脫感。商業銀行的信用卡業務正面臨嚴峻挑戰。一方面,要應對睡眠卡激增和不良率攀升的現實;另一方面,要在網際網路金融產品的夾擊下尋找差異化競爭優勢。從“求量”到“逐質”,信用卡行業正在經歷一場深刻變革。未來,只有真正理解客戶需求,並能提供定製化解決方案的銀行,才能在這場轉型中贏得先機。 (消費NOTE)