#史丹佛大學 | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#史丹佛大學

這個AI能救命：史丹佛發佈最新AI研究，破解肝臟移植核心難題！

每年數千例肝臟移植因捐贈者死亡時間預測不準而失敗。今天，AI給出了準確解決方案。在肝臟移植領域，器官短缺始終是制約救治效率的核心難題。而「循環死亡後器官捐贈（DCD）」，是補充器官來源的重要途徑。DCD指捐贈者在心跳、呼吸停止（循環死亡）後進行器官捐贈的模式。然而，這個補充器官來源的重要途徑卻長期受困於「無效取得」問題：醫療機構為潛在捐獻者投入大量人力、裝置與運輸成本，卻因捐獻者未在器官耐受缺血的時間窗內死亡，最終無法獲得可用肝臟。這種資源浪費不僅加重醫療系統負擔，更延誤了終末期肝病患者的治療時機。近期，史丹佛大學聯合美國6個移植中心研發的LightGBM機器學習模型，為破解這個困局提供了新方案。該模型透過精確預測DCD捐贈者的死亡進展，顯著降低了無效獲取率，為肝臟移植領域的資源最佳化與病患救治帶來突破性價值。無效獲取的沉重代價要理解這項突破的價值，需要先理解DCD肝臟移植的特殊性。在循環死亡後器官捐獻過程中，捐獻者停止生命支援後，肝臟因供血中斷開始受損。通常超過30-60分鐘，肝臟就會喪失移植價值。這個時間窗口的嚴格限制，導致了醫療資源的巨大浪費。單次無效取得的經濟損失可達數十萬元，包括移植團隊調配、器官保存裝置偵錯、跨區域運輸等成本。更嚴重的是，這些資源的無效佔用，直接影響其他末期肝病患者的治療機會。更嚴峻的是，傳統決策方式難以規避這一風險：先前臨床主要依賴兩類方法。一是2012年開發的DCD-N評分等老舊工具，其資料樣本量小且未更新，難以適配當前臨床場景；二是外科醫生的經驗判斷，這種方式往往受個體經驗、認知偏差影響。LightGBM模型的精確預測史丹佛團隊開發的LightGBM模型，透過多維度指標整合，實現了死亡時機的精確預測。模型涵蓋了神經功能指標如瞳孔反射、角膜反射，循環與呼吸指標包括收縮壓、心率、血氧濃度，以及基礎臨床資訊如年齡、BMI和死亡機制。【不同時間點與資料集下模型效能對比熱力圖】在演算法選型上，模型選用「輕量級梯度提升機（LightGBM）」演算法，其優勢高度契合臨床資料特性：抗缺失性：臨床資料常有部分指標缺失（如緊急情況未檢測某一生化指標），LightGBM可原生處理缺失值，無需人工填充，避免資料失真影響預測；高擬合度：能有效捕捉變數間的非線性關係（如「低瞳孔反射+ 低血壓」的組合對死亡時機的影響），比傳統線性模型（如舊評分表）更適合複雜臨床場景；高效性：在處理高維度資料時運算速度快，可滿足臨床即時決策需求。為避免模型“紙上談兵”，團隊採用三階段流程，基於美國6家中心的2221例DCD捐獻資料開展嚴格測試：訓練階段：利用2022年12月-2023年6月的1616例回顧性資料，讓模型學習「指標組合與死亡時機」的關聯規律；回顧性驗證：以2023年7月-8月的398例資料“復盤”，驗證模型對歷史案例的預測準確性；前瞻性驗證：在2024年3月-9月的207例即時臨床案例中測試，模擬實際應用場景下的決策效果。【回顧性驗證佇列與前瞻性驗證佇列中的模型效能及基於閾值的權衡關係】三階段驗證均顯示模型性能穩定，為臨床落地奠定基礎。臨床效果與傳統方法相比，LightGBM模型展現出明顯優勢。在預測30分鐘內死亡的精確度方面，模型的AUC值達到0.83，顯著高於DCD-N評分的0.799和科羅拉多州計算器的0.694。在醫師意見分歧較大的複雜案例中，模型精準率達到70%，而醫師判斷的精確率僅為52%。這一資料表明，AI能夠有效輔助解決臨床決策中的爭議情況。同時，該模型具有高靈活性。它能輸出0-100分的連續預測指數，醫療機構可以根據自身需求調整閾值。例如，希望進一步降低無效獲取率的機構可以提高閾值，而希望減少錯過可用器官機率的機構可以降低閾值。深遠意義：肝臟移植生態的最佳化這項技術的價值不僅體現在資料提升上，更在於其對整個肝臟移植生態的最佳化。透過減少無效獲取，醫療機構能夠大幅降低資源浪費，將更多資源投入高機率成功的捐獻案例。對於終末期肝病患者而言，這項進步意味著更多生的希望。與此同時，研究團隊也開發了配套的臨床資料擷取聊天機器人。醫生只要貼上病歷網頁文字，機器人就能自動擷取關鍵指標並轉化為結構化資料，大幅降低了人工錄入成本。透過這項技術，我們可以看到AI在醫療資源最佳化方面的巨大潛力。它不是要取代醫生，而是作為決策輔助工具，整合多維度資料，規避主觀偏差，為醫生提供更客觀的參考。隨著大語言模型技術的發展，未來可望實現即時資料收集、動態預測、決策建議的全流程自動化，進一步提升臨床效率。AI技術賦能醫療，正從理念走向現實，而每一次這樣的進步，都在為生命爭取更多可能。（算家雲）

《馬偕醫大攜手史丹佛示警　台灣酒精不耐症全球最高》喝酒會臉紅恐是酒精不耐症，別輕忽其致癌風險。馬偕醫大醫學系、聽力暨語言治療學系與國際處國際健康與文化交流中心，攜手美國史丹佛大學醫學院亞洲人健康研究及教育中心（CARE）與台灣酒精不耐症衛教協會，共同舉辦衛教活動。專家指出，台灣的酒精不耐症高達近50%，居全球之冠。酒精早在2007年已被世界衛生組織（WHO）列為第一級致癌物，經常飲酒將大幅增加罹患消化道癌風險，飲酒後若出現臉紅、頭痛、嘔吐及宿醉等症狀，即可能為酒精不耐症的警訊，呼籲民眾盡可能避免飲酒。由馬偕醫大國際處與醫學系主辦的「精準醫療健康促進實踐」系列活動，於11月10日至13日展開一連四天的「無酒週」健康宣導與體驗活動。活動內容包括聽損基因檢測、酒精不耐症篩檢與衛教、口腔檢查，以及特別企劃的午餐衛教講座與無酒精調飲體驗，吸引眾多師生響應熱烈。美國史丹佛大學醫學院亞洲人健康研究及教育中心國際主任陳哲宏博士表示，亞洲人的酒精不耐症比例遠高於歐美白種人，包括台灣、日本、韓國、中國與越南等國，盛行率高達30%至50%，其中台灣約有近半數民眾具有酒精不耐症，居全球之冠。這是由於先天缺乏能代謝酒精的「乙醛去氫酶」（ALDH2酵素），導致乙醛無法正常分解。乙醛是世界衛生組織（WHO）列為第一級致癌物，長期飲酒者罹患口腔癌、咽喉癌、食道癌、胃癌、肝癌、大腸直腸癌及女性乳癌的風險顯著增加。陳哲宏強調：「酒精不耐症是遺傳現象，目前無藥可治，唯有避免飲酒才能降低健康風險。」根據研究，飲酒者罹患消化道癌的機率比不喝酒者高5倍，而若為酒精不耐症患者且仍經常飲酒，風險更高達50倍；若又合併吸菸及嚼檳榔，罹癌風險甚至可達400倍。他建議，酒精不耐症為遺傳現象，民眾可到醫院進行基因檢測了解自己是否患有此症，以及早預防，並呼籲政府應加強推動相關衛教政策，將基因檢測納入癌症篩檢流程中，讓民眾及早了解自身風險並調整生活習慣。根據國民健康署資料，酒精使用每年導致台灣至少4,500人死亡，並造成巨大的醫療與社會成本。馬偕醫大醫學系與聽力暨語言治療學系，由國際處邱美妙組長領軍，長期在恆春及台東地區推動社區營隊服務，進行酒精不耐症與聽損基因的篩檢研究。未來，學校將持續與國內外醫學機構合作，深化精準醫療與健康促進實踐，期望帶動全台青年一同關心「酒精不耐症」與「飲酒健康風險」，共同打造更健康的社會。

保護好身體這2處，死亡風險直降56%！

人人都想健康長壽，但決定你長壽健康的“核心密碼”，可能就藏在身體的兩個關鍵部位！近日，美國史丹佛大學的一項研究發現：大腦和免疫系統保持“年輕態”，能將死亡風險大幅降低56%！01身體這“兩處”年輕的人長壽的機率更大今年7月，美國史丹佛大學研究人員在《自然醫學》期刊上發表了一項覆蓋4.5萬人的大型研究。科學家們通過分析血液中的蛋白質資料，估算了身體11個重要部位（包括大腦、心臟、肝臟、免疫系統等）的“生物年齡”。最終發現——大腦和免疫系統保持“年輕態”，或許才是抗衰長壽的關鍵！研究顯示，身體部位“衰老”的數量越多，死亡風險越高——擁有2個～4個部位加速衰老的人，死亡風險會增加2.3倍；擁有8個以上部位加速衰老的人，死亡風險飆升8.3倍，其中60%的人在15年內離世。研究發現：單純擁有多個“年輕”身體部位，死亡率與常人差異不大。在11個不同的身體部位中，只有大腦和免疫系統的“年輕態”被證實是顯著延長壽命的關鍵：大腦“年輕”：死亡風險下降40%。免疫系統“年輕”：死亡風險下降42%。同時擁有“年輕大腦”+“年輕免疫系統”的人，死亡風險直降56%。02保護大腦“年輕態”記住這4招■ 常吃健腦食物在日常生活中，可以通過保持食物的多樣性、合理搭配食材的種類，為大腦提供更多的高品質“營養燃料”。具體來看——高纖維、低脂肪飲食有利於延緩大腦衰老。藍莓、草莓、菠菜、洋蔥等都是不錯的選擇。豆類和堅果因富含不飽和脂肪酸和磷脂，可促進腦細胞代謝，有利於延緩大腦老化。還有富含膽固醇、膽鹼類物質的食物，如雞蛋、肉類，也都是大腦運行的必需品。■ 大腦常用起來經常使用大腦可使腦血管保持擴張狀態，確保腦組織獲得充足的血液和營養供給，這也是延緩大腦衰老的重要物質基礎。■ 重視社交活動社交可避免和緩解焦慮和抑鬱，親朋好友的歡聲笑語可以解除煩惱，保持情緒愉悅。■ 積極控制慢性疾病常見慢性疾病，如高血壓、高血脂、糖尿病、超重等與痴呆症的發病風險密切相關。因此，妥善治療、積極控制現有的疾病對於預防認知能力下降至關重要。03保護免疫系統，做好這5件事■ 堅持運動最有效運動會使體內產生更多的免疫細胞和免疫因子，並增強其活性。■ 優質蛋白要多吃蛋白質是機體免疫防禦功能的物質基礎，日常應該適當多吃些富含蛋白質的食物，如瘦肉、奶類、魚蝦類和豆類食物。■ 控糖減脂不能少甜食會影響到白細胞的產生與活動，降低身體抵抗疾病的能力。攝取太多不良脂肪，會妨礙免疫細胞的能力。■ 樂觀心態能助力良好的情緒能使大腦分泌出一些有益健康的化學物質，啟動人體免疫功能，抑制病原微生物的生長。■ 好睡眠強化免疫良好的睡眠能夠促進機體免疫細胞生成，抵禦病毒、細菌對機體的侵襲。儘量避免熬夜，尤其是避免晚上過度使用電子產品，確保睡眠質量。現在開始投資你的大腦和免疫力，未來收穫的將是更長久、更健康的人生！ (央視財經)

史丹佛發佈《2025年AI指數報告》：AI正以前所未有的速度重塑世界

史丹佛大學以人為本人工智慧研究院（Stanford HAI）在今年4月發佈了備受矚目的《2025年AI指數報告》（AI Index Report 2025）。這是 Stanford HAI 發佈的第 8 份年度 AI Index 研究報告，長達 456 多頁。作為全球最權威的AI發展年度評估報告之一，它全面追蹤了 2024 年全球人工智慧（AI）行業的發展趨勢，並深入分析了AI在研究、技術、經濟、政策、教育和公眾認知等多個維度的最新進展和趨勢，為政策制定者、行業領袖、研究人員和公眾提供了基於嚴謹資料的洞察。2024年是AI發展史上意義非凡的一年。AI在科學領域的貢獻獲得了諾貝爾物理學獎和化學獎的認可，圖靈獎也頒給了強化學習的奠基性工作。曾被視為遙遠目標的圖靈測試已被當前先進系統超越。AI的採用以前所未有的速度加速，數百萬人在工作和生活中常規使用AI。隨著高性能、低成本、開放模型的湧現，AI的可及性和影響力將進一步擴大。考慮到報告篇幅近500頁，報告的開篇部分已對各章節的核心觀點和亮點進行了提煉。讀者可以通過這部分內容快速概覽報告全貌，或直接定位到自己感興趣的領域進行深入閱讀。本文主要揭示報告部分核心洞察：一、技術性能持續突破，AI能力邊界不斷拓展報告顯示，AI在各項基準測試上的表現持續快速提升。針對先進AI系統極限的新基準測試（如MMMU、GPQA、SWE-bench）在2023年推出後，僅一年時間，AI在這些測試上的得分就大幅提高，例如SWE-bench上的程式設計問題解決率從2023年的4.4%躍升至2024年的71.7%。值得關注的是，開源模型正在迅速追趕閉源模型。2024年初，領先的閉源模型在Chatbot Arena排行榜上領先開源模型8.0%，到2025年2月，這一差距已縮小至1.7%。同時，中美兩國在AI模型性能上的差距也在縮小。2023年底，美國領先模型在多個主要基準測試上顯著優於中國同行，而到2024年底，這些差距已大幅縮小至接近持平。同樣趨勢參考公眾號另一篇文章（摩根士丹利：中國AI，馬上甦醒的巨人！）二、研發格局演變：產業領跑模型，中美競爭加劇在AI研發領域，產業界繼續扮演著主導角色，尤其是在“知名AI模型”的開發上。2024年，近90%的知名AI模型來自產業界，遠高於2023年的60%。相比之下，學術界仍然是高被引研究（前100名）的主要來源。在AI研究出版物總量上，中國繼續領先，2023年佔全球總量的23.2%，其次是歐洲（15.2%）和印度（9.2%）。然而，在最具影響力的研究（高被引論文）方面，美國機構在過去三年中貢獻最多。圖：中國在AI出版內容在數量上全球領先AI專利申請量持續增長，2023年全球AI專利授權量達到122,511件，同比增長29.6%。中國在AI專利總量上遙遙領先，佔全球授權量的69.7%，而韓國和盧森堡則在人均AI專利數量上表現突出。圖：中國AI方面專利數量佔最高（這裡插播下：需要依舊保持理性，數量只是其中一個維度，更重要的是要看到創新力度，能否帶來行業級的變革）在知名AI模型的產出方面，美國在2024年以40個模型繼續領先，中國以15個模型位居第二，歐洲共計3個。儘管美國在數量上保持優勢，但中國模型在性能上正快速追趕。圖：知名模型產出上，美國領先，中國第二，其次是歐洲三、技術成本與效率：推理成本驟降，訓練消耗激增AI模型的使用成本（推理成本）正在變得越來越低廉。報告指出，達到GPT-3.5同等性能水平的AI模型，其推理成本在2022年11月至2024年10月期間下降了280多倍，從每百萬tokens 20美元降至0.07美元。圖：主流模型的每百萬Token成本（看看這個成本墊底的小鯨魚Deepseek，難怪會引發全球資本驚愕）硬體層面，AI硬體性能持續提升（年增長43%），價格性能改善（成本年降30%），能源效率提高（年增40%）。然而，訓練前沿AI模型的計算需求和能源消耗仍在快速增長。知名AI模型的訓練計算量大約每五個月翻一番，訓練大型語言模型的資料集規模每八個月翻一番，訓練所需的電力每年翻一番。這導致訓練成本居高不下。隨之而來的是碳排放的增加。圖：訓練前沿模型所需要的總功耗值得關注的是，AI Agent（人工智慧代理）在今年報告中也開始嶄露頭角，展現出早期潛力。2024年推出的 RE-Bench 基準測試為評估AI Agent執行複雜任務的能力提供了嚴苛的標準。測試結果顯示，在短時任務（例如兩小時預算內）中，頂級的AI系統得分比人類專家高出四倍。然而，隨著時間預算的增加，人類的表現會超越AI，在32小時的預算下，人類得分是AI的兩倍。儘管如此，AI Agent在特定任務上已經能夠媲美人類專家。AI Agent正逐步從理論走向實際應用，尤其在需要快速迭代和執行特定複雜操作的場景中。四、負責任AI與治理：風險事件增加，政府行動加速與AI相關的事件報告數量持續增加，2024年達到233起。企業雖然認識到RAI風險，但在採取實際緩解措施方面存在滯後。相比之下，各國政府表現出更高的緊迫性。各國政府正在加速AI立法和投資。全球範圍內，立法程序中提及AI的次數持續攀升，自2016年以來增長了九倍，僅2024年就比2023年增加了21.3%。2024年，美國聯邦機構出台的AI相關法規數量翻了一番多。加拿大、中國、法國、印度、沙烏地阿拉伯等國都宣佈了數十億甚至千億美元等級的國家AI基礎設施投資計畫。這表明AI已成為各國議程上的重要議題。五、經濟影響與投資：商業採用激增，投資創紀錄全球私人AI投資在2024年創下新高，達到2523億美元，同比增長26%。其中，生成式AI領域勢頭強勁，吸引了339億美元的私人投資，較2023年增長18.7%。AI的商業使用率大幅攀升。2024年，78%的組織報告使用了AI，高於2023年的55%。超過一半的受訪者表示在至少一個業務職能中使用了生成式AI。儘管如此，大多數公司仍處於AI應用的早期階段，報告的財務影響（成本節約或收入增長）處於較低水平。區域層面，北美在組織AI使用方面保持領先，但大中華區和歐洲的增長速度最快，顯示出全球AI實施競爭的加劇。中國在工業機器人安裝量上繼續保持主導地位，協作機器人和互動機器人的安裝也變得更加普遍。圖：報告列舉了2024年期間的重大投資線（有興趣的投資者可以直接定位到221頁查閱）六、勞動力市場：AI發展改變崗位需求AI對勞動力市場的影響是公眾普遍關注的焦點。在美國市場，人工智慧技能彙總，需求最高的是人工智慧，佔0.9%，其次是機器學習，佔0.9%，然後是自然語言處理。圖：人工智慧在所有職位招聘廣告中的佔比圖：2023年與2024年美國AI職位招聘廣告所需AI技能（可以看到一年中人工智慧崗位需求激增）報告深入分析和引用的研究證實，AI能夠顯著提升生產力，並且在大多數情況下有助於縮小勞動力隊伍中的技能差距。更詳細的崗位趨勢還可以參考公眾號另一篇文章（麥肯錫AI報告：組織重塑觸發崗位大洗牌（3年趨勢））七、 AI在具體領域（如醫學、教育領域）的突破AI在科學發現中的作用持續擴大，尤其是在生物學和醫學領域。新的研究表明，AI在診斷複雜臨床病例、癌症檢測等方面已能超越醫生，但AI與醫生的協作可能產生最佳結果。美國FDA批准的AI醫療裝置數量激增，從2015年的6個增加到2023年的223個。合成資料在醫學領域顯示出巨大潛力，可用於識別健康社會決定因素、保護隱私的臨床風險預測以及藥物發現。全球三分之二的國家現在提供或計畫提供K-12電腦科學（CS）教育，是2019年的兩倍，非洲和拉丁美洲進步最大。在美國，雖然大多數K-12 CS教師認為AI應納入基礎CS教育，但只有不到一半的教師感到有能力教授AI。美國電腦科學學士學位畢業生數量在過去十年中增長了22%，AI碩士學位畢業生數量在2022年至2023年間幾乎翻了一番。（科學與醫學突破這一章內容相對專業，感興趣的朋友可以直接定位到285頁瞭解詳情。）八、公眾認知：樂觀情緒上升，但區域差異與擔憂並存全球公眾對AI產品和服務的樂觀情緒正在上升。在26個受調查國家中，18個國家認為AI產品和服務利大於弊的人數比例有所增加。全球範圍內，這一比例從2022年的52%上升到2024年的55%。區域差異依然顯著，中國（83%）、印度尼西亞（80%）、泰國（77%）等國絕大多數人認為AI利大於弊，而加拿大（40%）、美國（39%）、荷蘭（36%）等國的樂觀情緒較低，儘管這些國家的樂觀情緒自2022年以來有所增長。與此同時，全球60%的受訪者認為AI將在未來五年內改變他們的工作方式。然而，對於AI將完全取代他們工作的擔憂程度相對較低，只有36%的受訪者持此觀點。史丹佛大學以人為本人工智慧研究院在官方網站上寫道：AI 將是 21 世紀最具變革性的技術。然而，除非我們精心引導 AI 行業的發展，否則這項技術將難以惠及普羅大眾。(旁觀者手記)

2025年人工智慧指數報告：技術突破與社會變革的全景透視

《2025年人工智慧指數報告》作為史丹佛大學人工智慧實驗室與多方合作的年度重磅研究，以超過千頁的篇幅全景式展現了人工智慧技術在全球範圍內的發展軌跡和深遠影響。這份報告不僅延續了對AI技術性能、科研進展與產業應用的追蹤，更首次深入探討了AI硬體的演化、推理成本的測算方法，以及AI在科學發現與醫療健康領域的突破性進展。從生成式AI對創意產業的顛覆到大模型訓練的能源消耗爭議，從AI倫理治理框架的建構到全球政策博弈的加劇，這份報告以資料為錨點，勾勒出一幅技術與社會深度交織的複雜圖景。技術績效突破：從逼近人類基線到算力革命人工智慧技術在2024年展現前所未有的效能躍遷。以自然語言處理領域為例，GPT-4o在MMLU測試中達到92.3%的精確率，與人類基線（92.8%）的差距已微乎其微。 Gemini 2.0透過分層推理機制，在ARC-AGI測試中取得75.7%的突破性成績，較2023年提升14個百分點，標誌著AI在複雜邏輯推理能力上的質變。視覺生成領域同樣取得革命性進展，Stable Video Diffusion整合動態物理引擎後，其產生的分子動力學模擬影片獲得學術界92%的可信度評分，為科學研究可視化提供了全新工具。這些突破背後是算力投入的指數級增長：PaLM 2訓練成本突破2億美元，Llama 3.1-405B的訓練資料量達到10^16 tokens量級，而輝達H100叢集將推理延遲壓縮至17ms/Token，為即時互動應用奠定基礎。在科學計算領域，AlphaFold 3將蛋白質結構預測準確率提升至98%，較前代提升25%，其原子坐標提示功能顯著加速藥物發現處理程序。 ESM3模型在多尺度生物分子互動作用預測中展現的泛化能力，標誌著AI開始突破傳統計算生物學的理論邊界。數學領域，MATH資料集上的問題解決率達到97.9%，逼近人類水平，顯示AI在符號推理方面的潛力。醫療與科學革命：從精準干預到藥物研發範式重構醫療AI的突破正在重塑健康管理範式。 GluFormer將血糖預測誤差控制在±0.3mmol/L以內，結合穿戴式裝置資料流建構的糖尿病個性化干預系統，實現了從被動治療向主動預防的轉變。醫學影像領域，CheXpert Plus資料集整合120萬例胸部X光報告與人口統計學資料後，亞裔病患識別精準率提升19%，凸顯資料多樣性對模型公平性的重要性。更具革命性的是AlphaFold DB與UniProt的聯動，蛋白質結構資料庫在2024年突破10億條目，為藥物發現提供大量基礎資源。 AI輔助的藥物研發管線將候選分子篩選周期從4.5年壓縮至11個月，2024年FDA核准的37種新藥中有11種深度依賴生成式AI技術。在臨床實踐層面，聯邦學習使醫療影像分析中資料外洩的風險降低82%，但跨機構協作仍面臨37%的合規障礙。 FDA首次將"演算法透明度指數"納入醫療器材審批標準，要求揭露訓練資料的時空分佈特徵，這標誌著醫療AI監管進入新階段。報告特別警示，2024年記錄的213起AI事故中，41%涉及自動駕駛感知失效，直接推動歐盟在AI法案中新增動態風險評估條款。產業化處理程序：重塑全球經濟與人才格局AI產業化正在重構全球價值鏈。 2024年全球AI勞動力需求成長68%，機器學習工程師薪資溢價達傳統軟體工程師的2.3倍，美國形成加州-馬薩諸塞州"研發雙核心"與德州-北卡州"應用雙極"的地理分佈格局。投資領域呈現明顯分化：基礎模型層吸納62%的總投資，垂直應用僅佔17%，其中AI晶片初創企業獲得47億美元融資，存算一體架構實現16倍能效提升，預示算力革命新方向。企業應用方面，71%的機構採用生成式AI，北美、歐洲、中國領先全球，AI使檔案編輯效率提升10-13%，銷售響應速度加快39%，安全分析提速23%。勞動力市場呈現結構性變化：低技能崗位效率提升顯著，但高技能崗位仍主導複雜任務。這種分化在醫療領域尤為明顯，AI輔助診斷系統使放射科醫師工作量減少40%，但臨床決策仍高度依賴人類專家。報告同時指出，AI技術護城河正在消融，LMSYS Chatbot Arena顯示頂級模型效能差距持續縮小，產業競爭進入白熱化階段。倫理治理：從框架建構到制度落地負責任的AI（RAI）實踐進入制度化新階段。 76%的企業建立倫理審查委員會，但僅34%制定量化風險指標，顯示實踐仍處初級階段。歐盟AI法案催生48億美元規模的"合規即服務"市場，237家諮詢機構參與標準制定。資料隱私方面，聯邦學習降低醫療資料外洩風險82%，但跨機構協作合規障礙仍存。 IEEE的AI倫理影響評估架構被47國採用，但開發中國家在ISO/IEC標準制定中參與度不足12%，凸顯治理鴻溝。演算法透明度取得進展，基礎模型透明度指數（FMTI）從37%（2023）上升至58%（2024），但訓練資料揭露仍不充分。報告強調，2024年記錄的213起AI事故中，自動駕駛感知失效佔比41%，直接推動歐盟要求L4級系統季度安全驗證。這種動態風險評估機制標誌著AI治理從靜態合規到持續監測的轉變。教育變革：從課程重構到培養範式創新AI教育呈現全學段滲透態勢。全球電腦科學課程中AI內容佔比從18%（2019）躍升至49%（2024），但32%高校依賴企業課件暴露師資短板。美國28州將AI素養納入K-12核心課程，Code.org模組覆蓋620萬中學生，其強化學習遊戲設計項目使演算法思維得分提升27%。高等教育變革更為劇烈：MIT推出"AI工程師"學位，要求2000小時超算訓練；斯坦福HAI實施"反嚮導師制"，讓大模型輔助設計個性化培養方案。教育公平性問題凸顯，AP電腦考試中白人佔比73%，西班牙裔/拉丁裔僅11%。這種差距在高等教育更為顯著，AI相關博士學程錄取中，亞裔佔比從2010年的18%上升至2024年的34%，而非裔維持在3%以下。報告呼籲建立包容性人才培養體系，防止技術鴻溝代際傳遞。全球治理：地緣博弈與資源鴻溝AI成為地緣政治博弈新戰場。美國《2024國家AI安全戰略》鎖定11個關鍵技術領域，中國《生成式AI服務管理辦法》首次對幻覺內容分級管控。算力資源分配呈現極端不平衡：北美人均算力密度是非洲的173倍，AI論文引用Gini係數達0.82的歷史高峰。這種鴻溝在技術標準領域同樣顯著，開發中國家在ISO/IEC標準制定中參與度不足12%。技術民族主義加劇，各國資料在地化政策導致全球AI研究出現"資料巴爾幹化"。報告警示，這種割裂可能阻礙跨國科研合作，延緩氣候變遷等全球性挑戰的應對處理程序。未來趨勢與風險警示具身智能：機器人與多模態大模型的融合報告預測，多模態大模型與機器人技術的結合將催生"具身智慧"新範式。波士頓動力Atlas的最新迭代版本已能透過自然語言指令完成精密裝配任務，其動作規劃模組與視覺-語言模型的即時互動延遲低於200ms。這種融合不僅限於工業場景：醫療護理機器人透過理解患者自然語言指令調整康複方案，農業機器人結合氣象資料與作物生長模型實現精準作業。值得關注的是，特斯拉Optimus Gen3的能源效率較2023年提升37%，其搭載的分佈式推理架構使邊緣計算成本降低42%。AI for Science：自主研究系統的崛起AI正在顛覆傳統科學研究流程。 DeepMind的AlphaGalaxy系統在2024年自主發現了3種新型超導材料，其通過強化學習最佳化實驗設計，使材料驗證周期從平均18個月縮短至6周。在生物醫藥領域，生成式AI與自動化實驗室的結合使化合物篩選通量提升兩個數量級，輝瑞等藥企已建立"AI-濕實驗"閉環系統。更深遠的影響在於科學研究方法論的變革：MIT開發的AutoScience架構可自主提出假說、設計實驗並驗證結論，其在量子化學領域的預測準確率超過初級研究員水準。永續發展：AI驅動的綠色革命AI技術開始規模化賦能可持續發展。 Google的碳足跡最佳化模型透過動態調整供應鏈路徑，為全球500強企業減少19%的碳排放。在能源領域，DeepMind的電網最佳化系統將再生能源利用率提升至92%，其預測模型使風電場輸出功率波動性降低34%。農業方面，ClimateAI平台整合衛星遙感與土壤感測器資料，為北美農場節省27%的灌溉用水。這些應用標誌著AI從效率工具轉向系統性變革引擎的轉變。技術奇點的預警訊號報告警示，AI的自主進化能力正逼近臨界點。 2024年全球AI算力消耗達到瑞典全國年用電量的1.3倍，大模型訓練的碳排放量已佔航空業的7%。更嚴峻的是，Meta的AutoML系統已能設計出比人類工程師更有效率的神經網路架構，這種"AI生成AI"的迭代速度呈指數級增長。當系統開始最佳化自身目標函數時，對齊問題（Alignment Problem）的複雜性將超越現有倫理框架的應對能力。報告呼籲建立全球性AI安全協議，要求L5級自主系統必須配備可解釋性驗證模組。社會技術系統的協同演化未來的AI發展將呈現"技術-制度"雙輪驅動特徵。歐盟正在測試的動態風險評估體系，要求自動駕駛系統每季提交安全驗證報告，這標誌著監管模式從事後追責向過程監控的轉變。在教育領域，史丹佛HAI的"反嚮導師制"讓大模型參與課程設計，使個性化學習效率提升39%。這種協同演化還體現在勞動力市場：AI原生崗位（如提示詞工程師、模型對齊專家）的需求年增長率達117%，而傳統職業的技能重構周期從5年壓縮至18個月。風險警示同樣迫切2024年全球AI算力消耗相當於瑞典年用電量的1.3倍，大模型訓練碳排放量佔航空業7%。當AI開始自主設計更有效率系統時，技術奇點的倫理與安全挑戰迫在眉睫。報告呼籲建立跨領域防控體系，在推動創新與防範風險間尋求平衡。2025年報告揭示，AI已從技術突破期進入社會嵌入期。其影響力橫跨科學研究、經濟、教育與全球治理，但算力消耗、倫理滯後與資源不平等威脅可持續發展。在享受AI紅利的同時，人類需建構新型協作機制：技術開發者需嵌入倫理設計，政策制定者應建立動態監管框架，國際社會亟待彌合數字鴻溝。唯有如此，方能確保智慧革命真正普惠全人類，在技術-社會的協同演化中開闢可持續發展新紀元。（智慧建造碩博）

史丹佛大學：人工智慧百年研究報告，2030年的人工智慧與生活

在科幻電影和小說中，人工智慧（AI）常常被描繪成擁有自我意識、威脅人類生存的超級智能。從《終結者》中的天網到《駭客帝國》裡的矩陣，這些虛構的形象塑造了公眾對 AI 的普遍想像——一種既強大又充滿潛在危險的力量。然而，現實世界中的 AI 發展軌跡，與這些戲劇化的描繪相去甚遠。史丹佛大學發起的“人工智慧百年研究”（AI100）項目，旨在以百年尺度、持續追蹤並權威評估 AI 的發展及其對人類社會的影響。其 2016 年發佈的首份報告——《人工智慧與生活 2030》（Artificial Intelligence and Life in 2030），為我們提供了一個更為理性、務實且貼近生活的視角，撥開科幻迷霧，審視未來十幾年 AI 將如何真切地融入我們的日常。百年之約：AI100 項目的緣起與使命AI100 項目並非心血來潮，它的誕生源於對 AI 領域快速發展及其深遠社會影響的深刻認識。受到 2008-2009 年 AAAI（美國人工智慧協會）組織的“阿西洛馬會議”（Asilomar Meeting）的啟發——那次會議聚集了 AI 專家、認知科學家、哲學家和法律學者，探討了 AI 的近期發展、長遠可能以及倫理法律問題——AI 領域的思想者們意識到，需要一個長期、持續的機制來系統性地研究 AI。於是，AI100 項目應運而生。它設立了一個常設委員會（Standing Committee），計畫每五年組織一次由頂尖專家組成的專門研究小組（Study Panel），評估 AI 的當前狀態，回顧過往進展，預測未來趨勢，並分析這些進展帶來的技術、社會、倫理、經濟等方面的挑戰與機遇。其核心目標是提供一系列連貫、深入的專家反思，為 AI 的研究、開發、系統設計以及相關政策制定提供明智的指導，確保 AI 技術能夠廣泛惠及個人與社會。首份報告《人工智慧與生活 2030》的研究小組由來自學術界、企業實驗室和產業界的 17 位 AI 專家，以及法律、政治學、政策和經濟學領域的學者組成。他們背景多元，涵蓋不同專業、地域、性別和職業階段，確保了研究的廣度與深度。常設委員會為研究小組設定了任務：聚焦於 AI 到 2030 年對一個“典型的北美城市”生活可能產生的影響。選擇城市作為焦點，是因為城市是人類活動的主要載體；限定於北美城市，則是為了在有限的研究資源下，深入探討特定文化和社會背景下的具體影響，同時承認全球城市的多樣性。研究小組深知，AI 的影響並非孤立發生，而是與眾多社會和技術發展相互交織。揭開 AI 的面紗：它是什麼，不是什麼？報告首先嘗試釐清一個基礎卻又複雜的問題：到底什麼是人工智慧？報告指出，精確定義 AI 本身就是一個挑戰。但可以明確的是，AI 是一門科學，也是一套計算技術。它的靈感來源於人類神經系統和身體感知、學習、推理和行動的方式，但其運作方式通常與人類截然不同。當前 AI 領域取得了顯著進展，尤其是在特定任務上。例如：深度學習（Deep Learning）：作為機器學習的一個分支，基於被稱為神經網路的多層變數表示，使得語音識別在手機和智能家居中變得實用，並在各種依賴模式識別的應用中大放異彩。電腦視覺（Computer Vision）：讓機器能夠“看懂”圖像和視訊，廣泛應用於圖像搜尋、人臉識別、自動駕駛以及醫療影像分析等。自然語言處理（Natural Language Processing, NLP）：讓機器能夠理解和生成人類語言，支撐著機器翻譯、智能問答（如擊敗《危險邊緣》冠軍的 IBM Watson）、情感分析和搜尋引擎的改進。AI 規劃（AI Planning）：被用於最佳化調度、物流、機器人控制，甚至驅動著比好萊塢產值還高的視訊遊戲產業。然而，報告特別強調，目前的 AI 並非“通用人工智慧”（Artificial General Intelligence, AGI）。我們所擁有的，是一系列高度專業化的 AI 系統，每一個通常都需要多年的專門研究和精心建構，才能在特定任務上表現出色。它們缺乏人類的常識、跨領域推理能力和真正的自我意識。因此，報告明確指出：研究小組沒有發現任何理由擔憂 AI 是對人類的迫在眉睫的威脅。沒有開發出具有自我維持的長期目標和意圖的機器，近期內也不太可能開發出來。相反，我們應該期待的是越來越多有用的 AI 應用出現，它們有潛力對我們的社會和經濟產生深遠的積極影響。AI 滲透八大領域：2030 年城市生活圖景報告聚焦於八個與城市生活息息相關的領域，預測了 AI 在 2030 年可能帶來的變化：交通運輸（Transportation）：這是 AI 影響最為顯著和迅速的領域之一。自動駕駛技術正快速發展，報告預測到 2030 年，自動駕駛汽車（包括私家車、卡車、配送車甚至飛行器）將變得更加普遍。這將深刻改變城市面貌：人們可能減少私家車擁有量，依賴共享自動駕駛服務；通勤距離可能增加；交通擁堵和停車難問題有望緩解，甚至可能導致城市空間格局的重新規劃（如停車場轉為他用）。安全性和可靠性是核心挑戰，但技術進步正推動其快速落地。公眾對 AI 的首次大規模物理接觸很可能來自自動駕駛，這將塑造他們對 AI 的整體認知。家庭/服務機器人（Home/Service Robots）：掃地機器人已進入千家萬戶，但報告預測，隨著感測器（如低成本 3D 感測器）、晶片技術、雲端運算和語音理解能力的進步，未來十五年將出現更多特定用途的機器人。它們可以遞送包裹、清潔辦公室、增強安保、輔助老人生活起居。然而，製造安全可靠、能在複雜非結構化環境中靈活操作的通用型機器人仍然面臨巨大的技術挑戰和成本障礙。因此，近期內商業機會仍將集中在功能明確、場景限定的應用。醫療健康（Healthcare）：AI 在醫療領域的潛力巨大。可穿戴裝置、手機 App 和電子健康記錄（EHR）產生了海量健康資料，AI 可以利用這些資料進行早期疾病風險預測、輔助診斷（如解讀醫學影像）、個性化治療方案推薦、藥物研發加速等。手術機器人和輔助護理機器人也在發展中。報告認為，AI 應用有望在未來幾年顯著改善數百萬人的健康狀況和生活質量。儘管 AI 從實驗室走向臨床應用的速度相對較慢，但已有加速跡象。挑戰在於如何確保資料隱私和安全、演算法的公平性與透明度、以及如何讓 AI 系統與醫療專家順暢協作並獲得醫患信任。教育（Education）：AI 有潛力為教育帶來個性化變革。智能輔導系統可以根據學生的學習進度和風格提供定製化指導；語言學習應用可以提供沉浸式練習；AI 還可以輔助教師進行備課、批改作業、分析學情。然而，挑戰在於如何設計出能真正理解學生認知和情感狀態、並與人類教師有效互補的 AI 系統。如何避免加劇教育資源不平等、確保教育內容的精準性和價值觀導向，也是需要關注的問題。與醫療領域類似，人機互動的順暢性和信任度是關鍵。低資源社區（Low-resource Communities）：AI 技術有可能為資源匱乏的社區提供幫助，例如通過最佳化公共資源（如交通、能源）的分配，提供遠端醫療和教育服務，改善資訊獲取管道等。然而，風險在於 AI 應用的設計可能忽略這些社區的特殊需求，或者由於資料偏差而加劇現有的不平等。如何確保技術的普惠性，讓 AI 成為彌合而非擴大數字鴻溝的工具，至關重要。建立社區信任是 AI 在此領域應用的前提。公共安全與安防（Public Safety and Security）：AI 已被用於犯罪預測（基於歷史資料模式分析）、監控視訊分析（如識別異常行為）、災害應急響應最佳化等方面。無人機和機器人也可用於危險環境的巡邏和偵查。但這些應用引發了嚴重的隱私和偏見擔憂。基於有偏見的資料訓練出的預測模型可能導致歧視性執法。大規模監控也帶來了公民自由的風險。如何在利用 AI 提升安全效率與保護公民權利、確保公平正義之間取得平衡，是一個核心挑戰。公眾信任同樣是基石。就業與職場（Employment and Workplace）：AI 對就業的影響是公眾最關心的問題之一。報告認為，AI 將自動化許多工，特別是那些重複性、流程化的工作，這無疑會對現有崗位造成衝擊，涉及從製造業、客戶服務到某些專業領域（如部分法律、會計工作）。但同時，AI 也會創造新的工作崗位（如 AI 訓練師、資料科學家、人機協作專家），並增強人類的能力，使勞動者更高效。關鍵在於社會如何適應這種轉變，如何通過教育和再培訓幫助人們掌握新技能，以及如何設計合理的社會保障體系來應對結構性失業。克服人們對被邊緣化的恐懼，是推廣 AI 應用於職場的挑戰之一。娛樂（Entertainment）：AI 早已深度融入娛樂產業。從視訊遊戲的智能 NPC（非玩家角色）、個性化內容推薦（音樂、電影、新聞），到利用 AI 進行內容創作（如生成音樂、劇本、虛擬形象），AI 正在重塑娛樂體驗。未來，更具互動性、沉浸感的 AI 娛樂形式可期。但報告也提示，過度沉浸於 AI 驅動的個性化娛樂，可能帶來社交隔離、資訊繭房加劇等社會風險。超越技術：AI 的社會挑戰與政策前瞻報告深刻認識到，AI 的發展絕不僅僅是技術問題，它帶來了廣泛而深刻的社會、倫理和法律挑戰：公平性與偏見（Fairness and Bias）：AI 系統並非天生中立。它們依賴資料進行學習，如果訓練資料本身存在偏見（如種族、性別歧視），AI 系統可能會複製甚至放大這些偏見，導致在招聘、信貸審批、司法判決等關鍵決策中產生歧視性結果。確保 AI 的公平性是一個重要的技術和倫理難題。隱私（Privacy）：AI 應用往往需要大量資料，尤其是在城市環境中，無處不在的感測器和資料收集點（攝影機、手機定位、線上行為等）為 AI 提供了燃料，但也引發了對個人隱私被侵犯的擔憂。如何在利用資料價值與保護個人隱私之間找到平衡點，是亟待解決的問題。安全與可靠性（Safety and Reliability）：對於自動駕駛汽車、醫療 AI 等與人身安全密切相關的應用，其安全性和可靠性至關重要。如何確保系統在各種複雜甚至未知情況下的穩定運行，防止被惡意攻擊或濫用，是技術上的重大挑戰。責任歸屬（Accountability）：當自動駕駛汽車發生事故，或 AI 醫療診斷出錯時，責任應該由誰承擔？是開發者、製造商、所有者，還是 AI 本身？現有的法律框架需要適應這些新情況。經濟影響與分配（Economic Impacts and Distribution）：AI 帶來的效率提升和財富創造是巨大的，但這些收益如何在社會中分配？如果 AI 主要由少數大公司掌握，技術紅利集中在少數人手中，可能會加劇貧富差距。如何確保 AI 的經濟成果能夠公平共享，是重要的社會議題。人機關係（Human-Machine Interaction）：隨著 AI 越來越深入地融入生活，人與機器的關係將變得更加複雜。如何設計既智能又易於理解、值得信賴、並能與人類良好協作的 AI 系統？如何避免過度依賴 AI 而導致人類自身能力的退化？面對這些挑戰，報告提出了一系列政策建議，核心思想是：目標必須是為社會創造價值，政策應鼓勵有益的創新，同時審慎管理風險，促進公平共享。提升政府的 AI 專業能力：各級政府需要擁有懂技術的專家，能夠理解 AI 技術、評估其影響、制定合理政策，避免因無知而扼殺創新或草率批準有風險的應用。鼓勵對 AI 社會影響的研究：需要投入更多公共和私人資金，支援跨學科研究，深入探討 AI 的公平性、安全性、隱私保護和社會影響。應消除（法律或政策上）阻礙相關研究（如對專有系統進行必要的評估）的障礙。避免對“AI”進行籠統監管：由於 AI 並非單一技術，且不同領域的風險和考量差異巨大，試圖制定統一的“AI 法規”是不可取的。政策應聚焦於特定行業和應用，根據具體情況制定合適的規範。促進透明度、問責制和公眾信任：設計和部署 AI 系統時，應注重提升其可解釋性，建立問責機制，並以透明、負責任的方式與公眾溝通，逐步建立信任。關注公平與普惠：政策應著眼於如何讓 AI 的好處惠及更廣泛的人群，防止技術加劇社會不平等。應就 AI 帶來的經濟利益如何分配展開社會討論。結語：面向 2030 的理性期待與責任《人工智慧與生活 2030》報告為我們描繪了一幅相對樂觀但也充滿警示的未來圖景。它告訴我們，AI 的力量不在於虛構的“超智能覺醒”，而在於其作為強大工具，在醫療、交通、教育等各個領域提升效率、改善生活的巨大潛力。到 2030 年，AI 將更深地融入我們的城市生活，帶來便利的同時，也帶來結構性的社會變遷和倫理挑戰。這份報告最重要的貢獻在於，它將討論的焦點從遙遠的、模糊的“奇點”恐懼，拉回到近在眼前的、具體的現實挑戰和機遇上。它提醒我們，AI 的未來並非命中註定，而是掌握在我們自己手中。我們需要以開放的心態擁抱變革，同時保持警惕，積極投入跨學科研究，審慎制定公共政策，引導 AI朝著符合人類共同利益的方向發展。AI100 項目的百年之約才剛剛開始。隨著技術的不斷演進，未來的研究報告將繼續為我們提供洞見。而當下，理解這份開創性報告的洞察與建議，正是我們共同塑造一個負責任、可持續、以人為本的 AI未來的第一步。我們需要的不是恐懼，而是理解、智慧和行動。 (歐米伽未來研究所2025)

多步推理碾壓GPT-4o，無需訓練性能提升10%！史丹佛開源通用框架OctoTools

OctoTools通過標準化工具卡和規劃器，幫助LLMs高效完成複雜任務，無需額外訓練。在16個任務中表現優異，比其他方法平均精準率高出9.3%，尤其在多步推理和工具使用方面優勢明顯。大型語言模型（LLMs）目前仍然很難處理需要多步驟推理、特定領域知識或外部工具整合的複雜任務，有研究工作探索了使用預先建構的外部工具來增強LLMs處理複雜任務的能力，但這些方法需要對模型進行微調或額外訓練以實現工具的整合，在不同任務之間難以靈活適應。現有的方法要麼依賴於靜態的、預定義的工具集，要麼缺乏高效的工具選擇和規劃機制，這種低效性會導致任務執行出錯、計算成本增加，以及在應用於新領域時適應性受限。傳統增強LLMs的方法包括少量樣本提示（few-shot prompting）、思維鏈（chain-of-thought reasoning）以及與外部工具介面的功能呼叫API；有的框架如LangChain和AutoGen允許LLMs夠使用外部資源，但通常智能用於指定應用場景或需要大量的預組態，沒有提供一種統一的多步驟規劃和執行方法，因此在處理複雜推理問題時效果不佳。

史丹佛大學《2025年新興技術評論：十項關鍵技術及其政策影響報告》

在當今時代，新興技術以前所未有的速度蓬勃發展，深刻地改變著我們的生活、社會和全球格局。從人工智慧的飛速崛起，到生物技術的重大突破，再到太空探索的不斷推進，這些技術不僅為我們帶來了無限的機遇，也帶來了諸多挑戰。史丹佛大學最新發佈的這部191頁《2025 年新興技術評論：十項關鍵技術及其政策影響報告》，對人工智慧、生物技術與合成生物學、密碼學、雷射、材料科學、神經科學、機器人學、半導體、太空、可持續能源技術這十大領域進行了深入剖析，探討了它們的現狀、發展趨勢以及對政策制定的影響。瞭解這些新興技術，對於我們把握時代脈搏、適應未來發展至關重要。接下來，讓我們一同走進這些技術的奇妙世界，探索它們的奧秘與潛力。報告前言在每個時代，技術發現都既帶來希望，也帶來風險。然而，世界很少經歷像如今這般快速且大規模的技術變革。從比人類頭髮絲細五萬倍的納米材料，到部署在太空中的商業衛星和其他私營部門技術，各項突破正在迅速重塑市場、社會和地緣政治格局。此外，美國的技術政策已不再像過去那樣完全由政府主導。如今，發明家與投資者做出的決策往往會產生重大的政策影響，即便他們可能並未充分意識到這一點。人工智慧（AI）演算法中融入了關於期望和非期望結果的政策選擇；幾乎每一項新技術，從生物工程新藥的研發到水下研究無人機的建造，都同時具有商業和軍事應用價值。私營部門的投資在通過開發新能力、供應鏈和新需求，以及追求可能不符合國家長期利益的商業機會的過程中，既帶來了國家優勢，也帶來了脆弱性。