2025年5月28日,美國藝術與科學學院院士、耶魯大學Malcolm K. Brachman 經濟學教授陳曉紅受邀蒞臨北京大學光華40年“頂尖學者學術講堂”,分享了她的研究On Local Over-identification and Semiparametric Efficiency in Potential Outcome Casual Models與Efficient Difference-in-Differences and Event-Study Estimators。她結合巨量資料與機器學習技術對傳統經濟學研究的衝擊,系統地揭示非參數過度識別模型在提升因果推斷效率與檢驗效能中的重要作用,為生成式人工智慧(GAI)時代的複雜經濟分析提供了新範式。北京大學光華管理學院商務統計與經濟計量系主任、教授虞吉海主持了本次活動。非參數過度識別、有效學習與檢驗在GAI時代的重要性陳曉紅在經濟學研究中,建立經濟因果分析模型並結合資料進行分析是非常關鍵的。僅憑觀察資料,如果缺乏有效的經濟模型,通常只能得到變數之間的相關性,而非因果關係。例如,增加從中國進口是否導致了美國失業率的上升,僅靠資料關聯並不能提供明確的因果推斷。在統計學上,一個模型是對隨機變數機率分佈的集合,由未知參數所標識。根據參數的維度特徵,這些模型可分為參數模型(參數維度有限)、非參數模型(參數維度無限)、半參數模型(興趣參數維度有限,但干擾參數維度無限)和半非參數模型(同時包含有限維度和無限維度的興趣參數)。半非參數模型具有更多優勢,既能避免完全參數化模型的函數形式錯誤,又能比完全非參數模型提供更有資訊量的估計與推斷。同時,半非參數模型還支援過度識別的模型設定檢驗。具體而言,非參數模型中,特別是非參數工具變數(NPIV)模型,涉及內生變數與工具變數,通過非參數形式確定因變數與工具變數之間的關係。Chen and Santos (2018)提出了局部過度識別的定義,認為過度識別是經濟計量模型獲得有效估計量的重要條件,同時也是建構非平凡模型檢驗的基礎。與經典的廣義矩估計(GMM)模型不同,NPIV模型因其參數與約束的無限維特性,無法用傳統的計數法確定過度識別或恰好識別,因此需要新的局部過度識別定義。Chen and Santos (2018)進一步指出,模型的局部過度識別性決定了模型的有效性。局部恰好識別模型中的不同漸近線性且正則的估計量在一階上是等價的,這意味著在此情況下不存在有效性增益,同時所有規範檢驗的局部功效都是平凡的。相反,局部過度識別的模型中存在顯著的有效性增益和非平凡的檢驗,這體現了經濟模型設計中的效率和檢驗能力之間的本質聯絡。以典型的因果推斷模型為例,如未混淆模型(unconfoundedness),模型僅為全域恰好識別模型,因此不存在效率增益。Hahn (1998)與Hahn and Ridder (2013)分別提出了非參數插補法與傾向得分匹配法,都能達到半參數效率界。然而,當傾向得分已知時(如隨機實驗),模型變為局部過度識別,但效率界並未改變。這種情況反映出,在特定條件下,模型的識別狀態並不一定影響效率界。差異中的差異(DiD)模型在兩期資料情境下,雖然是全域恰好識別模型,但在多期或交錯處理情境下,可能出現局部過度識別的情況,從而獲得顯著效率增益與非平凡的檢驗能力。特別地,現代DiD方法經常涉及多個處理時期與交錯處理採用,揭示模型中潛在的局部過度識別性質,從而允許更有效的估計與更嚴格的檢驗。多期資料的引入意味著可以更有效地利用歷史資料,這為提升估計的精準性和檢驗的可靠性提供了可能。在工具變數(IV)模型中,局部識別狀況取決於模型設定中的約束條件是否緊密。當約束條件在一定測度集合上嚴格成立時,局部模型為過度識別,從而允許更有效的估計策略。若約束條件並不嚴格,則模型是局部恰好識別,不存在效率增益空間。因此,對約束條件的嚴格性分析是IV模型應用中的重要步驟。因此,我們發現傳統因果推斷中的局部過度識別通常是由模型中的干擾參數如傾向得分等的參數化模型得到。首先,這類參數化模型往往是缺乏理論與實踐依據的,其造成的過度識別並非研究者所希望利用的。其次,在當前機器學習方法流行的背景下,此類參數模型已不再被廣泛使用,因為研究者可以使用各類機器學習方法進行非參數的估計。現代因果推斷文獻通常使用潛在結果框架與機器學習方法,這些模型多數為局部恰好識別。因此,不同的漸近線性與正態估計量通常在一階漸近意義上等價,也不存在有效性上的顯著區別。這限制了這些模型在規範檢驗與效率增益上的可能性。而傳統的參數化結構模型則允許明確的過度識別設定,從而可以實現顯著的效率提升與建構非平凡的檢驗。這提示我們在現代分析框架下也應更多關注模型的過度識別問題,以提高分析的穩健性與效率。Chen et al. (2025)提出了一種高效的差異中的差異(DiD)與事件研究(Event-study)估計方法。差分-差分(DiD)和事件研究(ES)是計量經濟學中應用最廣的因果推斷工具。最新統計顯示,2024 年 NBER 應用微觀經濟學工作論文中逾三成使用 DiD 或 ES,比任何其他方法都多,且這兩種設計在金融學、宏觀經濟學中亦日益普及。儘管近期理論進展提高了 DiD 在處理異質處理效應時的穩健性,若干關鍵計量問題仍未充分解決。第一,研究者常將所有處理前時期視為等價資訊,或乾脆丟棄;此做法缺乏理論與實證依據,易導致精度損失。第二,現代DiD 雖能容納豐富的處理效應異質性,其有限樣本功效尚無系統評估;靈活性是否必然犧牲檢驗力,尤其相較傳統雙向固定效應,仍屬未知。第三,實務中常並列報告多種 DiD、ES 結果,但缺乏正式準則判斷它們是否依賴相同識別假設、針對同一因果參數。文章提出統一框架,在“平行趨勢+無預期”假設下,對 DiD 與 ES 進行半參數效率分析和比較。(1)以觀測變數聯合分佈約束方式重述 DiD 識別;(2)在單次處理與階梯式處理、含或不含協變數的多場景下推導半參數效率界;(3)證明要達效率上界,必須對處理前時期與未處理組進行非均勻加權;(4)指出即便在最簡單設計中,效率提升亦具有重要實證意義。我們證明 DiD 模型在非參數意義下通常過度識別,可利用額外矩條件提高效率。在“大n、固定T”框架下,文章基於有效影響函數建構封閉式估計量,其權重與各比較組及各處理前時期的(條件)協方差成比例,天然滿足 Neyman 正交,便於與機器學習配合。若假設參數化工作模型,估計量仍具雙穩健性,可容忍適度模型誤設。效率界揭示:等權使用全部前期或僅選最後一期做基線通常都非最優;應根據資訊量差異,以協方差驅動的權重聚合不同時間點與組別。我們提供圖形化工具展示權重幾何結構,幫助研究者直觀理解效率來源;這些權重完全由效率理論匯出,而非主觀設定。此外,文章提出無需附加同方差或弱序列相關等強假設的非參數Hausman 類檢驗,用於檢測是否應排除某些前期基線或比較組,並給出可視化方案評估結果對識別假設的敏感度。通過基於CPS 與 Compustat 資料的模擬及一項住院與醫療支出再分析,我們展示框架的實際收益:在單次與階梯處理場景中,新估計量的均方誤差與置信區間寬度顯著下降,精度常提升逾 40%;要達到同等精度,傳統估計量需增加至少 30% 樣本量。結果強調:讓估計策略契合識別假設蘊含的資訊結構,可顯著改善推斷效果。文章與現有多時期、非同步處理的DiD 估計量互補。傳統雙向固定效應在異質效應下易混合權重,解釋困難;對時間或組別加總的簡化假定亦損失效率。我們的效率界為評估各法提供統一標尺,幫助研究者在設計時權衡效率與穩健性。對小樣本、動態效應或高維協變數場景,文章方法尤為合適,因為它在不加額外強假設的情況下充分利用資料資訊。框架也可作為其他識別策略(如合成控制)的比較基準。文章系統刻畫 DiD 與 ES 的識別資訊,提出達到資訊極限的估計量,並配套簡便的檢驗與可視化工具,為實踐提供精度更高的新途徑。未來研究方嚮應進一步探索如何在更多經濟情境下實現模型的局部過識別,以充分利用資料的潛在資訊並提高分析的有效性。此外,對不同模型設定下的有效性界限進行深入探討,並提出更加靈活和強大的檢驗方法,能夠更好地適應複雜的現實經濟情境。綜上所述,隨著經濟計量學與人工智慧的結合不斷加深,在GAI時代背景下,非參數過度識別與有效學習的重要性愈發凸顯。這不僅能提升模型估計的效率和精準性,也為未來的因果推斷與政策分析提供了更為堅實的理論基礎與方法支援。 (經濟管理學刊)