How Teacher Evaluations Broke the University“我們給他們全A,他們就給我們全五分。”作者:羅斯·霍羅威奇(Rose Horowitch)Illustration by Ben Kothe / The Atlantic. Sources: csa-archives / Getty; Nitas / Getty.秋季學期末,全美各地的教授都會為學生打分。從近期趨勢來看,這些分數將達到歷史新高。幾乎在同一時間,學生也會以“教師評估”的形式反過來為教授打分——這些分數同樣可能創下新高。這兩個現象之間存在密切關聯。美國高校,尤其是那些錄取門檻極高的頂尖院校,正面臨“分數膨脹氾濫”與“學術要求降低”的雙重問題。正如我此前所寫,在哈佛大學,過去40年間得A的學生比例翻了不止一倍,但學生的學習投入卻比以往更少。教師評估是高等教育陷入這一困境的重要推手。評估分數會影響學者的薪資水平、招聘錄用乃至終身教職申請機會。然而,“最大化教師評分”與“提供高品質教學”完全是兩回事——事實上,這兩個目標在很大程度上相互對立。教師會受到“減輕學生課業負擔、提高學生分數”的激勵,只因擔心自己因此受到懲罰。“在某種程度上,我們都怕學生。”一位哈佛曆史系教授這樣告訴我。教師評估的初衷本無可厚非:教授應通過反饋改進教學。但高校學者,尤其是研究型大學的學者,受聘的核心依據是其發表的研究成果,而非教學能力。這意味著他們幾乎得不到關於“如何成為更優秀教師”的直接指導。20世紀60至70年代,學生與部分教師對引入評估制度充滿熱情,認為這是實現“大學民主化”的一種方式。到21世紀10年代,教師評估已普及至所有高校。學校讓學生以1至5分的量表為教授評分,評估問題通常涵蓋“評分是否公平”“課堂是否有趣”等多個維度。問題在於,學生根本不擅長判斷“誰是好老師”。由於學習過程並非總能帶來愉悅感,最終的結果是:教得越多、要求越嚴的教師會被“懲罰”,而對學生挑戰性最低的教師反而會被“獎勵”。大量研究表明,學生在“客觀學習評估”中的表現,與他們給教授的評分之間“無相關性”,甚至存在“負相關性”。一項實驗發現,哈佛物理系學生通過“主動學習”模式學到的知識更多,但他們卻認為“被動聽講座”時收穫更大。另一項研究顯示,在美國空軍學院,由“高評分教授”授課的學生,在後續課程中的表現往往更差。教師評估還極易受到各類偏見的影響。課程評估分數與學生“預期獲得的成績”高度相關。多項研究發現,除其他因素外,學生給男教授的評分高於女教授,對長相出眾的教師評分更高,還會因教師帶餅乾進課堂而給出更高評價。“我們尚不清楚評估到底在衡量什麼,但從某種意義上說,它衡量‘性別’或‘分數預期’的效果,比衡量‘教師實際教學價值’要好得多。”加州大學伯克利分校統計學教授菲利普·斯塔克(Philip Stark)研究過教師評估的有效性,他這樣對我說道。儘管教師評估的缺陷已有充分記錄,但它對學者的職業生涯影響極大。“我曾參與過多個晉陞與終身教職評審委員會,在評審過程中,教師評估即便不是衡量教學水平的‘主要方式’,也是‘主要方式之一’。”弗吉尼亞大學心理學教授丹尼爾·威林厄姆(Daniel Willingham)告訴我。德克薩斯A&M大學統計學教授、前院長瓦倫·約翰遜(Valen Johnson)則表示,評估是終身教職評審中的“關鍵因素”。對研究生助教與兼職教師而言,評估的重要性尤為突出——在許多高校,這類群體承擔了大部分本科課程的教學工作。評估分數甚至能直接決定他們能否獲得聘用。“作為兼職教師,你的工作居然要取決於19歲學生對你課堂表現的評價,這實在令人毛骨悚然。”喬治城大學兼職英語教師納撒尼爾·邦普(Nathaniel Bump)這樣說。即便是擁有終身教職的教授,也不得不關注自己的評估分數——除非他們願意面對“課堂空無一人”的局面。部分高校會將評估結果提供給學生,供其選課參考。例如,耶魯大學允許學生根據“課程難度評分”篩選課程:若某門課的難度評分超過特定標準,學生便可將其排除在選課列表之外。評估分數差的教授,其課程選課人數會不斷減少,這不僅會影響其指導的研究生獲得教學機會,還可能導致所在院系的經費與教職名額被削減。最終結果必然是:教師為提高自身評估分數,不得不承受“減輕課業負擔、抬高學生分數”的壓力。瓦倫·約翰遜的一項研究發現,在杜克大學,教授若給學生打A而非B或C,獲得“高評估分數”的機率會翻倍。哈佛大學國際事務教授梅拉尼·卡梅特(Melani Cammett)從布朗大學轉至哈佛任教後,評估分數大幅下滑。她推斷部分學生因“閱讀任務過重”而給她打低分,於是從教學大綱中刪掉了幾篇學術論文,並提高了學生的分數。(她事後告訴我,現在覺得當時“迎合學生”的做法有些過頭,後來又把部分論文加回了大綱。)“教師基本上可以調整自己的教學風格與方法,以在學期末獲得更高評分。”杜克大學商學院行政人員理查德·弗賴施塔特(Richard Freishtat)與斯塔克曾合作研究,他表示,“尤其是當他們知道,這些評分會被用來評判自己的工作表現,並直接關係到薪資、晉陞與留任時——我們談論的可是人們的生計。”普林斯頓大學社會學教授金·萊恩·謝佩勒(Kim Lane Scheppele)回憶,她在巴克內爾大學(Bucknell University)任職時,曾有一位同事會在學生填寫評估表前夕舉辦派對。對許多教授而言,這種“討好式操作”確實能奏效。在哈佛大學,隨著多個學科的教授普遍抬高分數,學生給出的評估分數也隨之上漲。哈佛大學本科教育院長阿曼達·克萊博(Amanda Claybaugh)回憶,一位同事曾對她說:“這裡的平衡狀態就是:我們給他們全A,他們就給我們全五分。”有些教授告訴我,他們會無視評估結果;另一些教授則表示,只要意識到評估形式的侷限性,就能從反饋中獲得有用資訊。弗吉尼亞大學的威林厄姆說,他學會了忽略那些極端情緒化的評論,同時樂於通過評估瞭解學生對課程的感受。此外,部分“要求嚴格但能讓學生收穫頗豐”的課程,依然能獲得較高評分。但幾乎沒人認為,評估真的能“提升教學質量”——而“提升教學質量”本是推行評估制度的核心初衷。正因如此,部分高校正試圖降低對教師評估的依賴。俄勒岡大學與南加利福尼亞大學近期均調整了評估流程:在學生評估的基礎上,增加“教師互評課程”與“教授自我反思”環節。達特茅斯學院的工程系也在試點類似制度。哈佛大學過去會向“評估分數最高的教師”頒發獎項,而兩年前,該校改為獎勵“教學大綱質量高”且“學生在後續課程中表現好”的教師。然而,儘管缺陷重重,教師評估制度卻難以被徹底廢除。馬薩諸塞州惠頓學院(Wheaton College)教育學教授斯科特·格爾伯(Scott Gelber)告訴我,那些有權推動廢除該制度的“資深終身教授”,往往並不那麼反感評估——因為現有體系對他們是有利的。此外,替代方案也存在諸多不足:同行評審比“讓學生填寫問卷”耗時得多,而且教師也不願被同事評判。喬治城大學英語系前主任丹尼爾·肖爾(Daniel Shore)總結了這一困境:“我們都知道,評估是個糟糕的衡量工具,但我們也需要對‘提供高品質教學’負責。”保留教師評估還有另一個原因:若高校徹底取消“學生為教授打分”的權利,大學生及其“支付學費的家長”可能會發起抗議。家庭為大學教育支付數萬美元甚至數十萬美元,自然希望有機會對“所享受的服務”提出批評——畢竟,他們是消費者。但問題在於,在教育領域,“消費者並不總是對的”。 (邸報)