TSA有效? 與操練無關?

近月在有關全港性系統評估(以下簡稱TSA)的政策議論,政府高官及部分專家教授的評論,除把TSA描述為「低風險」以外,還吹噓TSA是「有效」的評估工具,而且它是與應試操練沒有直接因果關係。本人上周已對「TSA低風險」的言論作出批判(〈TSA低風險?〉,刊12月23日《明報》),本文將對「TSA有效」及「與應試操練無關」的言論加以質疑。

TSA不必要不可靠無效

吳克儉局長一再公開推銷「TSA有效」(註1)!我敢問教育局做了哪些政策評估研究,以證明TSA的成效?在教育局未有提供確實證據前,且讓我越俎代庖在3個層次來分析TSA的政策成效。在評估全港學校系統層面而言,TSA是確能提供全港系統的數據。但問題就在於即使不實施TSA這種頻密的全民參與的深度評估,我們其實已可以從一些可靠的國際性比較研究,如每3年進行一次的PISA(學生能力國際評估計劃),或每4年一次的TIMSS(國際數學與科學教育成就趨勢調查),得知香港教育系統內的學生在多方面能力的表現,均在國際上名列前茅。再者,即使教育局一意孤行要繼續實施系統評估,則一種頻密度較低、學校及學生參與率較小的隨機抽樣評估已可達到目的。其次,若評估對象是以學校為單位,則過去30年的學校效能研究school effectiveness studies已清楚指出,單獨以在校學生的學業成績,來評估個別學校的效能,根本是不全面和誤導。即使用較複雜的增值指標方法來評估,據英國著名統計學家Harvey Goldstein研究指出,它的信度與效度亦是存在着明顯的局限(註2及3)。最後,若評估對象是個別學生,並希望能及早得知哪些學生在哪些方面的知識或技能出現問題,而加以針對性的教學支援;但要實現這個「良好願望」,正如美國著名教育評估學者W. James Popham指出(註4及5),整個學校制度是必須有一連串的政策配合:這包括對每個學童作全面而深入的標準為本評估standards-based assessment,經分析及闡釋後的詳盡結果就必須交給校方、任教老師,以至家長,並在課程與教學專家協同下,為個別學生施行針對性的支援。據此,敢問局長閣下,你一方面聲稱TSA是為學生拔尖補底,但近日又聲稱不會再向學校匯報學生的TSA成績(註6),則TSA對個別學生學習上的及時支援的目標,是否就無法啟動呢?即使沿用過往TSA政策向學校發放學生成績,其方式亦只有總體成績而沒有不同學能方面的細分,據此,校方及任教老師就根本無法對個別學生給予針對性的教學支援。總結而言,我認為TSA在評估整體學校系統方面根本是不必要的,在評估個別學校效能方面是不可靠的,在評估個別學生學習並加以支援方面是無效的。

有高風險評估 才有操練需要

最後,教育局長和他的學界辯護士一再聲稱學校操練TSA的現象,原因不在於TSA本身,而在於由來已久存在於香港社會的操練文化(註7及8)。我對這種前因後果的簡單邏輯詭辯,無法苟同。事實是,有高風險評估,才會有操練相關評估工具的需要。若從歷史脈絡視域來解釋,自從1973年取消升中試,並用學能測驗作為中學學位分配的依據開始,專家、官僚就一再聲稱學能測驗是不必操練的,但在高風險的中學學位分配機制下,所有小學就被迫面對一種「囚犯兩難」prisoner’s dilemma,結果就陷入一種雙輸的不斷操練的局面(註9)。專家、官僚每指摘校方作非理性的操練,但卻不知悉是在他們設計出來的政策制度及遊戲規則下,才迫使校方作出其自身的「理性抉擇」。事實上,過去大半個世紀香港教界一直爭取的就正是取消那些高風險的評核試,包括:升中試、中三成績評核試、學能測驗等。事實上,自2000/2001學年取消學能測驗後,香港小學確曾出現短暫的沒有操練的蜜月期。但好景不常,隨着2004年TSA的實施,操練文化就開始死灰復燃,是TSA在煽風點火、火上加油,才導致這一輪操練文化的蔓延。

至此,我懇請教育當局,為了香港特區未來公民的福祉,請把這個高風險,在系統評估層面上是不必要,在評估學校效能及學生學習層面上是無效,並對操練文化造成煽風點火、火上加油的惡果的評估政策TSA全面廢除吧。

註1:吳克儉言論見《星島日報》2015年12月2日報道

註2:Goldstein, Harvey and D. J. Spiegelhalter(1996). “League Tables and Their Limitations: Statistical Issues in Comparisons of Institutional Performance.” Journal of the Royal Statistical Society. Series A(Statistics in Society), Vol. 159, No. 3, pp.385-443.

註3:Goldstein, Harvey and Pan Huiqi(2000). The Use of Value Added Information in Judging School Performance. London: Institute of Education, University of London.

註4:Popham, W. James(2004). America’s “Failing” Schools: How Parents and Teachers Can Cope With No Child Left Behind. New York: RoutledgeFalmer.

註5:Popham, W. James(2001). The Truth About Testing: An Educator’s Call to Action. Alexandria, VA. : Association for Supervision and Curriculum Development.

註6:見吳克儉局長在立法會發言,2015年12月16日《大公報》,A16版報道

註7:同註6

註8:侯傑泰,〈取消TSA 無助減少考試操練〉,2015年10月23日,《明報》,A40,觀點版

註9:有關分析見曾榮光(2006),〈從哪裏來?往哪裏去?尋找《教育改革建議》的實徵基礎〉,129至143頁。曾榮光(編)《廿一世紀教育藍圖?香港特區教育改革議論》,香港:中文大學出版社,137至139頁

作者是香港中文大學教育行政與政策學系客座教授