TSA存廢的爭議:回歸政策研究的討論

今年1月23日吳克儉局長宣布,經「優化」的2016年小三全港性系統評估(下稱TSA),將由2016年的約十分之一學校抽樣評估,推展至今年5月全港在學的小三學生均需應考。雖然吳局長聲稱今年的評估不是「全面復考TSA」,但不爭的事實就是全體應屆小三學生仍然是需要在5月應考TSA!但其後,3名特首參選人(曾俊華、葉劉淑儀、胡國興)卻先後宣布或重申應取消TSA!至此,一個原本屬於教育評估政策的討論就漸漸演變成特首選舉工程中的政治議題。與其在政策辭藻(policy rhetoric)上爭辯教育局是否「全面復考TSA」,又或在特首選戰中爭議TSA應否取消,本文將實質地從政策論據(policy argumentation)出發,以審視教育局是否具備充分的理據以支持「全面復考TSA」的政策行動,同時各特首參選人又是否對取消TSA的政綱,作出了充分的論證。 在政策研究領域中,對一個公共政策存廢的檢討及評鑑,一個通用的方法就是探討(1)該政策是否能實現它既定的政策目標?(2)它是否帶來極其惡劣的後果?簡言之,就是成效與代價的分析(cost-effectiveness analysis)。本文將在這兩方面探

詳情

辨別TSA的真實意義:比較視域的分析

早前本人在本版撰文指出,在理解全港性系統評估(以下簡稱TSA)的影響與風險時,不應孤立地把TSA視為一種考核評估工具,應把它放置在過去10多年特區政府建構起來的學校質素監控的審核機制去理解,即視它為23條學校表現評量的一部分。然而除了從政策歷史脈絡去理解TSA外,我們亦應從比較的視域去認識TSA,如此,我們才可以對TSA的教育政策意義,有更全面而深入的認識。與50年前考試相提並論 不恰當事實上,在這一輪TSA的政策議論中,個別論者把TSA政策與不同國家的成績考核政策胡亂地類比,這種不顧政策具體內容與功能在不同國家脈絡之間是否具備可比較性comparability,不單止犯了比較研究中最原則性錯誤,同時也把TSA的本質與功能模糊化。例如,有論者把TSA與「香港已建立近50年的教育品質監察系統 (美國已用近60多年)」相提並論(註1);又指出「全世界有一半學校,都推行成績考核制度」(註2)。但必須指出,這種粗疏的政策比較,實對辨識TSA作為學校教育評估政策的性質與功能,於事無補。首先,50年前(即大概是1965年吧)香港教育制度的公開考核制度內主要就只有升中試與中學會考,這兩項由當時教育署主辦(因考試及評核局仍未成立)的公開考試,它們是在特定教育階段結業時,為篩選和分配學位而設。這與TSA在學校教育階段中途(小三、小六、中三),純為審查scrutiny與問責accountability而設的系統與學校評估,在功能上是截然不同(註3)。其次,當年升中試及中學會考只是簡單的常模參照測試norm-referenced test,這與現今在評核科學發達下,所發展出的一系列以能力為本competency-based、表現標準為本performance-standard based,以至標準參照criterion-referenced的測試,自然不可同日而語。據此,把50年前香港的考試評核制度與今天的TSA相提並論,無論在功能上及性質上均屬不恰當的類比。新自由主義主導的教育改革從政策比較視域來看,與香港TSA具適切的可比較性的案例,本人認為應是英格蘭與威爾士(以下簡稱英國)的全國性評估National Assessment,而這個評估政策又從屬於英國在1980年代末推行的《1988教育改革法案》(以下簡稱「88教改」)的一部分。這個在戴卓爾夫人的新右政府治下,以新自由主義主導的教育改革,其影響不單止影響了英倫三島,也遍及美、加、澳洲、新西蘭,也波及新加坡及當時仍屬英國殖民地的香港。這個強調引入市場競爭機制及拆解福利國家官僚集權架構的改革浪潮,就掀起一種鼓吹去規管deregulation、私營化privatization、市場化marketization的政策議論policy discourse;這種政策議論更在不同公共部門領域造成翻天覆地的改革。然而若要在學校教育部門推行市場化,首要解決的問題就是要確立可靠而又可兌換的市場信息以至信號market information or signal,因為在傳統教學制度內,學校對學生所提供服務的結果與質素,只有在結業階段的授證評估certification assessment才會揭曉,如英國的GCSE、香港過往的中學會考及現在的中學文憑試等。據此,英國「88教改」首要任務就是制訂並推行全國性課程及全國性評估,後者的政策結果就是,對7歲、11歲、14歲在學學童進行語言、數學及科學(不適用於7歲學童)的標準成就測試Standard Attainment Tests(SATs),並把每個學區及學校的達標率在網上發布。把英國SATs這種建構市場信號的工程,對照於香港的TSA,我們就不難發覺兩者無論在評估內容(標準能力測試)、組織結構(年齡/年級分佈及測試科目),以至效果(發布達標率)等,均何其相似。對學校問責記帳 教育市場化除了確立全國性的標準化成就測試作為學校教育市場化的可靠而又可兌換的市場信號外,戴卓爾政府另一項重要的教改措施就是,力求把學校組織與教學過程也進行標準化及問責/記帳accountable,這種援引自商界企業管理的基準化benchmarking理念,就成為學校教育市場化的另一重要組成部分。據此,英國政府就在1992年成立了教育標準辦事處Office for Standards in Education, Children’s Services and Skills(Ofsted),該辦事處在1994年就委託倫敦大學教育學院的研究隊伍進行一個學校效能主要決定因素的綜論研究,研究結果就認定了11項決定學校效能的重要因素(並再細分為27細項);其後,Ofsted就發展出一套全面的學校表現指標(包含5個方面aspects及17項指標),以作為對學校問責/記帳的標準。對照於香港教育署在1998年推出的表現指標(包含4個範疇、17個範圍、40多項重點,註4),我們又不禁又要追問,為何兩者是如此的相似?具備了對學生成績表現的標準化評估,及對學校組織運作表現的標準化問責/記帳指標,英國政府就可以實際對學校教育制度進行核數/審核auditing。據此,Ofsted就發展出整個質素視學機制。結果,英國大部分學校均被這樣一種產出商品化及經營企業化的核數/審核機制所支配着:每所學校的視學報告都在網上公開,學校的學生成績表現被加以排等(即學校排行榜school league table),最後被標籤為「不及格」的學校failing schools,更被施加各種的整治處分。對照於香港的質素保證視學機制,我們又不難發現,無論在視學內容與步驟上,兩者又何其相像。TSA是教育企業化重要組件從以上的比較分析,對照與前宗主國英國的學校教育質素審核機制,我們就更明白,TSA根本就不是一個孤立的評估政策,它是學校教育市場化及企業化的一個重要的組件。當在這樣一個質素監控與審核政策的傳遞鏈delivery chain(註5)的最底層的家長及學生,在網上發聲,訴說他們所承受的壓力與不滿,我個人認為他們的感受絕對是真實的,更不是個別官僚或學者一句「低風險」所能打發過去;同時,亦是負責任的香港教育工作者必須細心聆聽、面對並切實作出檢討!註1:見侯傑泰〈取消TSA 無助減少考試操練〉,2015年10月23日,《明報》,A40,觀點版註2:見2015年11月5日《大公報》,A16版報道。原文為:「參與檢討TSA的學者侯傑泰解釋,全世界有一半學校,都推行成績考核制度。」註3:至於在美國,與香港具可比性的評估政策,本人認為應是自2002年才生效的No Child Left Behind(NCLB)Act(又稱Reauthorization of the Elementary & Secondary Education Act 2002),它規定對全國在學學童(12年內共7次)實施標準評估,並對不達標的學校(慣稱為failing schools)予以「整治」。據此,把TSA與所謂「美國已用近60多年」(即指1950年代吧)的教育品質監察系統作類比,明顯就是張冠李戴註4:有關討論見曾榮光(2011),《香港特區教育政策分析》,香港:三聯書店,第11章,199頁註5:delivery chain是英國教育家及國際企業顧問Michael Barber的概念,見Barber, Michael(2007), An Instruction to Deliver: Tony Blair, the public services and the challenge of delivery. London: Methuen. 他曾任英國教育部有關學校標準的首席顧問,並曾任香港特區教育局顧問。而有關英國全國性課程與評估的政策傳遞鏈對教師與學生及家長所造成的壓力,見Ball, Stephen J., et al.(2012), “Assessment technologies in school: ‘deliverology’ and the ‘play of dominations’ “. Research Papers in Education. Vol. 27, pp. 513-533)作者是香港中文大學教育行政與政策學系客座教授原文載於2016年1月15日《明報》觀點版 TSA

詳情

TSA有效? 與操練無關?

近月在有關全港性系統評估(以下簡稱TSA)的政策議論,政府高官及部分專家教授的評論,除把TSA描述為「低風險」以外,還吹噓TSA是「有效」的評估工具,而且它是與應試操練沒有直接因果關係。本人上周已對「TSA低風險」的言論作出批判(〈TSA低風險?〉,刊12月23日《明報》),本文將對「TSA有效」及「與應試操練無關」的言論加以質疑。TSA不必要不可靠無效吳克儉局長一再公開推銷「TSA有效」(註1)!我敢問教育局做了哪些政策評估研究,以證明TSA的成效?在教育局未有提供確實證據前,且讓我越俎代庖在3個層次來分析TSA的政策成效。在評估全港學校系統層面而言,TSA是確能提供全港系統的數據。但問題就在於即使不實施TSA這種頻密的全民參與的深度評估,我們其實已可以從一些可靠的國際性比較研究,如每3年進行一次的PISA(學生能力國際評估計劃),或每4年一次的TIMSS(國際數學與科學教育成就趨勢調查),得知香港教育系統內的學生在多方面能力的表現,均在國際上名列前茅。再者,即使教育局一意孤行要繼續實施系統評估,則一種頻密度較低、學校及學生參與率較小的隨機抽樣評估已可達到目的。其次,若評估對象是以學校為單位,則過去30年的學校效能研究school effectiveness studies已清楚指出,單獨以在校學生的學業成績,來評估個別學校的效能,根本是不全面和誤導。即使用較複雜的增值指標方法來評估,據英國著名統計學家Harvey Goldstein研究指出,它的信度與效度亦是存在着明顯的局限(註2及3)。最後,若評估對象是個別學生,並希望能及早得知哪些學生在哪些方面的知識或技能出現問題,而加以針對性的教學支援;但要實現這個「良好願望」,正如美國著名教育評估學者W. James Popham指出(註4及5),整個學校制度是必須有一連串的政策配合:這包括對每個學童作全面而深入的標準為本評估standards-based assessment,經分析及闡釋後的詳盡結果就必須交給校方、任教老師,以至家長,並在課程與教學專家協同下,為個別學生施行針對性的支援。據此,敢問局長閣下,你一方面聲稱TSA是為學生拔尖補底,但近日又聲稱不會再向學校匯報學生的TSA成績(註6),則TSA對個別學生學習上的及時支援的目標,是否就無法啟動呢?即使沿用過往TSA政策向學校發放學生成績,其方式亦只有總體成績而沒有不同學能方面的細分,據此,校方及任教老師就根本無法對個別學生給予針對性的教學支援。總結而言,我認為TSA在評估整體學校系統方面根本是不必要的,在評估個別學校效能方面是不可靠的,在評估個別學生學習並加以支援方面是無效的。有高風險評估 才有操練需要最後,教育局長和他的學界辯護士一再聲稱學校操練TSA的現象,原因不在於TSA本身,而在於由來已久存在於香港社會的操練文化(註7及8)。我對這種前因後果的簡單邏輯詭辯,無法苟同。事實是,有高風險評估,才會有操練相關評估工具的需要。若從歷史脈絡視域來解釋,自從1973年取消升中試,並用學能測驗作為中學學位分配的依據開始,專家、官僚就一再聲稱學能測驗是不必操練的,但在高風險的中學學位分配機制下,所有小學就被迫面對一種「囚犯兩難」prisoner’s dilemma,結果就陷入一種雙輸的不斷操練的局面(註9)。專家、官僚每指摘校方作非理性的操練,但卻不知悉是在他們設計出來的政策制度及遊戲規則下,才迫使校方作出其自身的「理性抉擇」。事實上,過去大半個世紀香港教界一直爭取的就正是取消那些高風險的評核試,包括:升中試、中三成績評核試、學能測驗等。事實上,自2000/2001學年取消學能測驗後,香港小學確曾出現短暫的沒有操練的蜜月期。但好景不常,隨着2004年TSA的實施,操練文化就開始死灰復燃,是TSA在煽風點火、火上加油,才導致這一輪操練文化的蔓延。至此,我懇請教育當局,為了香港特區未來公民的福祉,請把這個高風險,在系統評估層面上是不必要,在評估學校效能及學生學習層面上是無效,並對操練文化造成煽風點火、火上加油的惡果的評估政策TSA全面廢除吧。註1:吳克儉言論見《星島日報》2015年12月2日報道註2:Goldstein, Harvey and D. J. Spiegelhalter(1996). “League Tables and Their Limitations: Statistical Issues in Comparisons of Institutional Performance.” Journal of the Royal Statistical Society. Series A(Statistics in Society), Vol. 159, No. 3, pp.385-443.註3:Goldstein, Harvey and Pan Huiqi(2000). The Use of Value Added Information in Judging School Performance. London: Institute of Education, University of London.註4:Popham, W. James(2004). America’s “Failing” Schools: How Parents and Teachers Can Cope With No Child Left Behind. New York: RoutledgeFalmer.註5:Popham, W. James(2001). The Truth About Testing: An Educator’s Call to Action. Alexandria, VA. : Association for Supervision and Curriculum Development.註6:見吳克儉局長在立法會發言,2015年12月16日《大公報》,A16版報道註7:同註6註8:侯傑泰,〈取消TSA 無助減少考試操練〉,2015年10月23日,《明報》,A40,觀點版註9:有關分析見曾榮光(2006),〈從哪裏來?往哪裏去?尋找《教育改革建議》的實徵基礎〉,129至143頁。曾榮光(編)《廿一世紀教育藍圖?香港特區教育改革議論》,香港:中文大學出版社,137至139頁作者是香港中文大學教育行政與政策學系客座教授 TSA

詳情