TSA存廢的爭議:回歸政策研究的討論

今年1月23日吳克儉局長宣布,經「優化」的2016年小三全港性系統評估(下稱TSA),將由2016年的約十分之一學校抽樣評估,推展至今年5月全港在學的小三學生均需應考。雖然吳局長聲稱今年的評估不是「全面復考TSA」,但不爭的事實就是全體應屆小三學生仍然是需要在5月應考TSA!但其後,3名特首參選人(曾俊華、葉劉淑儀、胡國興)卻先後宣布或重申應取消TSA!至此,一個原本屬於教育評估政策的討論就漸漸演變成特首選舉工程中的政治議題。與其在政策辭藻(policy rhetoric)上爭辯教育局是否「全面復考TSA」,又或在特首選戰中爭議TSA應否取消,本文將實質地從政策論據(policy argumentation)出發,以審視教育局是否具備充分的理據以支持「全面復考TSA」的政策行動,同時各特首參選人又是否對取消TSA的政綱,作出了充分的論證。

在政策研究領域中,對一個公共政策存廢的檢討及評鑑,一個通用的方法就是探討(1)該政策是否能實現它既定的政策目標?(2)它是否帶來極其惡劣的後果?簡言之,就是成效與代價的分析(cost-effectiveness analysis)。本文將在這兩方面探討TSA存廢的爭議。

未實現回饋教與學及補底功效

教育局一再強調設立及繼續實施TSA的主要目標就是它能「回饋及促進教與學」,即可以做到當年教改所宣傳的「補底」。要回答這個問題的最實在的方法就是檢視已實施10年的TSA的效果。個人認為,根據考評局公布過去10年的數據,正好證明TSA是未有實現回饋教與學及補底的功效(註1)!根據考評局公布的追蹤研究數據(註2),過去10年參與小三TSA的6屆學生中,不能達標者,在繼後小四、小五學習中得到教學回饋以至補底的比率一直沒有改善,甚至每况愈下。首先,考評局公布的數據顯示,在中、英、數3科,小三不達標至小六仍未達標的學童,中文科始終維持約10%,英文科的相關比率維持約16%,數學約8%,沒有任何改善。其次,小三不達標至小六得以達標的學生比率,即正好證明10年來TSA的回饋及補底功效的比率,卻不斷下降:中文科由2004至2007年的5.1%不斷下降至2012至2015年的2.3%(降幅為54.9%);英文科的相關比率是由5.1%下降至2.8%(降幅為45.1%);數學科是由4.7%降至3.2%(降幅為31.9%)。簡言之,TSA的回饋教與學及補底功效是十分微弱,而且更每况愈下。至此我不禁質疑,當局仍宣稱TSA能有效回饋教學及補底的功效,是否只是一派胡言?至於去年實施的「優化」小三TSA的成效則有待3年後小六TSA成績才有分曉,但現時教育局就憑「部分」持份者的即時印象,就宣布大功告成,是否言之過早呢?

成績沒下達個別學生能力層面

其次,若從政策文本及具體政策措施安排去分析,本人更加質疑,TSA作為整體學生基本能力評估(下稱BCA)政策的一部分,其主要目標根本就不是提供回饋教與學的「進展性評估」(formative assessment)的功能。根據有關評估改革政策文本所載,整個教育評估改革可分為回饋教與學的「進展性評估」與量度成績的「總結性評估」(summative assessment)兩個度向;在政策文本中,TSA根本上就被歸類在「總結性評估」的度向下(註3)。

據此在政策推行上,教育局才會把TSA的執行工作「外判」予考評局這個慣於實施量度成績的「總結性評估」(如過往的中學會考、高考或現行的中學文憑考試)的機構執行,亦因此在過去TSA結果的發放,亦只停留在達標或不達標的「總結性評估」結果的形式;而且其成績,更只停留在全港系統及個別學校層面,根本就沒有下達至個別學生的特殊能力層面,更遑論對有關學生的有關能力作任何學習活動上的建議與支援(註4)。

指鹿為馬的政治伎倆

第三,若進一步檢視教育當局不斷宣傳為教師提供的所謂「專業支援」,包括過往為教師提供的TSA工作坊,或現時「優化版」的「專業支援」的實質內容,我們就會發現這些「專業支援」只停留在「試後檢討」層面,如考題分析、答案(對/錯)分佈及分析、「陷阱位」等,而不是前瞻性地探討如何協助未達標的學童在繼後學習上提升不達標部分的能力。據此,不少老師回到學校就只會向來屆應考的學生提點,以避免重蹈師兄姊們的覆轍。結果就大大增長了一種「為評估而教學」(instruction for assessment)的教學文化,而非「進展性評估」所追求的「為學習而教學」(instruction for learning)。因此,無論從政策文本內容及其後具體政策實施,我們都無法接受現時教育局把TSA認同為回饋教與學的「進展性評估」的說法,這樣簡直就是指鹿為馬的政治伎倆!

最後,若真正回歸到2004年教育評估改革整體方案本身,除了TSA以外,評估改革方案中還有另外一個政策措施,是專門負責在學校內推行「進展性評估」及回饋與促進教與學,這就是與TSA同時推行的BCA機制——這個以學校、教師以至學生為本的網上評估及教與學支援平台,已運作了10年以上。

勿因噎廢食把TSA/BCA一刀切廢掉

至此,本人懇請負責官員不要再混淆視聽,TSA在過去10年根本就沒實現過回饋教與學的「進展性評估」的功能,因為它的設計原意就是以「總結性評估」為主,而非作為「進展性評估」。與此同時,當各特首參選人在考慮TSA以至BCA的存廢時,亦請從2004年已開展的整體教育評估改革框架去考慮「總結性評估」與「進展性評估」之間的平衡或取捨作考量,不要因現政府及官員在政策實施上的失誤,就因噎廢食地把TSA以至BCA一刀切廢掉!

在這一輪TSA(全港性系統評估)的爭議中,教育局支持「全面復考TSA」的理據,除了聲稱它能發揮回饋及促進教與學的效能外,另一理據就是,經「優化」的小三TSA(教育局改稱為「BCA」(基本能力評估))已經把過往TSA所導致的操練壓力予以消除。前文已論證了,過去10年TSA根本未能實現它既定的政策目標——回饋及促進教與學。本文將進一步探討,過去10年TSA所導致的惡果——操練文化及壓力的蔓延及激化(註5),是否在這為期不到一年的改革(以去年2月檢討委員會報告書發表計起)就得已消除。

公眾不信任不可能因一紙約章就消除

首先,我們不妨檢視所謂「優化」措施為何。吳克儉局長就列舉了「改良題目設計、優化學校報告、加強專業支援和加入學生問卷」,並繼而強調「有關持份者包括校長、老師、學生及家長反應均很正面,認為有助去除操練誘因」(註6)。有關措施是否真能消除操練的誘因,似乎言之尚早;但可以肯定的是吳局長是忘記了這一輪TSA改革,尚有兩項至關重要的措施。

其一就是,教育局已接納TSA檢討委員會建議,把TSA成績(達標/不達標)從「學校表現評量」23項中剔除出來。這正好顯示教育當局終於肯面對現實,承認TSA是過往壓在學校頭上的整個「學校質素保證機制」的審核問責工具的一部分,並且願意把TSA這被詬病為「架在學校管理層頸項的一把刀」(註7)拿走。然而,有關政策建議是否真正能切實執行,仍有待觀察。事實上,在這一輪爭議中,明顯存在的就是公眾與政府之間的不信任,這種可以說已累積了10年的「低度信任」文化(low-trust culture),自不可能因一紙「不操練約章」及官員背後一眾的舉牌動作,就得以消除。

所謂操練壓力消除 有多大現實意義?

其二則是,這一屆小三TSA的規模只涉及約十分之一的小學(56間),其中更有部分學校是自願參與,因此無論在規模及參與形式均與過往「全民強迫參與」,不可同日而語!因此所謂操練壓力的消除,究竟有多大的現實意義,仍有待當局提出更確實的證據來加以證明。但現時吳克儉局長就只憑「部分」持份者即時印象式的反應,就斷定今年可以「全面復考TSA」,明顯令人有「草草收工」的感覺。

事實上,若把以上兩項政策措施結合起來一併考慮,我就會有以下兩項質疑:其一,既然TSA成績與「學校表現評量」已經脫鈎,則TSA對個別學校層面的評估功能就已不適用,那麼為何還要全體中小學參與繼後的TSA?單純就全港性系統層面的評估而言,一個具代表性、以學校以至學生為抽樣單位的抽樣評估,不就已經足夠了嗎?其次,既然2016年小三的TSA已採取約十分之一小學的抽樣方式作評估,而且考評局更在《2016年全港性系統評估報告》中已斬釘截鐵地強調「本局運用了統計學方法」,「確保有關的評估具有代表性、信度和效度」(p.10),則我就更要質疑:為何還要全體學校及全體小三以至小六及中三學生參與每年一次的TSA呢?

據此,我認為教育當局根本沒有必要在各種改善措施只局部地(在小三一級)實施一年後,就急不及待地「全面復考TSA」。事實上,根據近年有關公共政策實施研究的一個廣被接受的定論就是,公共政策實施、扎根以至奏效是一個複雜而漫長的過程,其中各持份者更要經歷學習、適應、協作、磨合的過程。例如美國著名政策實施研究學者Paul A. Sabatier就提出,一個公共政策的落實以至產生變革就最少需時10年(註8)。對照於檢討中的「優化」TSA政策措施,竟可在僅僅不足一年時間,就可公布天下大功告成,可「全面復考」,就明顯草率了一點。這若非出於負責官員對政策研究的無知,就是他們只在把弄着虛應故事的公關伎倆。

實在沒必要強迫全民參與

最後我懇請有關問責及負責官員,請認真深入檢討及研究TSA這個實施了10年,每年影響逾10萬小三、小六及中三學童學習以至福祉的政策。根據以上分析,我會建議當局必須認識清楚,發展至今天,TSA就只是一「總結性評估」工具,其評估範圍更只限於全港系統性層面。據此,它實在沒有必要強迫「全民參與」;一個具代表性的抽樣評估已可以提供可信而有效的結果。因此我第二個建議就是,今年的TSA應繼續沿用十分之一學校樣本的方式,並擴展至小六及中三,以驗證2016小三抽樣評估的「具有代表性、信度和效度」結果,是否可以延續及拓展至其他年級。若然,這就更加可以證立沒有必要急急「全面復考TSA」了。本人的第三項建議就是,循着減少學校操練的誘因去考慮,另一個實際可行的改革方案就是把現時小六已實施多年的「隔年評估」措施,擴展至小三及中三,這自然可再進一步紓緩學校應試操練的誘因及壓力。

回顧2004年開始的教育評估改革,設計上本來就是包含有「總結性評估」與「進展性評估」,其目標更是力求扭轉一直以來香港教育制度中只強調成績量度的「總結性評估」的局面,並引入「進展性評估」。但10年過去,這個本屬「總結性評估」的TSA 在與「學校質素保證機制」相互作用下,已異化成「一把架在學校頸上的利刃」的一個審核及問責的管治工具。結果,就把「後學能測驗」時代的香港小學再次推回到應試操練的深淵。

請特首參選人慎重考慮TSA存廢

就此,本人充心懇請負責官員能把TSA這個只量度系統層面表現的「總結性評估」工具,放置回它應有的位置,並可以把它的廣度(只涉及十分之一學校)與密度(隔年輪換進行)降低。同時,又切實推廣已運作10年的BCA網上評估及教學支援平台,這方面的以教師及學生為本的評估工具才是原先設計的「進展性評估」。唯有當這兩個評估政策工具各歸本分,香港的教育評估改革才有望得以實現。同時,我亦懇請各特首參選人應從實施了10年的教育評估改革的整體政策框架出發,慎重地考慮TSA的存廢,以避免把嬰兒連同浴後污水一併拋棄掉了。

註1:更詳盡討論見曾榮光(2016)〈《全港性系統評估檢討報告》的批判:政策評鑑研究的視域〉,《教育學報》第44卷第1期,頁195至212

註2:同註1,見表1

註3:同註1,見圖1

註4:有關「進展性評估」與「總結性評估」在概念區別及在英美的政策爭議,見註1的討論

註5:有關TSA導致操練文化及壓力蔓延及激化,見曾榮光(2016)〈《全港性系統評估檢討報告》的批判:政策評鑑研究的視域〉,《教育學報》第44卷第1期,頁195至212

註6:新聞公報〈教育局局長與傳媒談話內容〉,2016年12月8日

註7:同註5,頁203

註8:Sabatier, P. A.(1993). “Policy change over a decade or more.” In P. A. Sabatier and H. C. Jenkins-Smith(eds.). Policy Change and Learning: An Advocacy Coalition Approach. Boulder: Westview Press.

文:曾榮光

作者是香港中文大學教育行政與政策學系客座教授

原文載於《明報》觀點版(2017年2月14及15日)