「後TSA」評估策略:因材施測 因材施教

教育局於2000年推行教育改革,並推出多項評估改革措施,包括嘗試以TSA(全港性系統評估)/BCA(基本能力評估)(以下簡稱BCA)為學校提供教學回饋,鼓吹「促進學習的評估」和「作為學習的評估」,但成效未見彰顯,BCA近年更遭到家長強烈反對。根據PISA(學生能力國際評估計劃)2015年數據,香港中二學生雖然成績蜚聲國際,但測考焦慮卻頗為嚴重:82%學生「經常擔心自己難以應付測驗」;67%學生認同即使「為測驗做好準備」,「也感到非常焦慮」。教育工作者不得不深切反思,並積極尋求解決方案。

目前BCA非促進學習最佳評估工具

BCA計劃的初衷,是透過評估取得回饋,讓教師和學生針對改善策略。但明顯地這個良好原意並未達成,部分教師和家長認為目前的評估對學習沒有幫助,社會上為了BCA的存廢爭論不休。究竟評估回饋怎樣才能對學習有幫助?首先要了解,學習總會有難位及迷思,遇到學習難位時,如果老師能在學生的「可發展區」加以協助,學習便比較容易。「可發展區」是指學生依靠自己的努力所達到的「實際發展層次」,與在他人輔助下所能夠達到的「潛在發展層次」之間的距離。在這「可發展區」內,他人的輔助對學生的發展效用最大。建基於這個理念,促進學習的評估就是要透過評估,找出每名學生的「可發展區」,支援他們的學習。

目前的BCA無論在評估內容或報告形式上,都不是促進學習的最佳評估工具,原因有二。第一,要找出學生的「可發展區」,評估題目的難度要和學生的能力對口,即是在「可發展區」附近。可是BCA的題目卻是以學科的基本能力作目標,所以對某些學生來說太淺,但對另外某些學生來說又太深,無助於找出所有學生的「可發展區」。第二,BCA的評估報告以學校而非學生為單位,而且事隔數月才送交學校,故即使報告提供學校在某些學習單元上的達標情況,卻未能提供針對個別學生的回饋,更遑論促進學習!

建議每6年全港普查加每年抽查

那麼BCA是否毫無用處?那也不盡然。評估數據讓政府掌握本港學生的水平,從而檢討和訂定教育政策。個別學校報告也讓該校教師掌握學生的學習情況,以優化教學。為了協助政府制訂教育政策,筆者建議可仿效人口調查方法,每6年在小三、小六和中三年級,以不具名方式進行全港普查,再加每年抽樣的方式獲取數據。而每年抽查除了以班級或學生作為單位抽取樣本外,更應以「矩陣採樣法」,務求在6年之內,涵蓋評核科目的所有關鍵範疇。此外,更應該公開數據,讓有志者深入研究。

建議6年一次普查是因為普查考核學生的基本能力,即課程最核心的60%,亦是下一個學習階段的基礎。如果很多學生未能達標,則教育當局有責任提供改善良策。再者,今天新知識發展迅速,如果超過6年才檢視一次,稍有差池,香港將遠遠落後於國際。由於普查只涵蓋基本能力,故建議用抽查方法補充所需資料,以助政府檢視整個課程。抽查可以隨機抽樣法,抽取有代表性的100至150間學校,再從各校抽取學生。實際總人數則要視乎評估的學科內容涵蓋多廣、學生於其中的差異有多大。當中也要考慮平衡「收益遞減法則」和「統計檢定力」,人數不需要太多,亦不能太少,以確保精準。

利用人工智能 優化評估系統

BCA並非為個別學生提供回饋之良策。筆者建議政府建構以知識結構作基礎的「動態電腦化適性評估系統」(Knowledge-structure-based Dynamic Computer Adaptive Testing,簡稱KDCAT),讓學校師生自由使用。KDCAT由3個概念組合而成。第一是適性評估,亦即是把一份長的評估卷分成數個較短的小評估,每一個小評估的目的都是為了更加接近受測者的「可發展區」。例如受測者全答錯(對)了在「小評估一」的題目,則系統會另選比較淺(深)的題目在「小評估二」施測;如果答案各有對錯,則「小評估二」的題目難度會相應調節。因材施測,餘此類推。研究發現,適性評估相對於傳統評估,能以更少題目,更精準地推算受測者的能力「可發展區」。把系統電腦化,可即時獲知結果,效率就更為明顯。

KDCAT的第二個概念就是以知識結構作基礎,也就是說如果學生在某一學習領域未達標,那麼他是欠缺了哪些基本能力呢?例如學生答錯了「9-2×4=?」,按照數學知識結構,他有可能是未掌握減法、未掌握乘法,或是未掌握「先乘後減」的規則。依據這些知識結構,適性評估系統就會從題庫中抽取適性的題目在下一段小評估施測,務求找出問題所在,提供對口支援。由此可見,學生毋須如應考BCA般,全體在同一時間考同一份試卷,但仍能使評估起到促進學習的作用。

KDCAT的第三個概念就是動態評估,即是把評估結合學習,邊教邊評,檢視學生對問題的反應,推算其能力水平、迷思與發展潛能。這個過程可運用智能學習系統輔助,以減輕教師的工作量。

要注意本文絕非鼓吹以KDCAT取代BCA,而是建議把它優化。其實BCA早於2003年已將電腦化適性評估系統納入計劃藍圖內。而且,目前的BCA已經建立了兩個良好基礎——(1)BCA系統內有堅實的知識架構:系統內的基本能力,以及能力之間的連繫,是當年各科前線教師、教育局課程發展議會專家和大學教授合作發展而成的;(2)BCA系統內已有一個龐大且經過驗證的題庫。好好地優化題庫,例如刪除或改寫不良的題目,是建立KDCAT的第一步。KDCAT不過是在這兩個良好基礎上,利用人工智能帶來的機遇,優化系統,讓BCA回到以評估促進學習的原點。

BCA在檢討和制訂教育政策方面有其功能,但指它「能為個別學生提供學習回饋」實屬過譽。相比,KDCAT透過知識結構,以較少的試題,更精準地推算學生目前的水平以作出即時回饋,再按評估分析,結合知識結構,診斷出學生往後的最佳學習路向和方法。如果在這過程中,能一併收集有關學生的數據,包括學習成長歷程、校園生活、學習心理等,就更能為每名學生建立個人化的學習路線圖。由此可見,建基於因材施測的因材施教才是香港評估改革的出路。

作者是香港教育大學評估研究中心總監

文:莫慕貞

原文載於《明報》觀點版(2017年4月20日)