2023年4月24日 星期一

考試!考試?

近日DSE已開考,打頭陣的是英文科。今年是最新試題更新,究竟出試題者是來自AI助手抑或仍然是以往的考官?要探索的話題還有許多,但是流行的話題,發展得很快;文章可以談的,也許已經是幾個星期前的過氣話題,難以追趕。有朋友說:「難以跟得太貼!」一些教師已經在用付費的GPT-4,還有人在試用許多聊天以外的軟件,也有人開始使用中國內地研發的生成式AI工具。「追趕」已經不是一個適切的用詞。

生成式AI發展的速度,包括研發、推廣、使用、討論、反思,是驚人的。我一直覺得,學術界很重視發表與出版,而且成為學術生涯的重要支點,但是要寫成出版一本書,起碼要幾年;學術期刊,傳統的出版周期,大概1824個月;討論的東西,也許已經成為歷史。聰明的作者,或則選擇一些難以過時的話題,或則挑選一些鮮會有人會過問的話題,才可以逃過「陳舊」的命運。

在社會科學與人文學科,尤其如此。科學和工程的論文發表周期,稍微好一點,因為往往有爭奪知識產權與專利註冊的因素。COVID的出現,因為要應急,研究的新發現,只要是與疫情有關,一兩個星期就得到發表,出現了新的發表短周期。現在ChatGPT的傳播速度,又是新的一種速度,也是全新的平台。不知不覺之中,也許是元宇宙的一種形態吧!

生成式AI的應用,在教育以外,似乎存在已久。大體來說,引起注意,是它對人類的模擬,到了一個新的水平。因此,「取代人類」的恐懼,也許是引起熱烈討論的潛在原因。其中,因為生成式AI,不像上一代的機器人,主要取代人類操作性的「藍領」活動,從掃地、抹窗,到工廠流水線的加工,都是預先設好程序的「自動化」。而被取代的「藍領」人類,是沒有多少發言權的。


機器智能 進犯白領

加進智能的元素,1997IBM的深藍電腦戰勝了當時的國際象棋棋王,2016AlphaGo戰勝世界圍棋冠軍韓國李世乭,人們開始認識到,機器是可以學習的,雖然學習的還是人類,是人類輸入了三千萬棋步;但是機器的速度與記憶量,卻可以超過人類。但是首先是可以模仿人類「隨機應變」的本領。機器不需要全面模仿人類,例如智能停車場、自動駕駛的汽車,它們只需要學會人類的某種本領,輸入足夠的數據,就能夠替代人類,雖然也只是替代人類的某個方面。

但是ChatGPT之所以震撼全球,是因為它進犯了人類「白領」的活動範疇。是向知識分子開戰,而知識分子,是很能發聲的。早前提到,美國ABC電視台與研發ChatGPTSam Altman 對質,記者關心的取代人類工作,也許不是關心流浪紐約街頭的失業者,而是大量被迫離職的低級律師、會計師、銀行從業員。ChatGPT雖然成為「聊天」工具,但是它可以生成的,遍及幾乎所有涉及文字的「出品」。而白領的生涯,基本上是靠文字。有些文字規格比較嚴格的行業,例如法律、會計,反而成為AI工具施展拳腳的最佳領域。就教育而言,前提到的學校行政文書,其實不屬於教育範疇,只是屬於行政的必須,因此也容易被機器替代。

教育範疇還有不少是容易被機器替代的,例如大學的項目申報書、晉升申請書,只要給予詳盡的「指令」(prompt),對出品加以修輯,就能得心應手。這些,都只能說是把人手的文字工作簡化了,負擔減輕了,時間節省了。

教育擔憂 在於考試

而目前最引起關注的,是教育。就目前我看到的香港教師的努力所及,備課、出題、批改,都可以要AI工具代勞,輕而易舉,也是屬於減輕負擔一類。不會引起巨大恐懼。

最大的恐懼,是學生的表現。理由是,加入學生都用AI工具了,就無法測到學生的真正能力。這就涉及學生成就的測評問題。簡而稱之,也就是考試。

最根本的問題是:為什麼要考試?我們馬上會說,不考試,怎麼知道學生學得怎麼樣?但我們不妨追問,我們希望學生學到什麼?我們希望學生學的,就是正規課程的那幾個科目(學習領域)嗎?一名學生從幼兒園到中六,他們的所學,就是校內外考試所考的嗎?想知道學生學得怎樣,是一個良好願望。那也許就是學理上的形成性測評(formative assessment),是協助學生學得更好的。但是,就算是平日的作業,我們的注意力,往往還是學生的對與錯;學生的注意點,也是分數;實際上變成了漸進式的總結性測評(summative assessment)。在華人社會,考試最終還是擇優、淘汰、分等……是為教育的社會功能服務,而不是為學生的學習服務。

這裏舉幾個反例

一、韓國在2016年開始,全部初中3年,必須有一個學期不考試,稱為「自由學期」,在這個學期,與社會各方面合作,引入大量的體驗學習。

二、新加坡從2020年起,取消小二生的年底考試,以及小一和小二的所有計分評估,校方只通過平時課堂作業、活動或小測,了解學習進展。另外,取消中一生的年中考試,並逐步廢除小三、小五和中三的年中考試。教育部長說,目的是降低對學業成績的過度偏重,減少學校計分測驗與評估考試次數,好讓校方得以騰出更多時間,展開互動性學習項目,更全面地栽培學生。

從以上兩個例子看,考試的確是妨礙學生全面發展的一道關卡。最直接的做法,還是盡可能減少考試,讓出空間,讓學生有更寬廣的學習天地。

輔助學習 有何不可?

三、香港二十多年前的教育改革,其中深受國際矚目的,是把原來的三個公開測評──升中的學能測驗、中學會考、高級程度考試(AL)──改成一個,也就是DSE。這就把小學與初中釋放出來了。但是,目前小學還要「交分」,成為小學普遍的考試壓力。相信考試的,一定認為這是必須的。但這只是公開的測評。校內的種種測評,其頻率與強度,仍然在妨礙着學生的生活。於是要問,假如允許學生用AI工具輔助作答,也要求他們公開整個過程。有何不可?

四、一個大學的例子:程介明教授在哈佛教學的時候,深受同事John Willett(港大舊同事,也是港大碩士的師兄)的啟發。他教的是量化分析研究生課,美國學生都覺得難,但是他一個原來18人的班,可以引來近200人。

他的做法,在作業的繳交日期之前,學生可以無限次預交,他會逐一提供修改的建議,務求學生的作業達到最佳水平。我們對待AI工具的使用,不也可以如此嗎?

五、再說,博士生做論文,導師的取態,不也是一樣嗎?不只是個別輔導,還提供種種建議、資料、批評,目的也是希望學生的論文能夠做出最佳水平。真個是循循善誘,那是輔導博士論文的常態。這裏面,博士生採取了什麼參考材料,引用了什麼人的文章,導師應該非常明瞭,學生也要申明。在這些參考與引用之中,也有ChatGPT的貢獻,也申明了,又有何不可?這與抄襲、欺騙、作弊,完全拉不上關係。

我認為:假如把學生困在抄襲、作弊……的層面,他們就會停留於,迴避、懼怕、偷摸、取巧的心態。AI工具就會成為籠罩他們學習生活的一片不可捉摸的烏雲,成為AI工具的被壓迫者、受害者。他們就不會成為積極的、自信的使用者。

沒有留言:

張貼留言