遇和不遇

人生世,總在遇和不遇之間。作為退休理科教師,我們遇到同好者一起寫博文,同一議題,可各抒己見,有時會遇到教過的學生、共事的老師、久違的上司,什麼樣的熟人、朋友,什麼樣的男人、女人,全不由我們做主,卻決定我們的電腦瀏覽器博文和瀏覽的博客以前在學校工作,如果工作順利、生活幸福,某一天早上醒來,我們會感謝命運,讓自己在那些重要的時刻遇到了合適的人,可能是同事的幫助,勤奮的學生如果某日諸事不利,那麼,會遇到倒楣的事情,忘記帶教具,忘記這,忘記那。生命是一個漫長的過程,佔據人一生大部分時光的,是他的職業生涯,平時人們常講的遇和不遇,也多指工作和職業中的遭際。退休後遇到的,多是舊同學,興趣相似的羣組,在談天說地之際,偶有佳作,不想輕易忘記,乃存之於小方塊中,給遇和不遇的博客觀賞,如此而已!

2025年3月26日 星期三

測評:答問式、表現式、生成式

上文探討了AI進入教育中,學生與AI互動可以產生一定的效果。這些可能性並非我的憑空臆想,而是來自現實中前線教師的實踐。疫情以來,不少學校實施並作出評估,主要是華人社會,無法否認,教育的智慧在前線。也可以說,看到的許多例子,驚嘆之餘,其實是任何教師,甚至家長,都可以付諸嘗試的。

前面提過,把學習還給學生,其中一個要點,就是把學習一個單元的起點移給學生,讓學生從一開始就擁有這個學習過程。這也合乎現在流行的設計思維(design thinking),學習的旅程,一開始就由學生自己出發。測評,則可以說是一個單元學習的終點,也是早前作出的介紹。

與測評「孿生」的是學生作弊。兩年多前ChatGPT面世之初,美國的大部分大學都忙亂了一陣子,不少還禁用。在基礎教育,當時幾乎全美的校區都禁用。禁用,就是怕學生靠AI代筆、抄襲、作弊。教師給的分數,也許是給了機器。這種恐懼,關鍵不在AI,而在於考試這個概念──學生的角色是「答問」,處於被動受考的一方,只准以自己腦袋裏面的「庫存」作答。

測評既存 作弊孿生

前數月參觀南京的國家科舉博物館,看到科舉時期員生進入考場,要經過非常嚴密的搜身檢查,就是防止作弊。之前在四川閬中貢院所見,考試作弊者若遭揭破,會五花大綁送官究治。雖然如此,全國的考場舊址,都會展出種種作弊「罪證」。留下深刻印象者,有整件內襯衣寫滿蠅頭小楷,有用鼠鬚寫下超微型小字,有飛鴿傳書……不乏創意,令人驚嘆。忽然觸動:為什麼有「作弊」這回事?

現在還有不少輿論,把AI的教育運用,聚焦在防止抄襲、分辨「真偽」。其實這是把現存的測評概念,作為框架──學生只能用自己個人的努力,學生不能借助其他外人的知識,學生之間不准有溝通,學生必須限時完成答卷等等。事實上,現在中小學的測評,大都是紙筆考試,學生是允許攜帶手機的;即使是高等院校,若有紙筆考試,也是如此。請想一想:假如允許帶手機或電腦,這個考試機制就會崩潰。這裏面是否有些亟待解決的矛盾?

但是許多高校的測評,已經不用紙筆在「監考」的情況下考試。或則「開卷考試」,也就是允許學生參閱書本(一般在家)完成作業;或則採取「表現式」,即學生可以採取任何表現形式,表達自己的學習所得,或者是小組集體創作或製作。這種情況下,「作弊」就不再是問題,也就是說:「作弊」沒有了存在的基礎。就是鼓勵運用他人知識,鼓勵學生交流溝通。說得涼薄一點,就是鼓勵傳統意義的「作弊」。

早前一位舊同事介紹攝影軟件的「生成」功能,使用 Photoshop 中有生成式 AI,用家就能創作出自己所能想像的一切。使用「移除干擾項目」,快速刪除不想要的元素,像是電線和人物。使用迄今最先進的「生成式填色」功能,增添豐富詳細的元素,並無縫地融入場景中。使用「生成式擴張」功能,擴張任何影像。 

教中學時,曾經當環保學會導師,負責帶中一同學做一個五人小組的project 要他們 踐環保的理論,然之後付諸實行,再作出「生成」報告。在哈佛有兩則與不同主題的project報告有關,一名實習學生,同時是黑人執業律師,她的「產品報告」愈寫愈長,結果是一本不太薄的書,專門給黑人孩子的法律入門。另外一名實習學生,美國人,是一本印度的寓言故事書;別致的是,故事內容、話語、語氣都反映印度文化,封面的設計、書的釘裝,用的都是印度傳統;原來是她與前度印度男友的紀念之作。

表現成果 擺脫分數

在港大,有一個小組製作了一個「文化之旅」的兒童遊戲,也有製作宣傳尊重文化差異的海報。有一名學生,用一隻精美的錦盒載來一束書信,是記錄她與法國男朋友從交往到分手,前前後後兩人之間的文化張力。當然學生還是可以選擇寫一篇傳統的論文,也帶來許多新鮮的觀點,精采紛呈。 

「表現式」、「生成式」作為學習一個單元的「終點」,已經離開了原來「測評」的概念,其特點是學生需要消化學習所得,設計和製作一件產品,以自己印象最深的,花心思融入一個製作。那學習過程是非常豐富的,遠遠超越回答教師設下的特定問題,又或者按照一定的評分標準寫成論文。他們往往是把學習所得發揮了、擴展了,反正真正成為了自己的東西。作為教師,也是把學習還給學生,而不是拘泥於學生是否可以達到自己的標準。

中小學也不例外。最近訪問內地一所學校,文學與語文,每周有一個詩會,高中學生以戲劇化的朗誦表達他們學過的詩;我在現場,聽到3位剛轉校入學不久的學生為詩會作的序言:「我們也念過很多詩。現在才知道念詩不是為了考試!」(大意)

以上的「表現式」還沒有用到科技。香港一位教師,在小學五年級介紹了AI的運用,讓學生選一種表現形式來表達自己學習所得──一段短片、一封信、一張海報、一個故事、一首歌。例子:一名學生就讓自己的想法,運用AI寫成一首詩,再用AI譜成一首饒舌歌。

另一位香港教師,也是小學,結合科學課──探月,一名學生製作了一段卡通片,模擬登上了月球的太空人,遇上了嫦娥,邀請她回去地球,被嫦娥婉拒了,裏面的內容、畫面、器具、動作、對白,都有科學根據。

過時觀念 勢被顛覆

當我們看到這些而興奮的時候,馬上會想到一些需要解決的問題。例如,「表現式」的學習成果固然可喜,但是學生百花齊放,卻難以評定,更難以評級,因為難以給分數。上述的「表現式」「測評」難以評分評級,讓我們思索:評分評級,為了什麼?

在傳統的工業社會,人類給分配到勞動力金字塔的各層各類,教育就承擔着把學生分類分等的職能。這種職能,會不會因為社會變化而漸趨過時?在現代社會,即使是教育把人類分類分等了,人們的一生,愈來愈不遵循教育給予的社會身份。社會變了,教育需要盡快適應。所以,「測評」的「評」,在鼓勵學生自主學習,而學生的生成品朝着不同方向發展的時候,我們如何才算對學生的學習成果認可?這需要完全不一樣的理念,也許是理念上的顛覆。

成績表,是測評結果的典型總結報告。傳統的成績表主要是分數,各科的分數,再加上「操行」的級別。幾十年來,成績表已經有了不同的演化。有些在分數之餘、或者代替分數,寫上對學生在各方面表現的評語。有不少成績表還包含學生課外活動的表現,也有比較詳盡的對學生總體評語。最近香港起碼有兩個組織推出了比較全面的新型「成績表」,不是以成績為主幹,而是以學生能夠達到的能力為主題,相信會受到許多校長和教師的歡迎。因為這一方面可以比較全面地涵蓋學生努力的結果,另一方面若形成風氣,也可以紓解家長因為看不到分數而產生的憂慮。這雖然還不是比較徹底改變「測評」的觀念,但卻走了一大步,擺脫了純粹依賴分數。

這也許只是冰山一角。人們往往注意AI帶來人類具體活動的挑戰,但像AI對測評的衝擊卻不是用新的方法、新的機制可以解決的,它需要理念的改變,總體的反思。這樣,AI才能幫助人類走進教育的新境界。

沒有留言:

張貼留言