2023年3月15日 星期三

間中「死撐」的AI

試用ChatGPT一輪,比較放心的是用它來整理和改進教材,借鏡它扼要簡明的表達方式。內容不能靠它,不是它沒有搜尋的能力,而是不知幾時它會插入信口雌黃的內容。如果被識破不懂裝懂,有時它很快調整,但也有「死撐」的時候。

這天問它:「英國間中會調查醫生對安樂死的意見,是誰主辦?結果為何?」它提供有紋有路的概要,不忘附加一句,調查結果會因提出的問題和樣本而異。這很不錯,但舉的例證令我生疑,說「皇家內科醫學院在2019年進行的一項調查發現,77%的成員認為,醫療專業人員應該可以合法地為符合條件的患者開藥以結束生命」。我想,這不大可能:沒有這麽大比例的英國醫生贊成處方藥物協助病人自殺。

我提醒,你會不會弄錯了?就我所知,英國相關的調查結果通常是醫生贊成和反對安樂死合法化的比例相若。它說沒弄錯,更辯稱有些醫生個人不介意處方,只是反對醫學界作為一個整體支持安樂死合法化。

查看資料後再質疑,它仍不肯認輸,我直接請它提供資料來源,它才軟化,表示歉意,說自己是AI語言模型,無法搜索特定的參考文獻或來源。

再問,英國皇家內科醫學院只有不到一半的醫生認為醫療人員應該可以合法地為病人開藥以結束生命,不是嗎?它終於退讓:「我不確定確切的統計數據,但在英國,醫療專業人協助病人死亡是非法的,因此圍繞這個話題的討論往往是有激烈爭議的。」



除了關心醫生對開藥的做法外,教育界亦亦開始「擁抱ChatGPT」,借助其出題目、出通告等。天水圍中華基督教青年會小學更利用ChatGPT進一步開發AI教學平台,協助教師更快完成批改作文,以及改善學生英文發音等。程校長冀盼透過新平台刺激教育界思考運用新科技,強調「AI與老師定位並無衝突」,相信兩者可分工合作,日後甚至有機會放手給AI直接批改作文。

AI改作文 自動檢查錯處、給予評語

利用ChatGPT技術進一步開發AI平台,設有4大功能。其中2項包括批改學生中、英文作文,當學生透過平台提交作文後,平台會自動檢查錯處並給予評語回饋;現階段學生無法即時看到AI評語,會先交由教師檢查及修訂,再發還給學生查看評語。

 中華基督教青年會小學與網上學習平台合作開發AI平台,有助教師批改作文。

另外兩個功能分別是按個別學生能力生成數學題;以及改善學生英文發音的「Read Aloud」功能,按照學生英文錄音,推測其在國際英語水平測試雅思(IELTS)得分。平台試運34周,上周起分別將不同功能開放給高小以至全校學生在課堂上試用。

教師會否被ChatGPT取代?程校長強調「AI與老師定位並無衝突」,相信兩者可分工合作。他引述教師反映,AI可批改作文錯字、文法、標點,以及上下文理通順與否等,「AI首階段批改精準,甚至較老師精準,少了人為錯誤」,但寫作情懷較遜色,評語亦較「大路」,有時亦會借辭「死撐」;因此教師可給予「更優質回饋」,例如建議加入適當形容詞,以豐富文章。另外源於AI有較多英文數據支援,故AI批改英文作文能力較中文為佳,批改中文因不懂「死撐」時有機會「hang機」,放棄繼續批改。

惟倘平台日後收集更多學校的大數據,程校長預料,AI評語會更豐富精準,該校亦會再檢視學習效能,他更大膽推測︰「將來有機會放手給AI直接改文,讓學生直接查看AI生成評語。」

事實上學校教師目前主要利用ChatGPT備課,包括出題目,以及課題解說,直言資歷較淺的教師解題未必清楚,ChatGPT則可提供更詳盡解釋;個別科目教師更曾在課堂上,向學生親身示範如何向ChatGPT提問、如何過濾錯誤資訊。

ChatGPT即將推出數據庫大1萬倍的新版本,此外,解難力遠勝ChatGPTGPT-4也推出了,最大特色是可以輸入圖片,讓AI來解讀或生成新內容,解答能力和正確率大幅超越了3.5OpenAI正式推出了GPT-4模型,最大特色是不只文字對話還能輸入圖片,讓AI來解讀,而且解答能力和正確率大幅超越了GPT-3.5,也更能控制GPT輸出人設來符合企業想要的的形象,輸入Token數量也將大幅增加到32,768個,相當於50頁文字。目前先開放了文字輸入API功能,ChatGPT Plus付費用戶可優先排入試用新版。圖片輸入功能目前則只開放給特定合作夥伴。

GPT-4是一個多模態AI超大模型,可接受圖片和文字輸入,來生成文字的回覆,可以提供人類等級的回答內容。Open AI花了6個月時間,利用ChatGPT和其他多項對抗式測試計畫來調整,終於打造出答案更真實、更可操控和更能防範濫用的新一代GPT-4雖然GPT-43.5版的訓練資料同樣都只使用到20219月為止的開放網路資料,但是4.0再多項傳統機器學習能力評比上,都超越了3.5版。

不只是文字模型也是視覺模型,可同時輸入圖片和文字而生成文字解釋

除了答題能力更正確之外,第4版最大特色是能看圖,而且可以同時輸入指定圖片和圖片,GPT-4會以文字來解釋圖片內容,並且符合文字任務的要求。輸入的圖片可以是照片、圖表或螢幕解圖。未來,GPT-4還將持續強化解圖能力,例如可以輸入多組圖片範例,或是提供分解動作解釋的解圖(chain-of-thought)能力。

另一個值得注意的新版特色是操控性(Steerability),可以透過人設指定,例如回答的用語、風格、語調等條件,來限制GPT-4的回覆行為。例如在API中透過system角色,要求GPT-4扮演不能直接回答答案的的數學課輔老師,在展示範例中,不管,學生怎麼問,或者試圖透過特殊指令試圖越獄,也都無法得到直接的答案。這個新功能可用來限制和控制GPT-4所能回答的限制,可供企業用來設定想要GPT-4回答的內容範圍,或者禁止回答的內容。

為了防範AI模型遭到濫用,OpenAIGPT-4模型中也特別針對AI濫用或不當使用進行強化,目前實測上,gpt-3.5-turbo對敏感指令(例如違反倫理的指令)的攔截失誤率超過40%,但GPT-4可以降低到20%出頭,等於5次會誤判一次,或不良行為指令的阻擋失誤率更不到5%(例如犯罪行為教學等),例如禁止生成色情或犯罪相關的內容。

Token數量增加8倍,最多可輸入32768個,等於2萬多字中文

GPT-4API中另一個企業用戶在乎的新功能是輸入Token的上限,最大放寬到32K,比GPT-3.54k,多了8倍,達到32,768Token之多。以每千次中文約700Token來估算,32kToken等於可以輸入超過2萬字中文的內容。不過,目前開放的GPT-4版本只提供8K版本,也就是比原本3.5多了一倍,達到8,192Token32K版引擎目前先開放特定對象試用。目前GPT-4效能也只達到每分鐘處理40KToken或每分鐘200次呼叫的能力,OpenAI表示,正在持續優化中博友拭目以待。

1 則留言:

  1. ChatGPT已經成為AIGC技術發展的現象級產品,萬億市場已經引來全球科技巨頭重金佈局。就在4月16日下午,百度將在北京發佈文心一言,東西方人工智慧正面迎戰。今天我們就將全面研究升級版ChatGPT:
      當你還在為ChatGPT的強大實力感到驚訝時,升級版本又大幅提升戰力,多項測試中能打敗90%人類,人工智慧真的逆天了!
      自OpenAI去年11月發佈ChatGPT以來,人工智慧引發全球極大地關注,各行各業似乎都在AI上面找到了發展的驅動力。
      作為世界頂尖的AI團隊,OpenAI並不滿足於上一代ChatGPT產品,又推出了GPT-4模型,不僅閱讀文字還能識別圖像,處理文字數量也大幅提升!

    回覆刪除