測驗及評量研究中心 | 陳繼成 助理研究員
壹、前言
測驗與評量的發展往往隨著教育一同演進。在中國,最早的測驗可追溯至隋代(西元581-619年)的科舉制度。隨著各朝代的不同,考試的科目與方式均有些許不同。若風氣為重文輕武,考試內容偏向詩書五經;反之則亦會加入體能的評測等。在制度上,各朝代的科舉制度隨著時間推移而更加完備。如同讀者們在歷史課本上學的「科舉制度起於隋、確立於唐,自北宋而大備。」顯示考試的制度隨著時間的推移而越發完整。各種制度的演進一方面期待能適切地用人選材,一方面則避免營私舞弊。在國外的測驗發展中,醫療和教育等領域在19世紀就有使用測驗的紀錄。然測驗的推廣與快速成長則是在第一次世界大戰美國參戰後對於欲參軍的人員進行的選材。
近一個世紀以來,電腦與網路的發展對於在此之前一千多年均很穩定的測驗理論與測驗形式迎來改變的曙光。此時,電腦化測驗與相關測驗理論與技術也跟著蓬勃發展。然2019年底至2020年初,全球亦迎來新冠肺炎(COVID 19)的肆虐。為了兼顧學習與健康,教育部採用停課不停學策略,積極推動線上課程。無疑這便是一個可能對測驗發展造成影響的一個重大事件。2022年,ChatGPT引領了全球對人工智慧(Artificial Intelligence,AI)的重視,此時ChatGPT與AI對教育帶來無法忽視的衝擊,而教育測驗的型態與內容亦收到影響。在面對如此遽變的環境下,各國的測驗與評量受到何種影響,發展趨勢為何?本文聚焦於近年來測驗評量的發展,蒐集不同的國家分別受到人工智慧(AI)與新冠肺炎疫情的影響,在大型測驗上所做的調整以及在測驗的發展上所遇上的情況以及所做的決策,以期能理出一絲脈絡,提供讀者作為參考。
......【全文請見相關連結內容】