電腦不只會選土豆,還會選文章!臺師大宋曜廷談人工智慧如何強化臺灣閱讀教育

宋曜廷指出,紙本閱讀雖然看似失勢,但人們閱讀並未中斷,而是轉向「輕薄短小」的社群媒體、網路文章,進行大量跳躍的浮泛閱讀。
攝影/林俊孝

我們生活在被文字包圍的世界,從Facebook、報章雜誌、餐廳菜單到招牌告示,每天只要睜開眼睛,大半時間都在「閱讀」。若以一般中文使用者的閱讀速度(每分鐘約300字)計算,每個人一天至少可讀進6萬字,大約是一本小說的份量。

可是,這些文字中,又有多少內容能被我們的大腦真正吸收?

國立臺灣師範大學教育心理與輔導學系研究講座教授宋曜廷指出,在這個資訊爆炸的年代,紙本書看似失勢,實際上出版物仍連年增加;在智慧型手機當道下,人們的閱讀媒介產生劇烈變化,轉向「輕薄短小」的社群媒體、網路文章,進行大量跳躍的浮泛閱讀;近年甚至出現AI工具可以代勞,從長文中提取摘要。

「表面上,人類見到文字的頻率越來越高;但實際上,透過深度閱讀增長知識、培育涵養的機會,反而越來越稀少。」宋曜廷感嘆,「從閱讀教育的角度來看,這個時代可說是一個弔詭的時代!」

全球第一個中文適性閱讀平臺:SmartReading

現代人對長時間、長文本閱讀的動機持續降低,連帶造成批判與反思能力下降,如此趨勢在年輕世代身上的影響,又更加深遠。當時代進步,閱讀教育只會越來越重要──宋曜廷有感於此,帶領團隊打造出全球第一個以中文圖書為基礎的多功能適性閱讀系統:SmartReading適性閱讀平臺

宋曜廷帶領團隊打造SmartReading適性閱讀平臺,透過資料庫與AI技術整合,幫助孩子挑選適合自己程度的讀物,讓閱讀變簡單了!
圖片來源/SmartReading適性閱讀

從圖書難度分級、優選書單、閱讀能力評量到閱讀歷程分析,SmartReading透過大型圖書文本資料庫的建立與AI技術的運用,同時與全臺公共圖書館、中小學通力合作,達到多項令亞洲華語國家盡皆稱羨的成果。除了推動融入科技、本於學習理論的閱讀教育,宋曜廷更為我們指出人人都值得嘗試,提升自己「閱讀力」的進步方向。

AI判讀文本難度,茫茫書海中為你指引道路

早在30多年前,美國政府便以國家經費支持,發展Lexile圖書分級系統,為圖書難度與讀者程度進行配對,提供學校、教科書編撰廠商等教育機構參考。然而,類似系統卻在華語世界付之闕如。

「根據《111年臺灣圖書出版現況及趨勢報告》統計,臺灣從109年至111年出版的兒童讀物,加起來就超過12000種,讓人看了都腿軟。」宋曜廷笑著說,站在書店的大面書牆前,家長和學生都常陷入選擇障礙,不知從何讀起,也可能買到難度不合自身程度的圖書。

打造臺灣閱讀分級系統的第一步,是「建立語料庫」。從2010年開始,研究團隊廣泛與出版商合作,蒐集如《小牛頓》等兒少圖書,也購買《聯合報》等大型資料庫的存取權,至今已累積逾10萬本圖書、超過13億詞的文本資料。接著,運用自然語言處理(natural language processing)和機器學習(machine learning)技術,分析每一本圖書的閱讀難度。

臺灣過去三年所印刷的兒少讀物,平均每年有數千種,面對這麼多種類的書,孩子、家長又該如何開啟閱讀這扇門?
圖片來源/Unsplash

宋曜廷解釋,AI模型判讀文本難度,主要依據「語言特徵」和「知識特徵」兩大面向。

「我們可以想像一本書被拆解為篇章、段落、句子、字詞,每一個層次都能推算出相應指標。例如:字詞的使用頻率越低、句子的文法結構越繁複、段落篇章銜接上的認知負擔越重,代表文本的『語言特徵』越複雜。」

「另一方面,『知識特徵』則是對文本的『內涵』進行判斷。舉例而言,同為自然科範圍,介紹光合作用的方式會隨著年級越高而越深入,提到諸如光反應、碳反應、卡爾文循環等更多專業術語。」

將大型語料庫裡的文本依語言特徵、知識特徵進行量化,做為AI模型的「訓練資料」,使其學會文本難度的分類規則,後續便可使用模型來判讀一份份新文本對應的年級與學力。

宋曜廷研究團隊建立的文本難度指標「SR值(藉由線上測驗,診斷SmartReading值,即「書籍難度」,也代表讀者的「閱讀能力」指標)」,現已連結全臺各級學校與各縣市的公共圖書館,讓大家在選讀圖書時不再因書海浩瀚而無所適從,更結合各校的「閱讀教師」制度,長期追蹤臺灣閱讀教育成效。同時,這套全球第一的中文圖書難度分類系統也聲名遠播,吸引香港國際學校圖書館前來諮詢,並且逐漸推廣至中國、新加坡等華語國家。

我的閱讀能力到哪裡?DACC告訴你

圖書分級系統存在的意義,是要讓書籍難度能和讀者的閱讀能力相匹配,達到適性閱讀的目標。但回過頭來,一個人的「閱讀能力」該如何評估?

「我們不可能為了測量一個人的閱讀能力,請他讀遍世上所有中文書、認遍所有中文字。」心理學出身的宋曜廷,運用測驗理論結合電腦化技術,帶領團隊研發一套兼具信效度、半天時間內即可完成的閱讀能力適性測驗工具:中文能力診斷測驗DACC(Diagnostic Assessment of Chinese Competence)。

DACC目前適用於1到13年級,可評估包括識字量、文意理解、推論分析等多元面向的閱讀力。測驗結果不只能幫助學生了解自己真實閱讀能力位於哪一年級,也提供閱讀教師因材施教安排選書的有力根據。

不過,宋曜廷也強調,閱讀能力做為一種複雜多面的認知功能,並非固定的鐵板一塊,而是會像身體肌肉般「用進廢退」。一旦長期不閱讀,個人的閱讀與理解反思能力,勢必慢慢退化。

那如果有心鍛鍊,想要全面提升自己的閱讀力,可以怎麼做呢?

改變閱讀方式前,先「認識自己」

跟滑FB、IG、Threads相比,閱讀畢竟不算太搶眼球的活動。「現代人如果缺少發自內心的閱讀動機,一定很快就會放下書本。」宋曜廷語重心長地說,「因此,閱讀教育的理想境界不在於開設多少課程、舉辦多少比賽,利用外在誘因刺激人們閱讀,而是透過適性閱讀的長期陶冶,訓練學生成為一名自律、自主的閱讀者。」

宋曜廷指出,增強「閱讀後設認知(reading metacognition)」,是成為一名自律自主閱讀者的關鍵:「不只是一股腦地讀,而是可以往後跳一步,有意識地看見自己『在讀什麼』、了解自己『需要讀什麼』。」

增強閱讀後設認知的方法,包括:記錄、回顧、自我剖析。「記錄」就是建立一份專屬自己的閱讀歷程。就像待辦事項的空格被打上勾勾,總能讓人產生動力去做下一件事,當學生經過幾學期的累積,再回頭翻閱自己的豐功偉業,不只從中取得成就感,也有動機探索更多書籍,拓展個人的閱讀里程碑。

當然,單純的記錄還不夠,進一步的分析與引導更是至關重要。宋曜廷團隊設計了「閱讀五力」指標,協助學生與教師對閱讀歷程進行視覺化的雷達圖分析,再結合前面提到的文本難度指標與DACC測驗,個人過去的閱讀習性、優點和不足之處,馬上一目瞭然。

自主閱讀的訣竅:培養「閱讀五力」

閱讀五力包括「規劃力」、「執行力」、「精進力」以及「博學力」、「成長力」,可以幫助閱讀者全方位分析自己的閱讀歷程。

圖片提供/宋曜廷

在SmartReading平臺的線上體驗中,首先會進行一場簡易的閱讀能力評量,結果出爐後,系統將從大型資料庫中推薦適合你程度的書籍,由你來選書和規劃未來一段時間內的閱讀時程。如果稍嫌偷懶(一年只讀一本低於你程度的書)或者不切實際(一週內讀完五本超越你程度的書),系統便給予較低的「規劃力」分數,提醒進行修正。

「規劃力」注重實際且可行的目標設定,「執行力」則是確實執行、達成目標的程度。宋曜廷指出,現在每當學生讀完一本書,就可登入平臺書寫摘要、心得,由AI系統自動批改,提供文本評分與回饋,有相當及時的互動性。

宋曜廷證明網路科技、數位工具,並非競爭關係,而可以相輔相成。重點在於讀者在離開校園後如何累積自我的閱讀歷程。
攝影/W. Xiang

系統也會針對閱讀歷程的領域分配,評估你的「精進力」與「博學力」。比方說,持續閱讀社會科學書籍,將得到比較高的精進力分數;偶爾也看看幾本小說、腦科學,則可以提升博學力。最後,「成長力」是系統長期追蹤後,對一個人閱讀能力進步程度的綜合評估。

宋曜廷指出,這「五力」都是閱讀能力不可或缺的多元面向。透過量化追蹤與視覺化呈現,SmartReading系統讓學生的「進步看得見」;彷彿冒險遊戲技能點的設計,更為校園閱讀教育增添樂趣,培養自主自發的閱讀動機。

長年投入適性閱讀系統的建置,宋曜廷證明了網路科技、數位工具與「閱讀」之間,並非你死我活的競爭關係,而是可以相輔相成。而走出學校,每個人其實都是一名閱讀者。回想過去一年,你買了幾本書,其中真正讀完的又有幾本?你的閱讀習慣,是對於某一個領域情有獨鍾,還是多元涉獵?這套五力架構,你不妨也用來檢視自己的閱讀歷程吧!

(恭喜看完這篇文章的你,本日閱讀量增加了3000字)

採訪撰稿/林義宏
編輯/林俊孝
攝影/林俊孝、W. Xiang

研究來源
宋曜廷(2018)。提升中小學生閱讀的後設認知能力:整合心理模型、文本大數據、自動測評工具與適性教學方案–總計畫暨子計畫五:提升自律與自主閱讀能力:以後設認知為基礎的智慧型閱讀歷程檔案建立、歷程檔案大數據分析工具與教學方案評估。專題研究計畫(特約研究計畫)。