圖片來源:攝圖網(wǎng)
2017年7月,國務(wù)院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,明確提出應(yīng)逐步開展全民智能教育項目,在中小學(xué)階段設(shè)置人工智能相關(guān)課程,并建立新一代人工智能基礎(chǔ)理論體系。
2018年4月28日,華東師范大學(xué)逸夫樓的禮堂里座無虛席,隨著舞臺上的“書”被翻開,全球首本面向中學(xué)生的人工智能教材《人工智能基礎(chǔ)(高中版)》宣告問世。
這本教材究竟是怎么誕生的?艱深的人工智能知識,該通過怎樣的課程內(nèi)容教給高中生?作為一門全新的課程,學(xué)生和老師們又對此作何感想呢?芥末堆在拿到教材后,對上述問題做了探討。
九個章節(jié)都講了什么?
這本教材的主要目標(biāo),就是讓高中生有機會對人工智能這一前沿技術(shù)初窺芳容。據(jù)執(zhí)行主編林達華透露,該教材著重于AI的基本思想、基礎(chǔ)知識以及常用算法和工具的講授,通過學(xué)習(xí),中學(xué)學(xué)生可以具備AI應(yīng)用的基本能力。
圖片來源:商湯科技
AI這門學(xué)科包含了數(shù)學(xué)、物理等多學(xué)科知識,如何讓零基礎(chǔ)的高中生上手呢?
《人工智能基礎(chǔ)(高中版)》在章節(jié)設(shè)計上,共有“人工智能:新時代的開啟”、“牛刀小試:察異辨花”、“別具慧眼:識圖認(rèn)物”、“耳聽八方:析賞音樂”等九章,一步步讓學(xué)生了解AI的基本原理。
簡單來說,九個章節(jié)的主線就是AI從監(jiān)督學(xué)習(xí)到無監(jiān)督學(xué)習(xí)、再到強化學(xué)習(xí)的過程,在難度和深度上循序漸進。監(jiān)督學(xué)習(xí)指AI需要人類先對數(shù)據(jù)進行標(biāo)注,才能區(qū)分事物類別;無監(jiān)督學(xué)習(xí)則更“聰明”,AI不需要人類標(biāo)注信息,通過算法就能自動分類。
教材第一章從未來生活圖景的開始,介紹了AI發(fā)展簡史、在各行業(yè)中的應(yīng)用與機器學(xué)習(xí)的基本概念;第二章介紹了AI對事物進行分類的機制;第三、四、五章分別介紹了AI識別圖像、音頻、視頻的原理。以上章節(jié)主要側(cè)重AI的監(jiān)督學(xué)習(xí),第六章開始引入AI無監(jiān)督學(xué)習(xí)的概念,講述了AI利用K均值算法來達到無師自通的效果;第七、八章則介紹了主題模型、生成對抗網(wǎng)絡(luò)這另外兩種無監(jiān)督學(xué)習(xí)方法;最后一章則在AI自我學(xué)習(xí)的基礎(chǔ)上更進一步,利用AI圍棋程序阿爾法元介紹了強化學(xué)習(xí)的概念。
通過鳶尾花理解AI“腦回路”
那么,這本教材是如何介紹人工智能原理的呢?我們以書中AI識別鳶尾花為例子來一探究竟。
鳶尾花(iris)的兩個品種變色鳶尾(iris versicolor)和山鳶尾(iris setosa)有著形狀和色彩相似的花瓣和萼片,一般來說,變色鳶尾花瓣較大,而山鳶尾花瓣較小。
(示例圖片均來自教材)
AI識別兩種鳶尾花,首先需要提取花的特征,然后再將特征數(shù)值輸入訓(xùn)練好的分類器中,分類器根據(jù)特征做出預(yù)測,輸出鳶尾花的品種。
首先,我們引入特征(feature)的概念,特征是指可以對事物某些方面特點進行刻畫的數(shù)字或?qū)傩?。因為變色鳶尾和山鳶尾形狀色彩相似但花瓣大小不一,所以我們利用其花瓣長度和寬度特征來區(qū)分品種。
測量出的花瓣的長度和寬度,用x1,x2分別表示,(x1,x2)這組數(shù)據(jù)在數(shù)學(xué)中就是向量。把描述一個事物的特征數(shù)值組織在一起,就形成了特征向量(feature vector)。一朵鳶尾花的長度為1.1厘米,寬度為0.1厘米,這朵鳶尾花的特征就用(1.1,0.1)表示。
把特征向量在坐標(biāo)系中標(biāo)出,這些點被稱為特征點(feature point),共同構(gòu)成特征空間(feature space)。至此,我們完成了AI識別的第一步特征提取。
從特征向量到最終預(yù)測類別,AI還需要一個函數(shù),這個函數(shù)就叫分類器。我們用+1和-1分別代表變色鳶尾和山鳶尾,再用一條直線0.5x1+x2-2=0來劃分坐標(biāo)系中的兩個區(qū)域。
特征點(x1,x2)落在右上區(qū)域輸出+1,代表變色鳶尾,落在左下區(qū)域輸出-1,代表山鳶尾。這個規(guī)則代表的分類器可以用以下函數(shù)表示:
以上這一分類器被成為線性分類器(linear classifier)。訓(xùn)練線性分類器有兩種常見的算法:感知器和支持向量機。
感知器(perceptron)通過被誤分類的訓(xùn)練數(shù)據(jù)調(diào)整現(xiàn)有分類器的參數(shù),不斷減少誤分類:
如下圖所示,兩條分類直線都能區(qū)分兩種鳶尾花,誰更準(zhǔn)確呢?
橙色陰影區(qū)域更寬,能區(qū)分更多的特征點,所以準(zhǔn)確度更高。而支持向量機(support vector machine,SVM)就是指特征空間上分類間隔最大的分類器。
分類器通過兩種算法訓(xùn)練之后,還需要進行測試。統(tǒng)計分類器分類正確的樣本數(shù)與總數(shù),可以得到一個分類準(zhǔn)確率,準(zhǔn)確率最高的分類器就是最優(yōu)的分類器。
通過測試這一階段,AI就能在人類輸入鳶尾花花瓣長度和寬度的條件下,給出準(zhǔn)確的分類結(jié)果。
我們用一個分類函數(shù)解決了二分類問題,除了區(qū)分一種類別中的兩個分支,生活中我們還需要對多種類別進行分類,比如區(qū)分牡丹、荷花、梅花等。
在區(qū)分三種花的二分類函數(shù)f1,f2,f3基礎(chǔ)上,教材還引入歸一化指數(shù)函數(shù)的概念,將輸出轉(zhuǎn)化為概率。借此,分類器不僅能告訴我們這是牡丹還是梅花,還能告訴我們有多大的概率它是牡丹或梅花。
通過以上這個AI識別花朵的例子,我們可以了解到AI對事物的分類過程,分為特征提取、分類器的訓(xùn)練和測試應(yīng)用三部分。AI的這個判斷邏輯,在我們生活中已有許多實際應(yīng)用的例子,比如相機中的人臉檢測、醫(yī)學(xué)中的癌細胞檢測等。
教材難嗎?高中生這么說
讀到這里,想必讀者對這本教材的內(nèi)容和難度有了自己的感受,那么高中生又是怎么想的呢?
記者隨機收集了十幾位學(xué)生對AI教材的看法。在收集中,多數(shù)學(xué)生表示沒聽說過這本教材,學(xué)校也尚未開設(shè)相關(guān)課程。
在翻閱了AI教材之后,大部分受訪學(xué)生表示難度還能接受。清華附中一名高二學(xué)生說,“畢竟數(shù)學(xué)的東西不是很多,更多的是文字性的概念描述;而且它作為選修課,難度太大也不行?!北本┮黄咭恢袑W(xué)一名學(xué)生表示,“教材總體難度感覺還行,不過學(xué)好它也不容易,里面有涉及一些大學(xué)階段才學(xué)到的知識?!?/p>
但也有部分學(xué)生表示這本教材有一定挑戰(zhàn)性。一名清華附中的學(xué)生認(rèn)為,“乍一看看不太懂,還是有點高深,自學(xué)的話額外成本會比較高,需要老師的輔導(dǎo)?!北本┒幸幻麑W(xué)生粗略地瀏覽完教材后說,“我感覺我看不太懂,即便有老師輔導(dǎo)也不簡單,不過我還是很有興趣去學(xué)?!?/p>
教材截圖
談及AI教材,學(xué)生們基本持肯定態(tài)度,表示如果開設(shè)這門課程選修者應(yīng)該不在少數(shù)。清華附中一名正自學(xué)人工智能的高一學(xué)生說,“將來如果學(xué)習(xí)人工智能的話,我想在現(xiàn)階段先學(xué)點基礎(chǔ),然后在大學(xué)系統(tǒng)性地學(xué)習(xí),現(xiàn)在能提供一個機會還是挺好的?!?/p>
對于該門教材的教學(xué),一名受訪學(xué)生將之與學(xué)校開設(shè)的信息選修課做了對比:“我們學(xué)校信息課一般不用教材,學(xué)VB、Java時都是老師先把課件做好,再給我們講。類似地,我想AI的課上老師們也會發(fā)揮出自己的教學(xué)特色?!庇捎贏I是一門全新的課程,學(xué)生們均表示老師首先要接受一定的培訓(xùn),然后再帶學(xué)生一起學(xué)。
“要探索在標(biāo)準(zhǔn)之外,學(xué)生能走多遠”
關(guān)于教材的難度,記者還咨詢了一位對AI有一定了解的程序員。該程序員認(rèn)為,該教材缺乏前置知識介紹,直接上手的話對高中老師的要求比較高;其次,教材中的很多知識大學(xué)才能學(xué)到,對普通學(xué)生來說還是有一定的難度。
在編寫之初,編者在難度把控方面就有過爭論:如果介紹AI的運作原理,似乎過于艱深;只是科普性的介紹而不涉及數(shù)學(xué)和算法,又顯得太淺。后來,編者達成了共識,將教材目標(biāo)定位為傳遞人工智能的基本思想和理念,興趣與知識并重,并以實踐為導(dǎo)向。
對此,記者收集了編者之一、上海交大附中彭禹老師。彭禹表示,“原理并非一定就很難,而概念介紹也不一定簡單;概念學(xué)習(xí)是所有學(xué)習(xí)的基礎(chǔ),概念理解也有深淺之分,一定程度上也依賴?yán)蠋熑绾稳リU釋?!?br/>
對于教材部分內(nèi)容超綱的問題,彭禹解釋道,“實際上,國家課程標(biāo)準(zhǔn)這個‘綱’,只是最低的要求,不能因為超綱就不學(xué)習(xí)了。作為一名教育者,還要探索在這個標(biāo)準(zhǔn)之外,學(xué)生還能走多遠?!?/p>
彭禹認(rèn)為,“教材中涉及到一些高等數(shù)學(xué)的知識,但區(qū)分‘高中知識’和‘大學(xué)知識’并沒有多大的意義,知識沒有高中大學(xué)之分。實際上,學(xué)生只要有初高中的代數(shù)知識和語文基礎(chǔ),就能讀這本書,加上老師的輔導(dǎo),我想弄懂它是不成問題的?!?/p>
中國主要在兩個階段講授人工智能課程,一是入門科普介紹,二是研究生時期專業(yè)化學(xué)習(xí),中間缺少一個奠基和進階。彭禹表示,這本教材的主要優(yōu)點,就是以深入淺出的方式彌補了這一空缺;由于還未推廣落地開來,談其缺點還言之尚早。
一堂“手腦結(jié)合”的AI課
將來逐漸開設(shè)的人工智能課堂,會是怎樣一番授課場景呢?
首先,人工智能概念的講授是必不可少的根基。對基礎(chǔ)較為薄弱的高中生來說,弄懂各種概念并不容易。為了便于學(xué)生理解,這本教材中加入了大量具體的例子和圖表,形象地描述概念知識。教材在編寫之初就定下規(guī)矩:“每一段話都必須自己撰寫,每一幅教學(xué)示意圖都必須自己設(shè)計?!?/p>
計算機將小格子對應(yīng)的顏色轉(zhuǎn)化為數(shù)字矩陣
像素點的運動方向轉(zhuǎn)化為光流圖
其次,教材穿插了大量的補充介紹知識點,比如向量的基本運算、簡單概率、和初級的優(yōu)化思想等,便于學(xué)生學(xué)習(xí)。執(zhí)行主編林達華表示,學(xué)習(xí)本書的概念和知識并不需要很深的數(shù)學(xué),通過數(shù)學(xué)知識點的補充,能夠滿足中學(xué)教學(xué)的需求。
向量間的卷積運算
感知器學(xué)習(xí)算法
最后,通過思考討論題和實驗題,加深學(xué)生的理解。由于AI這門學(xué)科應(yīng)用性非常強,與其他傳統(tǒng)教材不同,AI教材以“手腦結(jié)合”為主要學(xué)習(xí)方式,每一章都有一個主線任務(wù),引導(dǎo)學(xué)生學(xué)習(xí)相關(guān)的知識的同時,讓學(xué)生通過思考、討論、實驗練習(xí),達到學(xué)以致用的效果。
教材里的實驗題
為配合全書22套實驗,商湯科技還開發(fā)了一個人工智能實驗平臺。該平臺選用在AI領(lǐng)域使用最廣泛的Python語言,支持深度學(xué)習(xí)模型訓(xùn)練和算法的定制擴展。學(xué)生可利用該平臺完成各種課堂實驗、作業(yè)、競賽及自主創(chuàng)新項目。
編者彭禹表示,實驗平臺不是單純?yōu)榱俗鰧嶒?,也不是培養(yǎng)搭積木般的動手能力,而是讓學(xué)生通過實驗了解AI背后一套復(fù)雜的原理機制。學(xué)生可以通過科學(xué)的實驗方法和嚴(yán)謹(jǐn)?shù)倪壿嫿Y(jié)構(gòu),明白AI不是故弄玄虛的事物。
在教學(xué)形式上,AI的課堂主要還是以PBL(Project-Based Learning,基于項目學(xué)習(xí))的方式來教學(xué),學(xué)生AI項目的設(shè)計邏輯、完成度都可以作為評價標(biāo)準(zhǔn)。
未來人工智能教學(xué)體系第一塊磚
據(jù)商湯科技介紹,人工智能教學(xué)體系涵蓋《人工智能基礎(chǔ)》教材、教輔材料、教師培訓(xùn)與認(rèn)證、教學(xué)實驗平臺、人工智能實驗室和全國中小學(xué)生人工智能大賽六大模塊。
未來三年,商湯科技希望和全國一、二線城市的50%以上的示范性高中,以《人工智能基礎(chǔ)》為標(biāo)準(zhǔn)教材,開授人工智能課程。同時還將面向?qū)W校提供的培訓(xùn)服務(wù),包括人工智能基礎(chǔ)課程教師培訓(xùn)、人工智能實驗平臺教師培訓(xùn)、智能機器人教師培訓(xùn)等。商湯科技還將結(jié)合教材中的知識點,與華東師范大學(xué)、商務(wù)印書館一道,在中小學(xué)開展人工智能教師培訓(xùn)、中小學(xué)人工智能實驗室建設(shè)、智慧校園建設(shè)等多個場景,對教育行業(yè)進行賦能。
目前,上海市市西中學(xué)已經(jīng)開始基于AI教材內(nèi)容對學(xué)生進行授課。而素有全球青少年科學(xué)競賽“世界杯”之美譽的國際科學(xué)與工程大獎賽(ISEF),目前已經(jīng)被人工智能這一學(xué)科占據(jù)了40%。可以看到,雖然AI教材離全面普及還有很長的路要走,但AI一定是未來的發(fā)展方向,AI課程也將會遍地開花。這本教材,或許是構(gòu)建未來人工智能教學(xué)體系的第一塊磚。
2、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。