圖片來源:攝圖網(wǎng)
2017年7月,國務院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,明確提出應逐步開展全民智能教育項目,在中小學階段設置人工智能相關課程,并建立新一代人工智能基礎理論體系。
2018年4月28日,華東師范大學逸夫樓的禮堂里座無虛席,隨著舞臺上的“書”被翻開,全球首本面向中學生的人工智能教材《人工智能基礎(高中版)》宣告問世。
這本教材究竟是怎么誕生的?艱深的人工智能知識,該通過怎樣的課程內(nèi)容教給高中生?作為一門全新的課程,學生和老師們又對此作何感想呢?芥末堆在拿到教材后,對上述問題做了探討。
九個章節(jié)都講了什么?
這本教材的主要目標,就是讓高中生有機會對人工智能這一前沿技術(shù)初窺芳容。據(jù)執(zhí)行主編林達華透露,該教材著重于AI的基本思想、基礎知識以及常用算法和工具的講授,通過學習,中學學生可以具備AI應用的基本能力。
圖片來源:商湯科技
AI這門學科包含了數(shù)學、物理等多學科知識,如何讓零基礎的高中生上手呢?
《人工智能基礎(高中版)》在章節(jié)設計上,共有“人工智能:新時代的開啟”、“牛刀小試:察異辨花”、“別具慧眼:識圖認物”、“耳聽八方:析賞音樂”等九章,一步步讓學生了解AI的基本原理。
簡單來說,九個章節(jié)的主線就是AI從監(jiān)督學習到無監(jiān)督學習、再到強化學習的過程,在難度和深度上循序漸進。監(jiān)督學習指AI需要人類先對數(shù)據(jù)進行標注,才能區(qū)分事物類別;無監(jiān)督學習則更“聰明”,AI不需要人類標注信息,通過算法就能自動分類。
教材第一章從未來生活圖景的開始,介紹了AI發(fā)展簡史、在各行業(yè)中的應用與機器學習的基本概念;第二章介紹了AI對事物進行分類的機制;第三、四、五章分別介紹了AI識別圖像、音頻、視頻的原理。以上章節(jié)主要側(cè)重AI的監(jiān)督學習,第六章開始引入AI無監(jiān)督學習的概念,講述了AI利用K均值算法來達到無師自通的效果;第七、八章則介紹了主題模型、生成對抗網(wǎng)絡這另外兩種無監(jiān)督學習方法;最后一章則在AI自我學習的基礎上更進一步,利用AI圍棋程序阿爾法元介紹了強化學習的概念。
通過鳶尾花理解AI“腦回路”
那么,這本教材是如何介紹人工智能原理的呢?我們以書中AI識別鳶尾花為例子來一探究竟。
鳶尾花(iris)的兩個品種變色鳶尾(iris versicolor)和山鳶尾(iris setosa)有著形狀和色彩相似的花瓣和萼片,一般來說,變色鳶尾花瓣較大,而山鳶尾花瓣較小。
(示例圖片均來自教材)
AI識別兩種鳶尾花,首先需要提取花的特征,然后再將特征數(shù)值輸入訓練好的分類器中,分類器根據(jù)特征做出預測,輸出鳶尾花的品種。
首先,我們引入特征(feature)的概念,特征是指可以對事物某些方面特點進行刻畫的數(shù)字或?qū)傩?。因為變色鳶尾和山鳶尾形狀色彩相似但花瓣大小不一,所以我們利用其花瓣長度和寬度特征來區(qū)分品種。
測量出的花瓣的長度和寬度,用x1,x2分別表示,(x1,x2)這組數(shù)據(jù)在數(shù)學中就是向量。把描述一個事物的特征數(shù)值組織在一起,就形成了特征向量(feature vector)。一朵鳶尾花的長度為1.1厘米,寬度為0.1厘米,這朵鳶尾花的特征就用(1.1,0.1)表示。
把特征向量在坐標系中標出,這些點被稱為特征點(feature point),共同構(gòu)成特征空間(feature space)。至此,我們完成了AI識別的第一步特征提取。
從特征向量到最終預測類別,AI還需要一個函數(shù),這個函數(shù)就叫分類器。我們用+1和-1分別代表變色鳶尾和山鳶尾,再用一條直線0.5x1+x2-2=0來劃分坐標系中的兩個區(qū)域。
特征點(x1,x2)落在右上區(qū)域輸出+1,代表變色鳶尾,落在左下區(qū)域輸出-1,代表山鳶尾。這個規(guī)則代表的分類器可以用以下函數(shù)表示:
以上這一分類器被成為線性分類器(linear classifier)。訓練線性分類器有兩種常見的算法:感知器和支持向量機。
感知器(perceptron)通過被誤分類的訓練數(shù)據(jù)調(diào)整現(xiàn)有分類器的參數(shù),不斷減少誤分類:
如下圖所示,兩條分類直線都能區(qū)分兩種鳶尾花,誰更準確呢?
橙色陰影區(qū)域更寬,能區(qū)分更多的特征點,所以準確度更高。而支持向量機(support vector machine,SVM)就是指特征空間上分類間隔最大的分類器。
分類器通過兩種算法訓練之后,還需要進行測試。統(tǒng)計分類器分類正確的樣本數(shù)與總數(shù),可以得到一個分類準確率,準確率最高的分類器就是最優(yōu)的分類器。
通過測試這一階段,AI就能在人類輸入鳶尾花花瓣長度和寬度的條件下,給出準確的分類結(jié)果。
我們用一個分類函數(shù)解決了二分類問題,除了區(qū)分一種類別中的兩個分支,生活中我們還需要對多種類別進行分類,比如區(qū)分牡丹、荷花、梅花等。
在區(qū)分三種花的二分類函數(shù)f1,f2,f3基礎上,教材還引入歸一化指數(shù)函數(shù)的概念,將輸出轉(zhuǎn)化為概率。借此,分類器不僅能告訴我們這是牡丹還是梅花,還能告訴我們有多大的概率它是牡丹或梅花。
通過以上這個AI識別花朵的例子,我們可以了解到AI對事物的分類過程,分為特征提取、分類器的訓練和測試應用三部分。AI的這個判斷邏輯,在我們生活中已有許多實際應用的例子,比如相機中的人臉檢測、醫(yī)學中的癌細胞檢測等。
教材難嗎?高中生這么說
讀到這里,想必讀者對這本教材的內(nèi)容和難度有了自己的感受,那么高中生又是怎么想的呢?
記者隨機收集了十幾位學生對AI教材的看法。在收集中,多數(shù)學生表示沒聽說過這本教材,學校也尚未開設相關課程。
在翻閱了AI教材之后,大部分受訪學生表示難度還能接受。清華附中一名高二學生說,“畢竟數(shù)學的東西不是很多,更多的是文字性的概念描述;而且它作為選修課,難度太大也不行?!北本┮黄咭恢袑W一名學生表示,“教材總體難度感覺還行,不過學好它也不容易,里面有涉及一些大學階段才學到的知識?!?/p>
但也有部分學生表示這本教材有一定挑戰(zhàn)性。一名清華附中的學生認為,“乍一看看不太懂,還是有點高深,自學的話額外成本會比較高,需要老師的輔導。”北京二中一名學生粗略地瀏覽完教材后說,“我感覺我看不太懂,即便有老師輔導也不簡單,不過我還是很有興趣去學。”
教材截圖
談及AI教材,學生們基本持肯定態(tài)度,表示如果開設這門課程選修者應該不在少數(shù)。清華附中一名正自學人工智能的高一學生說,“將來如果學習人工智能的話,我想在現(xiàn)階段先學點基礎,然后在大學系統(tǒng)性地學習,現(xiàn)在能提供一個機會還是挺好的?!?/p>
對于該門教材的教學,一名受訪學生將之與學校開設的信息選修課做了對比:“我們學校信息課一般不用教材,學VB、Java時都是老師先把課件做好,再給我們講。類似地,我想AI的課上老師們也會發(fā)揮出自己的教學特色?!庇捎贏I是一門全新的課程,學生們均表示老師首先要接受一定的培訓,然后再帶學生一起學。
“要探索在標準之外,學生能走多遠”
關于教材的難度,記者還咨詢了一位對AI有一定了解的程序員。該程序員認為,該教材缺乏前置知識介紹,直接上手的話對高中老師的要求比較高;其次,教材中的很多知識大學才能學到,對普通學生來說還是有一定的難度。
在編寫之初,編者在難度把控方面就有過爭論:如果介紹AI的運作原理,似乎過于艱深;只是科普性的介紹而不涉及數(shù)學和算法,又顯得太淺。后來,編者達成了共識,將教材目標定位為傳遞人工智能的基本思想和理念,興趣與知識并重,并以實踐為導向。
對此,記者收集了編者之一、上海交大附中彭禹老師。彭禹表示,“原理并非一定就很難,而概念介紹也不一定簡單;概念學習是所有學習的基礎,概念理解也有深淺之分,一定程度上也依賴老師如何去闡釋?!?br/>
對于教材部分內(nèi)容超綱的問題,彭禹解釋道,“實際上,國家課程標準這個‘綱’,只是最低的要求,不能因為超綱就不學習了。作為一名教育者,還要探索在這個標準之外,學生還能走多遠。”
彭禹認為,“教材中涉及到一些高等數(shù)學的知識,但區(qū)分‘高中知識’和‘大學知識’并沒有多大的意義,知識沒有高中大學之分。實際上,學生只要有初高中的代數(shù)知識和語文基礎,就能讀這本書,加上老師的輔導,我想弄懂它是不成問題的?!?/p>
中國主要在兩個階段講授人工智能課程,一是入門科普介紹,二是研究生時期專業(yè)化學習,中間缺少一個奠基和進階。彭禹表示,這本教材的主要優(yōu)點,就是以深入淺出的方式彌補了這一空缺;由于還未推廣落地開來,談其缺點還言之尚早。
一堂“手腦結(jié)合”的AI課
將來逐漸開設的人工智能課堂,會是怎樣一番授課場景呢?
首先,人工智能概念的講授是必不可少的根基。對基礎較為薄弱的高中生來說,弄懂各種概念并不容易。為了便于學生理解,這本教材中加入了大量具體的例子和圖表,形象地描述概念知識。教材在編寫之初就定下規(guī)矩:“每一段話都必須自己撰寫,每一幅教學示意圖都必須自己設計?!?/p>
計算機將小格子對應的顏色轉(zhuǎn)化為數(shù)字矩陣
像素點的運動方向轉(zhuǎn)化為光流圖
其次,教材穿插了大量的補充介紹知識點,比如向量的基本運算、簡單概率、和初級的優(yōu)化思想等,便于學生學習。執(zhí)行主編林達華表示,學習本書的概念和知識并不需要很深的數(shù)學,通過數(shù)學知識點的補充,能夠滿足中學教學的需求。
向量間的卷積運算
感知器學習算法
最后,通過思考討論題和實驗題,加深學生的理解。由于AI這門學科應用性非常強,與其他傳統(tǒng)教材不同,AI教材以“手腦結(jié)合”為主要學習方式,每一章都有一個主線任務,引導學生學習相關的知識的同時,讓學生通過思考、討論、實驗練習,達到學以致用的效果。
教材里的實驗題
為配合全書22套實驗,商湯科技還開發(fā)了一個人工智能實驗平臺。該平臺選用在AI領域使用最廣泛的Python語言,支持深度學習模型訓練和算法的定制擴展。學生可利用該平臺完成各種課堂實驗、作業(yè)、競賽及自主創(chuàng)新項目。
編者彭禹表示,實驗平臺不是單純?yōu)榱俗鰧嶒?,也不是培養(yǎng)搭積木般的動手能力,而是讓學生通過實驗了解AI背后一套復雜的原理機制。學生可以通過科學的實驗方法和嚴謹?shù)倪壿嫿Y(jié)構(gòu),明白AI不是故弄玄虛的事物。
在教學形式上,AI的課堂主要還是以PBL(Project-Based Learning,基于項目學習)的方式來教學,學生AI項目的設計邏輯、完成度都可以作為評價標準。
未來人工智能教學體系第一塊磚
據(jù)商湯科技介紹,人工智能教學體系涵蓋《人工智能基礎》教材、教輔材料、教師培訓與認證、教學實驗平臺、人工智能實驗室和全國中小學生人工智能大賽六大模塊。
未來三年,商湯科技希望和全國一、二線城市的50%以上的示范性高中,以《人工智能基礎》為標準教材,開授人工智能課程。同時還將面向?qū)W校提供的培訓服務,包括人工智能基礎課程教師培訓、人工智能實驗平臺教師培訓、智能機器人教師培訓等。商湯科技還將結(jié)合教材中的知識點,與華東師范大學、商務印書館一道,在中小學開展人工智能教師培訓、中小學人工智能實驗室建設、智慧校園建設等多個場景,對教育行業(yè)進行賦能。
目前,上海市市西中學已經(jīng)開始基于AI教材內(nèi)容對學生進行授課。而素有全球青少年科學競賽“世界杯”之美譽的國際科學與工程大獎賽(ISEF),目前已經(jīng)被人工智能這一學科占據(jù)了40%??梢钥吹?,雖然AI教材離全面普及還有很長的路要走,但AI一定是未來的發(fā)展方向,AI課程也將會遍地開花。這本教材,或許是構(gòu)建未來人工智能教學體系的第一塊磚。
2、芥末堆不接受通過公關費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。