芥末堆 西瓜 11月18日 報道
11月14日,在以“碰撞·演變”為主題的GET2018教育科技大會分論壇上,VIPKID教學(xué)產(chǎn)品負(fù)責(zé)人林陳斌給觀眾們帶來了題為《AI構(gòu)建在線教學(xué)新生態(tài)》的分享。
在這一主題下,林陳斌主要分享了兩塊內(nèi)容,智能師生匹配和在線課堂監(jiān)測及評測。
以下為林陳斌演講實錄:
今天給大家演講的主題叫做AI構(gòu)建在線教學(xué)新生態(tài)。前面有兩位專家已經(jīng)講過了語文和數(shù)學(xué),我們是從另外一個視角講一下英語行業(yè),主要是從科技怎么為教育賦能為老師助力的角度,為大家分享一下我們在之前做的過程當(dāng)中的一些經(jīng)驗。
大家都知道2017年被定義成AI元年,有很多標(biāo)志性的事件出現(xiàn)。我們一直在思考AI在教育行業(yè)里面應(yīng)該扮演什么樣的角色。我們認(rèn)為AI在整個教育系統(tǒng)里面可以成為我們學(xué)生的好伙伴,就是他知道學(xué)生應(yīng)該在什么時候開始學(xué),然后他可以扮演一個激勵他的角色也可以扮演一個跟他一起來學(xué)習(xí)成長的角色。第二個是外教的好助力,可以幫助我們的老師更好的感知到學(xué)生現(xiàn)在的學(xué)習(xí)情況,把學(xué)生的很多數(shù)據(jù)呈現(xiàn)給老師,讓老師通過這些數(shù)據(jù)可以更好的了解學(xué)生,達(dá)到更好的教學(xué)效果。
另外我們也可以把好的老師把挑出來,每一節(jié)課不同老師的教法是不一樣的。VIPKID的老師是自研的,我們的老師來自于北美個人家庭,他們是一個個的個體。除了基本的教學(xué)培訓(xùn)以外,所有的老師在這里面是自由發(fā)揮的,每個老師個人能力和性格都不一樣,對于同一節(jié)課,同一個學(xué)生教法也是不一樣的。所以這個過程當(dāng)中怎么把好的老師好的表現(xiàn)沉淀出來,讓其它更多的老師去學(xué)習(xí)和模仿,這是給我們老師賦能的。
另外一塊就是我們家長的好幫手,家長付錢讓學(xué)生到機(jī)構(gòu)來買的是好的學(xué)習(xí)效果,我們怎么能讓家長放心,你的孩子在這兒學(xué)得開心學(xué)得快樂,這些效果怎么分析和怎么以好的形式呈現(xiàn)給家長,這是我們考慮AI在里面應(yīng)用的地方。
VIPKID所有的業(yè)務(wù)全部發(fā)生在線上,我們目前已經(jīng)有50多萬名學(xué)生在線上學(xué),也有6萬多名老師在線上課。每天在線授課量超過15萬節(jié),所有的數(shù)據(jù)在線發(fā)生的時候給我們沉淀了很多優(yōu)質(zhì)的數(shù)據(jù),利用這些數(shù)據(jù)和我們的技術(shù),我們現(xiàn)在可以做些什么事情?
第一個是在整個全的教學(xué)環(huán)節(jié)里面,全面提升教學(xué)技術(shù)。我們怎么給老師更好的數(shù)據(jù)。老師進(jìn)課堂之前,他就可以知道學(xué)生上一節(jié)課所有的知識點掌握情況和上一節(jié)作業(yè)的掌握情況,我這堂課是應(yīng)該快講還是應(yīng)該拿出點兒時間把上一節(jié)課進(jìn)行回顧和復(fù)習(xí)。學(xué)習(xí)和評測這一塊我們也都是用數(shù)據(jù)去做,我們所有的題目都是自適應(yīng)地推薦給學(xué)生,然后學(xué)生所有的一些評測的結(jié)果數(shù)據(jù)也可以作為它后續(xù)一些推薦學(xué)習(xí)材料基礎(chǔ)的條件。
然后整個學(xué)習(xí)過程是智能化的,這個待會兒我再詳細(xì)講,主要在師生的匹配,把我們的模型算法應(yīng)用到里面。
最后就是VIPKID想強(qiáng)調(diào)的是讓孩子插上語言的翅膀。所以我們的內(nèi)容不是應(yīng)試教育,雖然我們可以讓學(xué)生的能力提升,用九十分的能力考出一百分的成績,但我們的主旨不是做應(yīng)試教育,核心是要鍛煉學(xué)生的領(lǐng)導(dǎo)力,全球視野,協(xié)調(diào)能力等等全方面的素質(zhì)。所以我們也舉辦了很多有溫度的一些活動和方式,也做出一些產(chǎn)品能讓孩子得到全面的鍛煉和培養(yǎng)。接下來我就展開重點的把這三塊跟大家分享一下。
智能師生匹配
這是目前我們利用數(shù)據(jù)和技術(shù)已經(jīng)實現(xiàn)的幾個大模塊,第一個就是智能師生匹配。因為我們本質(zhì)上要解決的問題是供需匹配問題。
說到供需匹配,大家印象當(dāng)中應(yīng)該比較能夠浮現(xiàn)出來的是美團(tuán),背后可能有幾百萬家商戶,幾千萬家用戶。滴滴每天訂單超過幾千萬單,實時要匹配司機(jī)和乘客。我們要匹配的是6萬名老師和五十多萬名學(xué)生,每天都要匹配。我們認(rèn)為這個匹配的難度其實要比電商和出行的難度更高一些。
我們的匹配維度要更多一些,因為每一個學(xué)生都是獨立的個體,每一個老師的教法也是一個特殊的個體。這里面他們之間會發(fā)生什么樣的化學(xué)反應(yīng)?我們不得而知。
我們有一個非常有意思的數(shù)據(jù),就是我們的學(xué)員,來到我們這個平臺之后他大概率在他整個學(xué)習(xí)周期里面會選擇8-10名老師,大部分是發(fā)生在他的前一個月以內(nèi),前一個月里面他會換3-5名老師選到一名他合適的老師。選到了之后一般他會固定兩到三名老師,以這些老師為主,后面再慢慢的換一些其他老師嘗試風(fēng)格。
在線課堂監(jiān)測及評測
第二塊是我們在線課堂評測。這個事情其實本質(zhì)上做的是,傳統(tǒng)教學(xué)里面教務(wù)的工作和優(yōu)質(zhì)老師的工作,他對于這堂課教學(xué)效果評測做一個數(shù)據(jù)化的表達(dá)。最后通過所有的這些數(shù)據(jù)和老師的匹配,我們來掌握學(xué)生的情況來做個性化內(nèi)容的推薦。我們的智能師生匹配是怎么做的?我們老師這里面大概有22個維度,現(xiàn)在目前已經(jīng)實現(xiàn)了。
比如說,我們的維度有老師的共性特征,然后老師講話的語速,老師的節(jié)奏,老師的音色、性別、年齡、形象等等。學(xué)員這邊的話有他的潛在興趣以及他是否關(guān)注老師,就是他對老師的一個關(guān)注情況,過往的課堂表現(xiàn),知識點的掌握情況等等。兩邊的這些數(shù)據(jù)我們做匹配和分析之后可以找到他們的一個共同點。
說的可能比較抽象一點,我舉幾個例子大家會感受更深刻一點,這是一個真實的案例。真實的案例是我們有一個小學(xué)員,這個小學(xué)員我們叫他豬小弟,他跟我們平臺非常有緣分,所以我們對他的學(xué)習(xí)情況一直很關(guān)注。他剛來到我們平臺的時候我們就爸評價數(shù)最好的老師篩出來,給他推薦了三位。每一位老師都是顏值高、表現(xiàn)力強(qiáng)、教學(xué)水平高、學(xué)生口碑好的老師。但這三位老師教完以后,豬小弟的學(xué)習(xí)效果并不好,然后我們詳細(xì)看了他前面課堂的表現(xiàn),發(fā)現(xiàn)整個過程就是老師講的眉飛色舞,但是豬小弟同學(xué)整個人是眼光呆滯。
這是什么原因呢?我們就在背后去分析這個事情,當(dāng)然后面有一個也是比較機(jī)緣巧合我們給豬小弟換了第四位老師跟前面老師的風(fēng)格是不一樣的。這位老師是一個美國的退休老師,年齡大概五十多歲微胖,相對就是比較嚴(yán)肅的老年退休老師。這個老師的風(fēng)格比較內(nèi)斂,比較深沉。會循序漸進(jìn)地講,他也不太多的跟他開一些玩笑。但是當(dāng)豬小弟在屏幕之外的時候,老師會威嚴(yán)但是不是特別的兇地告訴他說你現(xiàn)在應(yīng)該認(rèn)真聽講,這個老師是這個風(fēng)格。但是他們兩個最后產(chǎn)生的化學(xué)反應(yīng)非常好,很明顯地看到每一節(jié)課豬小弟的反映就越來越好。到最后就開始他活潑的這一面就呈現(xiàn)了。
我們后面跟豬小弟的爸媽在聊這個事情,我們發(fā)現(xiàn)就是這個小朋友他自己本身在現(xiàn)實生活當(dāng)中也是一個性格比較內(nèi)向的。所以這種小朋友當(dāng)他看到老師夸張的一些手型動作的時候,他本人是沒有特別適應(yīng)的這樣一個課堂氣氛。反而是比較溫和的教法能夠讓他更好地接受,更好地適應(yīng)課堂的環(huán)境,然后慢慢的通過慢熱的訓(xùn)練自己找到了感覺。
這是我們之前發(fā)生的一個非常真實的例子?;谶@個例子我們就開始把師生匹配開始建模,學(xué)生這一塊我們首先在性格上面分成了很多大類,他有外向型的,內(nèi)向型的,有偏視覺型的,聽覺型的。這里面我們會匹配不同的顏值和手勢或者說是語音和音色上面非常有特點的一些老師。然后所有的這些維度里面有的維度特征性會非常強(qiáng),有的會表現(xiàn)沒有那么強(qiáng)。
大家覺得說老師的這些因素里面,哪一個因素會對一堂課程的教學(xué)效果產(chǎn)生嚴(yán)重的影響?我們發(fā)現(xiàn)最有效的首先是老師的語速,老師的語速對于學(xué)生在不同年齡階段應(yīng)該適合的語速有一個非常明確的范圍值。這個我不知道在其他的學(xué)科里面會不會有這么明顯的特征。但是我們通過數(shù)據(jù)的表達(dá)上面分析出來,在英語的這個學(xué)科這個特征非常明顯,因為本身就是全外語環(huán)境的教學(xué)。所以語速不適應(yīng)的話,即使那些詞句學(xué)生在掌握的范疇之內(nèi),但是聽力水平跟不上。我們?nèi)康恼Z速在120字每分鐘,所以這里面我們通過這個,對于老師也是一種反向部署。
我們現(xiàn)在在老師的訓(xùn)練當(dāng)中加上了一個功能,以前是沒有這一條的?,F(xiàn)在老師在我們的培訓(xùn)課的時候,會有一個語速的訓(xùn)練課,我們會實時的反映出你現(xiàn)在目前的語速是多少,老師在教一個課件針對不同的學(xué)員,虛擬語速一定要達(dá)到限定的范圍之內(nèi),才會得到綠色的反饋。我們要給老師找這種感覺。
然后這個是我們的實時的在線課堂的一個語音評測的一個系統(tǒng)。這個系統(tǒng)做的事情就是我們把每一節(jié)課的實時數(shù)據(jù)可以拿出來進(jìn)行詳細(xì)的分析。我們的這些數(shù)據(jù)整體來說是非??煽亢蛯崟r去進(jìn)行儲存的,然后通過這些數(shù)據(jù)分析我們最終可以得到每一節(jié)課的教學(xué)質(zhì)量結(jié)論。
這些數(shù)據(jù)包含但不限于,就是我們通過語音識別的技術(shù),語音分析的技術(shù),圖像識別技術(shù)和圖像分析技術(shù)可以得到了一些數(shù)據(jù)。這里面包含了學(xué)員的表情,然后師生的手勢,教室的環(huán)境,老師的發(fā)音,語音的一些識別評測包括課堂連線行為軌跡的數(shù)據(jù)。
然后我們會發(fā)現(xiàn)這些數(shù)據(jù)里面對一節(jié)課,最后能夠有好的效果它影響最大的是什么?學(xué)員的笑臉次數(shù)。我們發(fā)現(xiàn)學(xué)員的笑臉次數(shù)一堂課如果低于十個笑點,學(xué)員可能打一個差評,家長也有可能打一個差評。我們跟學(xué)員跟家長的反饋做擬合的話會發(fā)現(xiàn)這樣的關(guān)系。排名第二是師生的交互,因為師生的語音是兩套音軌,老師的音軌起來降低到學(xué)生的音軌起來到收攏,中間的時差0.05秒算是一次成功的交互,每堂課要有14次交互才會被打成好課。
所以通過這些數(shù)據(jù)我們現(xiàn)在可以做什么事情?第一個是對于上課紀(jì)律的監(jiān)控,師生有沒有遲到有沒有早退,然后老師有沒有在教學(xué)過程當(dāng)中發(fā)生一些什么樣其他的一些不雅的行為。這就是我想借這個事情跟大家分享一個經(jīng)驗。
我們知道現(xiàn)在目前就很多做AI技術(shù)的公司,我們其實在做這里面也應(yīng)用到了一些友商的底層技術(shù)。但是我們發(fā)現(xiàn)我們最終在一些細(xì)節(jié)場景上面監(jiān)控的準(zhǔn)確率來說跟我們的友商對比起來,這個差距會非常小。就是我們基本上接近了專門做AI底層技術(shù)的這樣一家公司。這個核心原因主要是因為我們有大量的數(shù)據(jù)和一個非常好的場景。
比如說做AI技術(shù)的公司他其實并不知道,對于一個老師的教學(xué)紀(jì)律監(jiān)控我們應(yīng)該要監(jiān)控那些指標(biāo)?而通過學(xué)員的反饋和家長的評價我們知道排名第一的是老師的遲到早退,排名第二是老師的打哈欠。那我們就可以針對性的對打哈欠這個事情作為精細(xì)的圖像識別的分析。而這個分析在傳統(tǒng)的AI領(lǐng)域公司首先他不知道這個問題,你最大的問題是你不知道這是個問題。
我們知道這個問題就可以針對性地訓(xùn)練它,打哈欠為什么在我們這兒會變成一個非常嚴(yán)重的問題?因為中美是有時差的。我們學(xué)員上課的時間大部分是美國老師上課的時間,很多老師是在睡眼惺忪的狀態(tài)。而打哈欠的時候我們發(fā)現(xiàn)非常難識別,笑臉好識別,但是打哈欠和他張大嘴巴示范發(fā)音和他正要大聲的說話,這個識別的難度其實是非常大的。但這個對我們非常有價值所以我們投入很大的精力把這塊的數(shù)據(jù)研究上去。
所以這是我們首先第一個應(yīng)用,它對于學(xué)員和老師的這個紀(jì)律上都會有評測。第二就是對于差課的監(jiān)控。低于我們的平均值把它定義成差課,我們會有服務(wù)人員及時的回訪,跟家長溝通到底是學(xué)生表現(xiàn)有問題還是說老師這一節(jié)課有問題?然后相應(yīng)的我們會做一些調(diào)整。其他我就先不展開講了。
這是我們目前的基礎(chǔ)數(shù)據(jù),每天處理三億張圖片,各項指標(biāo)跟主流廠商的接近率是5%,我們最終每天關(guān)注的數(shù)據(jù)達(dá)到了十萬家。這是我們目前在整個平臺里面除了我們的一對一業(yè)務(wù)我們還有中文的業(yè)務(wù),我們還有小班課的業(yè)務(wù)也都在應(yīng)用課程質(zhì)量分析的體系。然后最后是一個課程個性化內(nèi)容的推薦,這個就不展開講,因為我相信其實我們不管是用科技的方法還是用人文的方法,我們都在做類似的事情。通過學(xué)員的精細(xì)化的解讀給他推薦更準(zhǔn)確的個性化的學(xué)習(xí)內(nèi)容。
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。