近日,中國(guó)在線K12教育機(jī)構(gòu)猿輔導(dǎo)登頂SQuAD,排在其后的不乏谷歌、微軟、百度等互聯(lián)網(wǎng)科技巨頭。SQuAD是斯坦福大學(xué)發(fā)起的機(jī)器閱讀領(lǐng)域頂級(jí)賽事,主要測(cè)試機(jī)器對(duì)文本的理解能力,也就是機(jī)器閱讀能力。今年互聯(lián)網(wǎng)女皇的報(bào)告就是引用的SQuAD排名來(lái)分析AI行業(yè)的發(fā)展情況,可見(jiàn)該賽事在AI領(lǐng)域的影響力。
△2018年7月10日SQuAD排名
為了解目前AI在教育領(lǐng)域的落地,窺探未來(lái)AI對(duì)教育領(lǐng)域的影響,i黑馬&火柴盒記者對(duì)猿輔導(dǎo)聯(lián)合創(chuàng)始人、技術(shù)負(fù)責(zé)人郭常圳進(jìn)行了專(zhuān)訪。
1“比媒體上看到的要悲觀”
“如何看待AI+教育,AI將會(huì)顛覆教育?”i黑馬&火柴盒問(wèn)道。
郭常圳沒(méi)有想象的那么激動(dòng),慢慢地回答,“我個(gè)人對(duì)這個(gè)的看法,還是比媒體上看到的那些要悲觀?!?/p>
“我認(rèn)為現(xiàn)在處于技術(shù)高峰之后相對(duì)緩慢的一個(gè)階段,2014年、2015年深度學(xué)習(xí)技術(shù)達(dá)到高峰,之后變得平緩。機(jī)器學(xué)習(xí)是一個(gè)基礎(chǔ)技術(shù),深度學(xué)習(xí)是機(jī)器學(xué)習(xí)里面的一條路徑。至于如今提得更多的AI概念,也就是機(jī)器學(xué)習(xí)換了個(gè)時(shí)髦的說(shuō)法?!?/p>
2014年年中,猿輔導(dǎo)應(yīng)用研究團(tuán)隊(duì)成立,該團(tuán)隊(duì)運(yùn)用深度學(xué)習(xí)技術(shù),打造出拍照搜題APP小猿搜題,開(kāi)源了分布式機(jī)器學(xué)習(xí)系統(tǒng)ytk-learn和分布式通信系統(tǒng)ytk-mp4j。到了2016年,猿輔導(dǎo)內(nèi)部便開(kāi)始看高考機(jī)器人的方向。
郭常圳表示,“我們摸了一圈這個(gè)機(jī)器人,高考機(jī)器人參加高考的話,能夠考個(gè)一本就不錯(cuò)了?!?/p>
郭常圳說(shuō)的是實(shí)話。留意市場(chǎng)不難發(fā)現(xiàn),眾多高考機(jī)器人都從考清華北大改成考本科,從考全部科目改成考單個(gè)科目,這也從側(cè)面反映了高考機(jī)器人挑戰(zhàn)真人學(xué)生的難度。據(jù)介紹,在眾多科目當(dāng)中,數(shù)學(xué)是最簡(jiǎn)單的科目。拿語(yǔ)數(shù)英三大科排序的話,數(shù)學(xué)——英語(yǔ)——語(yǔ)文,難度逐漸上升。
“我們發(fā)現(xiàn),英語(yǔ)學(xué)科的選詞填空題目上,機(jī)器人顯著高于人類(lèi)平均水平。但整體上讓機(jī)器人考到140分以上,還是很有難度的”,于是,猿輔導(dǎo)的一個(gè)項(xiàng)目團(tuán)隊(duì)開(kāi)始參加SQuAD、MSMARCO等國(guó)際賽事。
郭常圳稱(chēng),“我們?cè)噲D去拓展一下技術(shù)推進(jìn)教育的邊界,我們?nèi)ネ埔煌啤H绻覀冏罱K推動(dòng)了,這也是一個(gè)面向未來(lái)的事情。”
前文提到,郭常圳對(duì)AI+教育持“悲觀”的態(tài)度,并非是否定AI的作用。他表示,產(chǎn)生極其智慧的機(jī)器人,能夠高考考滿(mǎn)分,自主輔導(dǎo)學(xué)生學(xué)習(xí),是悲觀的、困難的,但用AI技術(shù)來(lái)輔助教育,這個(gè)是可以看到明顯進(jìn)步的。
郭常圳認(rèn)為,AI+教育的技術(shù)大體可以分為兩大類(lèi)。
一類(lèi)叫做外掛工具。比如說(shuō)拍照搜題技術(shù)和基于人臉識(shí)別的學(xué)習(xí)情緒識(shí)別技術(shù),本質(zhì)上跟學(xué)習(xí)沒(méi)關(guān)系,只是用來(lái)識(shí)別題目?jī)?nèi)容和學(xué)生狀態(tài)。另一類(lèi)就是學(xué)習(xí)本身,比如清晰地知道學(xué)生缺乏哪種具體的學(xué)習(xí)能力,進(jìn)而提出解決方案。
具體落到學(xué)科,郭常圳認(rèn)為,目前AI在教育上的應(yīng)用,真正可以落地的就是英語(yǔ)。語(yǔ)言學(xué)習(xí)相對(duì)比較簡(jiǎn)單,機(jī)器能夠衡量并訓(xùn)練用戶(hù)的語(yǔ)言能力。
2“鼠標(biāo)加水泥”
1995年,中國(guó)電信開(kāi)通了北京、上海兩個(gè)接入Internet的節(jié)點(diǎn)。之后,信息高速公路架到中國(guó)。
“2000年左右,pc互聯(lián)網(wǎng)的發(fā)展,成就了BAT和三大門(mén)戶(hù)。2010年,移動(dòng)互聯(lián)網(wǎng)出現(xiàn),TMD等新勢(shì)力初露端倪。你會(huì)發(fā)現(xiàn),只有外部環(huán)境發(fā)生劇烈變化的時(shí)候,才有大的機(jī)會(huì)。”郭常圳表示,感覺(jué)到大環(huán)境發(fā)生了變化,教育行業(yè)的市場(chǎng)又非常大,便加入李勇、帥科、李鑫團(tuán)隊(duì)在2012年創(chuàng)辦了粉筆網(wǎng)(i黑馬&火柴盒注:粉筆網(wǎng)是一個(gè)教育社區(qū),這也是猿輔導(dǎo)的前身)。
作為猿輔導(dǎo)技術(shù)負(fù)責(zé)人,郭常圳在收集中不斷提及“鼠標(biāo)加水泥”的觀點(diǎn),這和他的性格一樣,相對(duì)于虛無(wú)縹緲的概念,更注重實(shí)際的落地?!耙环矫媸牵鶕?jù)技術(shù)發(fā)展到哪一步。另一方面,要看家長(zhǎng)和學(xué)生有什么需求。教育企業(yè)不能自己描述一個(gè)美好的未來(lái),然后又沒(méi)有路徑去實(shí)現(xiàn),甚至實(shí)現(xiàn)了也沒(méi)用戶(hù)接受?!?/p>
復(fù)盤(pán)猿輔導(dǎo)的產(chǎn)品路線,需求導(dǎo)向深深地烙在每一個(gè)產(chǎn)品上。
2013底,發(fā)現(xiàn)高三學(xué)生考試壓力大,并且市場(chǎng)缺乏優(yōu)質(zhì)題庫(kù)后,猿輔導(dǎo)推出了智能題庫(kù)——猿題庫(kù)。到了2014年,拍照識(shí)別技術(shù)較為成熟,結(jié)合學(xué)生解題答疑的需求,猿輔導(dǎo)推出了拍照搜題APP——小猿搜題。之后又在拍照答疑的基礎(chǔ)上,上線了名師講題的視頻。通過(guò)兩個(gè)“殺手級(jí)”產(chǎn)品,猿輔導(dǎo)獲取到巨大的流量和數(shù)據(jù),并于2015年6月正式上線猿輔導(dǎo)在線課程,進(jìn)一步探索盈利變現(xiàn)。
除了三大主營(yíng)業(yè)務(wù)產(chǎn)品,郭常圳介紹,猿輔導(dǎo)還根據(jù)不同的需求做出了眾多產(chǎn)品工具。比如,發(fā)現(xiàn)家長(zhǎng)批改孩子口算題比較費(fèi)時(shí)間,就推出了小猿口算;去年9月,鑒于AI技術(shù)可用來(lái)解決學(xué)英語(yǔ)的難題,順勢(shì)推出了斑馬英語(yǔ)。
目前,在線啟蒙英語(yǔ)賽道尤其火熱,除了猿輔導(dǎo)斑馬英語(yǔ),還有寶寶玩英語(yǔ)、嘰哩呱啦、寶貝英語(yǔ)說(shuō)、英語(yǔ)小神童、貝殼親子英語(yǔ)、大塘小魚(yú)(新東方)、酷學(xué)多納(新東方在線)、VIPKID自由星球、DaDaBaby、粉筆kids等眾多玩家。巨頭、獨(dú)角獸、初創(chuàng)企業(yè)均搶占0-6歲英語(yǔ)早教這一入口。
郭常圳向i黑馬&火柴盒介紹了斑馬英語(yǔ)的三個(gè)特點(diǎn):
第一,斑馬英語(yǔ)擁有多種形式的內(nèi)容。比如,會(huì)提供配上音頻的繪本故事,會(huì)做一系列的動(dòng)畫(huà)片,也會(huì)有外教錄播視頻,使得孩子可以聽(tīng)看和跟讀。
第二,斑馬英語(yǔ)還可以達(dá)到效果監(jiān)測(cè)。AI系統(tǒng)會(huì)去監(jiān)測(cè)孩子聽(tīng)了哪個(gè)句子,聽(tīng)了哪個(gè)單詞,聽(tīng)了哪個(gè)音標(biāo),以及評(píng)估哪些音發(fā)的好和不好,然后智能地推送孩子不熟悉的內(nèi)容。
第三,內(nèi)容可編程,固定內(nèi)容只占50%。如果發(fā)現(xiàn)孩子Apple的A的音發(fā)的不好,同時(shí)發(fā)現(xiàn)這個(gè)孩子的過(guò)去完成時(shí)掌握的不好,就會(huì)讓孩子聽(tīng)練“我昨天吃了一個(gè)蘋(píng)果”,而不是“我在吃一個(gè)香蕉”。并且,在斑馬英語(yǔ)中,固定生產(chǎn)的內(nèi)容只占50%,另外一半都是實(shí)時(shí)編程的。
3“最核心的是得有數(shù)據(jù)”
教育界流傳一句話,沒(méi)有教研和數(shù)據(jù)的“AI+教育”企業(yè)都是耍流氓。
教、學(xué)、練、測(cè)、評(píng)等各個(gè)環(huán)節(jié)的數(shù)據(jù),對(duì)于教育科技公司來(lái)說(shuō)都尤為重要。郭常圳表示,猿輔導(dǎo)的數(shù)據(jù)主要體現(xiàn)在猿題庫(kù)的練習(xí)數(shù)據(jù)?!?012年,我們把搜集到的試卷錄入到題庫(kù)系統(tǒng),并且請(qǐng)專(zhuān)業(yè)老師來(lái)做解析,花了2年的時(shí)間才建立好初步版本”,郭常圳介紹稱(chēng),“相較于小猿搜題等產(chǎn)品的數(shù)據(jù),猿題庫(kù)的數(shù)據(jù)具有非常高質(zhì)量的結(jié)構(gòu)化”。
“題庫(kù)我們花了大量的工夫去做結(jié)構(gòu)化,目前市面上其他所謂的自適應(yīng),我們都覺(jué)得不太靈,因?yàn)槟莻€(gè)數(shù)據(jù)不夠結(jié)構(gòu)化?!?/p>
目前來(lái)看,題庫(kù)的數(shù)據(jù)主要體現(xiàn)在文本數(shù)據(jù)和練習(xí)數(shù)據(jù)兩個(gè)方面。進(jìn)而,這些數(shù)據(jù)能夠直接作用到教育的教、練、測(cè)等環(huán)節(jié)。
首先,數(shù)據(jù)能夠優(yōu)化教研系統(tǒng)和教學(xué)過(guò)程。比如,老師該講哪道題、不講哪道題,通過(guò)數(shù)據(jù)來(lái)挑選,是有很大價(jià)值的。
其次,數(shù)據(jù)能夠提高練習(xí)環(huán)節(jié)的效率。比如,猿輔導(dǎo)直播課講完一個(gè)知識(shí)點(diǎn)后,就可以精準(zhǔn)地推送給學(xué)生隨堂練習(xí)的習(xí)題。練完之后,根據(jù)題目的正確率再輔助老師判斷重點(diǎn)講哪道題目。
最后,測(cè)試環(huán)節(jié)也很關(guān)鍵。一方面,如同練習(xí)環(huán)節(jié),數(shù)據(jù)可以提高測(cè)試的效率。另一方面,測(cè)試的數(shù)據(jù)可以反過(guò)來(lái)進(jìn)一步優(yōu)化算法?!拔覀兘衲昱e辦了一場(chǎng)高三模擬考試,有60多萬(wàn)人報(bào)名,這些數(shù)據(jù)全是結(jié)構(gòu)化數(shù)據(jù),能夠進(jìn)一步優(yōu)化算法?!?/p>
“算法并沒(méi)有多復(fù)雜,最核心的是得有數(shù)據(jù)”,從猿題庫(kù)智能題庫(kù)到小猿搜題工具再到猿輔導(dǎo)在線課程,猿輔導(dǎo)形成商業(yè)閉環(huán)的同時(shí),也構(gòu)建了數(shù)據(jù)的閉環(huán)和倉(cāng)庫(kù)。
收集數(shù)據(jù)很關(guān)鍵,郭常圳舉了一個(gè)例子:“當(dāng)一位學(xué)生做選擇題時(shí),用了1分鐘,這時(shí)手機(jī)屏幕可能會(huì)暗下去了,學(xué)生就得再點(diǎn)一下。我們會(huì)去探知這些行為,分析并計(jì)算答題的有效時(shí)間,然后進(jìn)行記錄。這些都是很有價(jià)值的東西,不能丟?!?/p>
本文轉(zhuǎn)自微信公眾號(hào)“i黑馬”,作者張乘輔。文章為作者獨(dú)立觀點(diǎn),不代表芥末堆立場(chǎng)。
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車(chē)馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫(xiě)信息告訴我們。