松鼠Ai創(chuàng)始人栗浩洋在GET2024分享
11月11日至12日,芥末堆在北京舉辦以“新質(zhì)學(xué)習(xí)力,通向更美好的教育未來”為主題的GET2024教育科技大會(huì)。在12日的領(lǐng)袖論壇上,松鼠Ai創(chuàng)始人栗浩洋就《AI自習(xí)室沒有大模型能走下去嗎?》進(jìn)行了主題分享。
以下為演講實(shí)錄,經(jīng)編輯:
栗浩洋:大家好,能出現(xiàn)在最后一天這個(gè)時(shí)候都是教育科技行業(yè)的鐵粉,非常感謝大家的守候,希望能夠給大家?guī)硪恍└韶洝I自習(xí)室很火,大模型也很火,我和大家分享這兩者結(jié)合在一起能夠有什么價(jià)值。
大語言模型是用大模型做了漢字或者英文單詞的排序。而我們知道SORA,生成視頻跟大語言模型沒有任何關(guān)系,它是用大模型做了一個(gè)像素的排序。如果一款產(chǎn)品只是跟學(xué)生說幾句話,那只是用了大語言模型API,并不是自己做出了大模型。
松鼠Ai的大模型也不是大語言模型,而是學(xué)生的學(xué)習(xí)順序排序——這個(gè)學(xué)生應(yīng)該學(xué)什么、不應(yīng)該學(xué)什么、先學(xué)什么、后學(xué)什么,這看起來很簡(jiǎn)單,但等一下大家會(huì)知道玄妙在哪里。
過去十年我們一直都在做這個(gè)事情,而且是在松鼠Ai的統(tǒng)一系統(tǒng)里面,我們有了2400萬學(xué)生100億學(xué)習(xí)行為數(shù)據(jù),才可以訓(xùn)練這樣大模型,這是我們不同的Agent。
大模型是什么?就是參數(shù)量大,大家聽說過1000億參數(shù)、100億參數(shù),參數(shù)是什么呢?我舉個(gè)例子,大家吃過魚香肉絲,但你每次吃味道都不一樣,原因是什么呢?就是參數(shù)在變化。有時(shí)候你吃的魚香肉絲幾乎沒有肉,說明肉的數(shù)量就是一個(gè)參數(shù),蔬菜數(shù)量也是一個(gè)參數(shù),炒的火候又是一個(gè)參數(shù),當(dāng)所有參數(shù)都對(duì)的時(shí)候,你就吃到了你一生中最愛的魚香肉絲。
對(duì)于大模型來說,我們簡(jiǎn)單的講,大參數(shù)就是給了你無限的可能性,來找到最優(yōu)解、最好的方案。
我們可以回憶一下Alpha Go的表現(xiàn),當(dāng)年還是深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)的時(shí)代。而我們現(xiàn)在已經(jīng)進(jìn)入到大模型時(shí)代,AI可以思考100億步、1000億步,它一定能找到最好最優(yōu)解。AI在設(shè)計(jì)層面的像素也可以找的比人類準(zhǔn),盡管會(huì)出錯(cuò),但AI能把1000億種可能性畫出來,最后再用概率排序找出最優(yōu)解,一定比你畫得好。未來任何一個(gè)畫家也趕不上AI,就是因?yàn)閰?shù)量可能還會(huì)更大,這就是參數(shù)量大的意義。
參數(shù)量變大之后能解決什么問題呢?解決暗邏輯,人類不理解的邏輯。
柯潔當(dāng)年哭就是因?yàn)槿祟悗浊陙淼恼J(rèn)知被沖擊了,AI竟然想出了和人類直覺完全相反的路徑。我們松鼠Ai也是,我們的教學(xué)路徑跟常規(guī)的認(rèn)知,跟特級(jí)教師的認(rèn)知有一半多是完全相反、逆他們的方向和思維做的,這就是暗邏輯。
回到自習(xí)室,這些大模型的大參數(shù),暗邏輯,對(duì)人工智能自習(xí)室有什么關(guān)系呢?自習(xí)室最難的是什么?不像一對(duì)一輔導(dǎo),現(xiàn)在成績(jī)不好的學(xué)生來了自習(xí)室是厭學(xué)的,他90%的時(shí)間是走神的,他不能控制自己的思維。
我們看一個(gè)松鼠Ai的案例,一個(gè)被認(rèn)為厭學(xué)、精神專注力有問題,每周要看醫(yī)生的孩子。他學(xué)了100分鐘,我們就得出了一個(gè)診斷報(bào)告,18個(gè)知識(shí)點(diǎn)測(cè)出來12個(gè)漏洞,成績(jī)方面這個(gè)孩子是極差生。
這個(gè)孩子精神有沒有問題?我們看進(jìn)步幅度的標(biāo)簽,學(xué)習(xí)報(bào)告里有大量的知識(shí)點(diǎn)進(jìn)步幅度在40%、60%,說明這個(gè)孩子在100分鐘里非常認(rèn)真用心專注學(xué)習(xí),在大量知識(shí)點(diǎn)上有了成長(zhǎng)和進(jìn)步,而我們最怕的是進(jìn)步只有10-20%孩子,等于什么都沒有學(xué)會(huì)。
但是通過另外一個(gè)數(shù)據(jù)報(bào)告可以發(fā)現(xiàn),他可能存在一些問題。每一道題的做題時(shí)間,我們用藍(lán)色曲線標(biāo)注出來,再和橘色的全國(guó)平均時(shí)間曲線比較,我們可以看到這個(gè)孩子大概率是有容易走神的問題,也可能是個(gè)不算聰明的孩子,但是他至少是用心的。
比如,平均用時(shí)47秒的題他用了五分鐘,但是他做對(duì)了,而且這是一道系統(tǒng)標(biāo)注為難度系數(shù)76級(jí)的題,已經(jīng)超過了這個(gè)同學(xué)當(dāng)時(shí)的能力范圍,但他花了五倍時(shí)間用心做出來了。
如果你習(xí)慣去分析大數(shù)據(jù),你會(huì)發(fā)現(xiàn)這個(gè)圖里還有一些問題。我們可以看到,這個(gè)孩子19題做錯(cuò)了之后放棄了,沒有作答,連續(xù)20到23題全部放棄了,說明做錯(cuò)題之后心態(tài)崩了。而且從題目難度系數(shù)的角度來說,這道26級(jí)難度的題完全可以做出來。那么,剛才他只差一步,所以系統(tǒng)又把難度降到17級(jí),按道理這時(shí)候應(yīng)該百分之百可以做對(duì),但他又沒有做,我們系統(tǒng)最后降到1級(jí)難度,他才慢慢從20多級(jí)難度升到70多級(jí)水平。
這里的關(guān)鍵在于這個(gè)孩子心態(tài)崩潰連續(xù)放棄答題之后為什么又接上了,為什么不再厭學(xué),不放棄了。因?yàn)橄到y(tǒng)一直給他1級(jí)難度的題目,幾乎是類似1+1=2的題,讓他又找回自信了,然后系統(tǒng)再不斷給他難題,再重新慢慢拉高難度,所以在這100分鐘時(shí)間里大部分知識(shí)點(diǎn)都有了提升。
所以我想表達(dá)的是,學(xué)習(xí)路徑是多么重要,在大模型的幫助下,每一道題的難度系數(shù)變化都可以看出對(duì)孩子的心情、心態(tài)產(chǎn)生什么影響。像這樣一個(gè)基礎(chǔ)較差的孩子,他平時(shí)在學(xué)校里面大部分80多級(jí)難度題,偶爾能做對(duì)幾個(gè),但根本沒多少20多級(jí)難度的題來持續(xù)給他信心,他為什么厭學(xué)的原因就在于此。
如果你的AI自習(xí)室給學(xué)苗、學(xué)霸都上一樣的課,這樣自習(xí)室不崩才怪,你沒有AI,沒有算法,沒有一個(gè)能理解孩子、給他安慰的方法,這中間家長(zhǎng)根本不知道怎么回事。而這就是AI的價(jià)值,這不是任何人類老師可以做到的,這樣AI自習(xí)室不再僅僅是自習(xí)室,而是在讓學(xué)生跟著AI超級(jí)智能老師學(xué)習(xí),沒有一個(gè)特級(jí)老師能夠與之相比。
再來聊聊AI自習(xí)室怎么征服學(xué)霸。學(xué)霸他在家也可以自習(xí),為什么要來你的自習(xí)室?
我們有一個(gè)名校北師大附中的孩子,七年級(jí)平時(shí)最多扣三四分,但從來沒有得過滿分。他剛用我們系統(tǒng),上來就把他降到四年級(jí)水平去學(xué)習(xí)了,四年級(jí)學(xué)了一個(gè)月又降到三年級(jí)學(xué)習(xí)了。他父母是雙博士,母親更是一個(gè)家庭教育集團(tuán)四千家連鎖店的老板。他母親當(dāng)時(shí)在群里面就跳出來說,你們松鼠Ai什么人工智能?人工智障吧,我家孩子不是哪里不會(huì)學(xué)哪里,97分只學(xué)3分不會(huì)就行了,你為什么讓他學(xué)四年級(jí)、三年級(jí)的呢?
很簡(jiǎn)單,我們看數(shù)據(jù)。你在三年級(jí)幾百個(gè)知識(shí)點(diǎn)里有12個(gè)漏洞,你在四年級(jí)知識(shí)點(diǎn)有19個(gè)漏洞,雖然你的漏洞只有10%、5%,但這些漏洞到了高年級(jí)的時(shí)候遇到混合出題,五個(gè)知識(shí)點(diǎn)、八個(gè)知識(shí)點(diǎn)混合出題,有的時(shí)候你沒有卡在同步知識(shí)點(diǎn),卡在前置知識(shí)點(diǎn)里面。
我說你們家孩子考試之后是不是經(jīng)常一拍大腿說這題怎么能錯(cuò)呢,他說你怎么知道,我說很簡(jiǎn)單,我們算法找到了問題。你不需要通過七年時(shí)間學(xué)過去七年的內(nèi)容,這個(gè)孩子在松鼠Ai只用了56個(gè)小時(shí),就把過去的知識(shí)漏洞補(bǔ)完了,然后就考了五年沒有考過的100分,很開心。
但是有一天,他的同步課突然只有75%正確率,他說太痛苦了,今天怎么只有75分,而我看了數(shù)據(jù)以后,我說你不是75分,你是99.5分。因?yàn)橄到y(tǒng)給他推的題是多少級(jí)別,99級(jí),這是什么意思呢?中考的最后一道題才是99級(jí)難度,我們把全中國(guó)所有中考的最后一題都匯集過來,才能夠在幾百個(gè)知識(shí)點(diǎn)找到這么多的99級(jí)題目,給到這個(gè)學(xué)霸來訓(xùn)練。這孩子說AI太智能了。
所以,有了大模型的加持,AI自習(xí)室不會(huì)浪費(fèi)學(xué)霸一分鐘時(shí)間,因人而異給到不同的人完全不同的學(xué)習(xí)路徑。
那么AI自習(xí)室和名師相比,又是什么水平?
一個(gè)AI教育公司沒有做過人機(jī)大戰(zhàn),基本上說明你技術(shù)完全不成熟,我們2017年在亞太地區(qū)第一個(gè)做人機(jī)大戰(zhàn),至今已經(jīng)做了七次,全部獲得成功。幫一些個(gè)別孩子提升分?jǐn)?shù)非常簡(jiǎn)單,但你能不能讓整個(gè)班,甚至百人、萬人超過同時(shí)提升?
在國(guó)家教育部期刊上面的論文,有我們松鼠Ai人機(jī)大戰(zhàn)的數(shù)據(jù),結(jié)果是比實(shí)驗(yàn)班的教師高出31.2分。我們是第一個(gè)有智慧的大模型,我們的大模型不是跟孩子對(duì)話,我們最核心的應(yīng)用,在于能夠識(shí)別孩子的錯(cuò)因。這道題孩子有草稿紙,我們看出來以為時(shí)鐘敲11下是11個(gè)間隔,實(shí)際上是10個(gè)間隔,他可以深度理解這個(gè)孩子錯(cuò)因,然后給對(duì)癥下藥。
一道題目,全國(guó)的孩子最多能有977種錯(cuò)法。這997種錯(cuò)因,你能一樣對(duì)待嗎,不能。人類老師很難一一應(yīng)對(duì),只能是AI,只有大模型可以。大模型已經(jīng)可以理解孩子是自律有耐心的還是草率的,是喜歡挑戰(zhàn)的還是畏難的,是有小聰明還是堅(jiān)韌不拔的,我們整個(gè)模型對(duì)于孩子性格描述可以通過兩個(gè)小時(shí)就非常精準(zhǔn)地給出畫像,然后我們?cè)賹?duì)他進(jìn)行對(duì)癥下藥,千姿百態(tài)的大模型算法對(duì)應(yīng)的是千姿百態(tài)的學(xué)生,即“千人千面”。
我父親是一名特級(jí)教師,市教研室主任,他幫助了無數(shù)學(xué)生提升。但他能夠幫助七、八十分孩子提升,不可能幫助不及格學(xué)生提高上來。而我們已經(jīng)可以幫助30分水平的孩子考到130分,七年級(jí)需要一年半的時(shí)間,八年級(jí)需要兩年的時(shí)間,大概需要600-700小時(shí)。
你想要的分?jǐn)?shù),在大模型眼里就是你的學(xué)習(xí)速度和你的學(xué)習(xí)時(shí)間。一般來說,開頭差生會(huì)非常慢,一二三年級(jí)要求反復(fù)學(xué)習(xí)好幾次,但之后被我們的算法推起來后,這些孩子的學(xué)習(xí)速度會(huì)越來越快。大家常說的笨孩子、差生并不是如你想象的那樣,人的大腦智能幾乎是相當(dāng)?shù)?,只不過有的孩子就是慢一點(diǎn),只是他需要你兩倍的時(shí)間,就可以解決。
我們的大模型能夠解決這么多問題,背后就是我們強(qiáng)大的技術(shù)實(shí)力。松鼠Ai所獲得的國(guó)家發(fā)明專利,并且拿到授權(quán)的有110多個(gè)發(fā)明專利。北交所專精特新需要2項(xiàng)發(fā)明專利,我們有112項(xiàng)。此前在為期五天的UNESCO人工智能全球大會(huì)的第一天最高級(jí)別的全球教育部長(zhǎng)論壇,我是唯一一個(gè)非部長(zhǎng)參與這個(gè)論壇討論并演講的嘉賓。
在43萬科學(xué)家組成的IEEE協(xié)會(huì),BAT有兩個(gè)標(biāo)準(zhǔn)委員會(huì)委員,而華裔主席華為有一個(gè),我是第二個(gè)。我是IEEE人工智能教育大模型標(biāo)準(zhǔn)組主席,也算是給中國(guó)教育科技爭(zhēng)口氣。全球40多個(gè)國(guó)家的83位科學(xué)家都在我做主席的標(biāo)準(zhǔn)委里面申請(qǐng)成為我的委員。
最后我想說,大部分人對(duì)新生事物往往會(huì)從“看不到”到“看不起”到“來不及”,我們無論對(duì)抖音還是拼多多等等都是,我相信很多人對(duì)人工智能也曾是這樣的感覺。
十年前做人工智能更不用說了,那個(gè)時(shí)候共享經(jīng)濟(jì)非?;穑业南聦俣寄昧藘?、三億融資,我2000萬都拿不到。我在2014年拿不到錢,因?yàn)榇蠹也恢廊斯ぶ悄苁鞘裁?。所以我們今天不是趕上風(fēng)口,我們是蹲了十年,一直蹲到了這個(gè)風(fēng)口。
我們也希望一些有識(shí)之士,愿意跟我們一起合作,把人工智能教育真正推廣普及出來。我認(rèn)為人工智能教育大模型是對(duì)整個(gè)行業(yè)的一場(chǎng)顛覆,而做AI自習(xí)室,你要想讓孩子來自習(xí),你就得擁有世界最強(qiáng)的大模型技術(shù),謝謝大家。
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。