芥末堆 吉吉 11月14日
11月14日,在以“共建丨讓更好的教育來得更快”為主題的GET2017教育科技大會上,猿輔導聯(lián)合創(chuàng)始人李鑫分享了小猿搜題上線三年,猿輔導在這一產(chǎn)品線上的思考與決策,李鑫表示,三年的時間,小猿搜題已成為中小學生入口級產(chǎn)品。
他透露,猿輔導在4年前建了一個AI的團隊,而小猿搜題也是這個團隊貢獻的第一個產(chǎn)品,“我們這款產(chǎn)品有很多的用戶,在這樣的情況下,大量的數(shù)據(jù)對AI產(chǎn)生更強勁的影響?!?/p>
“我主要講的其實是我們這3年做了哪幾件事情,其實總結(jié)來講有三個階段,第一階段工具,第二階段內(nèi)容、第三階段我們要開始做學習這件事情?!崩铞握f。
李鑫希望,學生從一個不會做題的入口進來,通過他們的內(nèi)容與產(chǎn)品能徹底解決這道題不會做的背后存在問題,完成一個學習的閉環(huán),智能學習引擎是他們今年在做的事。
以下是李鑫演講實錄(芥末堆略有刪減):
感謝芥末堆和初九的邀請,來之前我看了一下議程,發(fā)現(xiàn)這個議程有三天,我就震驚了。要么就是芥末堆太火了,要么就是教育行業(yè)太火了。
很高興有機會跟大家交流,我也想了一下,剛初九也講了,我們其實是很少在公開場合講,倒不是說,我們有什么不愿意的,是我們確實覺得現(xiàn)在還是一個非常早期的階段,其實很多東西我們還在摸索之中,公開去講,不知道是好事還是壞事,但是今天來了,剛好這個時間點,正好是我們公司的產(chǎn)品小猿搜題上線三周年的時間點,我們想借這個機會給大家分享一下我們在這個產(chǎn)品線上的產(chǎn)品決策、思考。
小猿搜題已成為中小學生入口級產(chǎn)品
這是我們公司的一些產(chǎn)品,這個是K12的板塊,我們最早是做了猿題庫產(chǎn)品,猿題庫是一個學習練習系統(tǒng),學生可以通過猿題庫做大量的練習,因為我們之前覺得中國的學生在做題和練習這個環(huán)節(jié)投入時間比較大,我們希望能夠通過科技的手段去幫助他們在練習過程當中提高效率。
接下來第二年,也就是2014年,我們上線了小猿搜題這個產(chǎn)品。這是一個拍照答疑的產(chǎn)品,簡單來講,如果遇到不會做的題,用這個拍照可以告訴你這道題應該怎么做。
猿輔導是我們剛剛上線一兩年的產(chǎn)品,這是一個在線輔導的產(chǎn)品,因為過去我們在一些產(chǎn)品和數(shù)據(jù)上的積累,我們覺得可以給學生提供一些對接老師和學生的服務,所以我們做了這么一個產(chǎn)品。
后面兩個產(chǎn)品也是我們剛剛上線幾個月的新產(chǎn)品,可能是針對年紀更輕的一些小孩使用。
小猿搜題這三周年確實可以總結(jié)一些我們在過程當中的思考。其實現(xiàn)在看來這個產(chǎn)品,我們覺得拍照搜題這個產(chǎn)品確確實實已經(jīng)成為學生的入口產(chǎn)品。
我們剛開始做這個產(chǎn)品的時候,很多人在問,未來這個產(chǎn)品會成為一個入口嗎?其實當時我們也不確定,我們覺得拍照搜題是解決學生答疑的問題,答疑的需求量應該是很大的,在各個體系里面都可能會,不管在什么樣的學習系統(tǒng)里面,都可能會有答疑的需求。
如果能夠把這個產(chǎn)品做好,它可能會成為一個用戶量很大的產(chǎn)品,但是我們也沒有覺得它是一個入口。 之所以說它是一個入口,因為我們看到拍題量很大,用戶量也很大,數(shù)據(jù)當然沒有太大的意義。我只是說,它的使用場景現(xiàn)在是一個普遍性的使用場景,在教育行業(yè),如果找到一個使用人數(shù)非常多的產(chǎn)品,其實是不太容易的,它需要一個很強的需求,而且你要認可它。所以,我們覺得現(xiàn)在這個產(chǎn)品是這么一個階段。
人工智能在學生學習場景下的實際應用
我們看到有很多教育公司都會談AI,我們公司在4年前建了一個AI的團隊,小猿搜題是我們這個團隊貢獻的第一個產(chǎn)品,很幸運,我們這個產(chǎn)品拿到了很多的用戶,在這樣的情況下,大量的數(shù)據(jù)對AI產(chǎn)生更強勁的影響。
比如說,我去統(tǒng)計了一下我們的數(shù)據(jù),大家知道最一開始拍題的場景,用戶他是有練習冊,或者學校是發(fā)一份試卷、作業(yè),它是印刷體,所以他拍照上來,然后我們?nèi)プR別它。后來我們就發(fā)現(xiàn),其實很多的學生,不知道場景是什么樣的場景,可能他是做筆記或者其它的,或者拍的錯題本,很多的題目是手寫的,我們看了這個系統(tǒng)里面,差不多每天用50-60萬條手寫的題目在拍照上傳。
但是,我們機器學習的團隊一直在適應手寫。我們的手寫識別率是非常高的,而且數(shù)據(jù)量非常大,因為它要依賴大量的數(shù)據(jù),所以其實我們也看到很多公司,比如說在研究手寫筆或者其它相關的產(chǎn)品,它其實是想識別學生的筆記,但其實這個量是很大的。所以,在后續(xù)的時候,如果對學生的判卷做了很多的事情,其實都是在依賴于這個數(shù)據(jù)。
我們上面有一個功能叫“英語作文的批改”,如果他寫了篇英語的作文,他是可以直接拍照來批改的,寫英語作文也是手寫的,我們每天上傳的這個數(shù)據(jù)也是幾萬篇的數(shù)據(jù)。
所以,我們在手寫識別領域,即使放到整個的互聯(lián)網(wǎng)行業(yè)應該也是最領先的,因為沒有人有我們這樣大量的數(shù)據(jù)和場景應用。因為,很多印刷的應用可能很多公司是有很多的數(shù)據(jù),但是大量手寫的這個場景其實非常少的。
包括英語批改,我們最近馬上要發(fā)的一個版本,大家都知道拍照有一個叫美圖秀秀的軟件,就是你拍完了之后就可以美化一下,我們之前的批改是你給你評分,告訴你哪些句子、單詞、語法錯了,我們會把它列出來,接下來我們有一個功能(基于大量好的作文學習之后,我們有一個功能叫一鍵美化),就是英文作文寫了一篇之后,其實寫的不太好,但是你點這個按紐,我們很快就會幫你優(yōu)化下,覺得在哪個句子上你可以替換成一個什么樣的句子會讓你有更高的分數(shù),同時會告訴你為什么要這樣做。
這個都是一些場景的應用,我們也有一個古詩文的助手,這個主要是學生會背詩、背一些古文,因為高考、中考都會考一些相關的內(nèi)容,所以,很多的學生會通過這個練習,我們用他的數(shù)據(jù)來做訓練,所以會提供一個更好的產(chǎn)品。但是,這些應用其實在產(chǎn)品的層面還是剛剛開始。
三年,從工具到學習引擎
我主要講的其實是我們這三年我們做了哪幾個事情,其實總結(jié)來講有三個階段,我的標題叫《從工具到學習引擎》,第一階段工具,第二階段內(nèi)容,第三階段我們要開始做學習這件事情。
>>工具
既然它是一個工具,如何在學生拍了題之后,準確的幫他識別,然后找到他想要的信息,所以我們第一個階段其實重點是在做識別率。最開始整個行業(yè)的識別率都不高,我印象當中我們上線的時候是60%左右,到后面接近95%,這是我們一直在提升的階段,這個階段其實也是我們的用戶增長非??斓囊粋€階段。
但是,在這個階段(2015年)整個行業(yè)和社會上都在討論一個問題,其實到現(xiàn)在為止我認為很多沒有用過產(chǎn)品只是聽說過的人,他可能都會有一個疑問:你的產(chǎn)品小孩會用來抄作業(yè)嗎?
從我們這個角度肯定不是這樣的一個設想,如果是這樣設想這個產(chǎn)品是沒有什么價值的,但是當時大家有這樣的一個分歧如下:
一個產(chǎn)品它在傳播的過程當中,大家可能會挑實現(xiàn)功能最強的那個點,大家會認為馬上會出來答案,所以這個東西很神奇,它會發(fā)生自然的傳播。
其實我覺得當時的互聯(lián)網(wǎng)教育也剛剛開始,整個行業(yè)我感覺也不是思考地很清,我看了很多同類的產(chǎn)品,會在廣告、推廣當中會提到,用了這個產(chǎn)品作業(yè)寫得很快。甚至我們看到,也有當時做得好的拍照搜題還提供了一些額外的產(chǎn)品入口,比如說拍寒假作業(yè)的封面,就可以出這本書的答案,我覺得這都是一些產(chǎn)品帶來的思考。
但是,我們在這個過程當中堅持的定位是我們一定是做學習答疑,我們覺得答疑是一個100%的需求(所有學生都會有的需求),但是抄作業(yè)肯定不是每個學生的需求,只是很少部分學生的需求,那我們肯定要做一個確定性更大的,而且價值更高的事情,所以我們堅持在這個定位上。
后來,事實上我們在一些產(chǎn)品的決策上驗證了我們的觀點,而且對我們來講是很開心的一件事情。
>>內(nèi)容
用戶拍了題之后,我們給他提供答案,有的我們也提供詳細的解析,但都是文字版的,我們覺得互聯(lián)網(wǎng)比其它有優(yōu)勢的地方就是你可以承載更多的內(nèi)容,所以我們想,如果學生能精準地拍到一道題,我們給他提供這個題的視頻講解,我們想對學生來講應該是更好的,然后我們就做了。
我們花了6個月時間做了30萬條視頻,這個篩選我們肯定是按頻率(學生搜索率),所以它是一個數(shù)據(jù)下的篩選,也就是這30萬條視頻的覆蓋率,我印象中能覆蓋到20%-30%的搜索量,也就是20%-30%的搜索量都能搜到有視頻講解的版本,這個在行業(yè)里面沒有人去做,我們先做了。
>>學習
我們堅持學生是用來學習的。有一個數(shù)據(jù)是55%。我們當時上線之后去看每一個學生搜到一道題之后,他有沒有去點老師講這道題的視頻,我們發(fā)現(xiàn)每天用戶當中有55%,只要有視頻的題,他都會去點個播放,而且完成率是百分之七八十。
看了這個數(shù)據(jù)之后,我們就更加確定這個產(chǎn)品的未來應該是解決學生學習的場景,然后去幫助他們做答疑。所以,我們在思考一個事情,學生在用小猿搜題拍一道題目的時候,他到底想得到什么,我們很多的時候會覺得,最簡單的就是他想知道這道題到底是怎么做的,我們認為這個是表面的需求。
深層次地來講,用戶為什么會用小猿搜題?我們前面已經(jīng)排除掉,他肯定不是來抄答案的,因為抄答案成本太高了,因為我們的平臺上他要一道道去拍,他通過其它的渠道抄答案應該會更簡單一些。要在沒有老師、沒有特定的人幫他解決問題的情況下,他遇到不會做的題的時候,應該怎么辦?
其實做作業(yè)是一個檢測手段,如果在這個學習過程中不會做了,那就是出現(xiàn)了信號,這個信號進來,你應該怎么辦?我們應該先幫他解決這道題應該怎么做,因為我們有大量的數(shù)據(jù),我們會希望看到怎么能夠通過這道題去解決他背后的問題,很有可能這道題不會做是有原因的,可能是某一個知識點、結(jié)構(gòu)、概念沒有理解到。
所以,我們就通過這個題往下再做一個導入,我們做了大量的切片式視頻,相關知識點的,或者相關提醒的。因為他這道題不會,讓他先知道這道題怎么做,然后再進一步地看一些名師提供的一些關于這道題不會做背后的原因,再幫你去檢查這個原因。
完了之后再通過我們的練習(通過算法給他一個類似的題目),再看他是不是會做了,如果會做了,我們認為這是完成了一個學習的閉環(huán),其實這個是我們今年做的一個事情,我們希望他從一個不會做題的入口進來,然后通過這樣的一個產(chǎn)品徹底解決他的問題,我覺得這是一個非常天然的場景,就是希望他從不會然后到徹底掌握。
其實,在做了這個事情之后,我們也在思考,當學生遇到問題的時候,他在各種場景下,比如說學校做作業(yè),或者上輔導班、猿輔導、學而思,他只要在任何的場景下,遇到學習的困難,我們都有一個24小時的幫手能夠幫他解決這個問題,我覺得這是一個非常好的互聯(lián)網(wǎng)場景。
最后我提一個疑問,我看前一段時間有人在討論AI能替代老師嗎?但是我覺得這個問題和前面幾年,大家討論在線教育到底對傳統(tǒng)教育有沒有可能顛覆是一樣的,其實我覺得這個問題是沒有太大意義的,但是我們剛才構(gòu)造這個場景能夠非常大的去節(jié)省老師的時間,你想這個時候我們批改作文,一秒鐘就可以幫你批改,很多的老師不用在這個上面花時間的,答疑也是一樣的。
我們現(xiàn)在每天去播的視頻也是幾十萬人,如果他旁邊有一個人幫他講解,我們相信這個能幫他們提高很大的效率,我覺得整個教育,不管技術,還是AI,還是新的技術出來以后,核心是怎么去提高原來的駕馭、學習的效率,我們其實只有做增值的部分,才能產(chǎn)生價值,謝謝!
2、芥末堆不接受通過公關費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。