芥末堆芥末堆

題庫(kù)產(chǎn)品:粗粒度的個(gè)性化是偽個(gè)性化

作者:李行武 發(fā)布時(shí)間:

題庫(kù)產(chǎn)品:粗粒度的個(gè)性化是偽個(gè)性化

作者:李行武 發(fā)布時(shí)間:

摘要:題庫(kù)能實(shí)現(xiàn)個(gè)性化嗎?

【芥末堆注】本篇為門外漢看在線教育系列專題之二,戳鏈接查看一:

門外漢看在線教育之一:所有K12產(chǎn)品的核心價(jià)值都是提分

上節(jié)說(shuō)到題庫(kù)有兩類,一是以學(xué)霸君為代表的拍題產(chǎn)品,一是以猿題庫(kù)為代表的組題產(chǎn)品。組題產(chǎn)品給我的感覺(jué)是在做一個(gè)“活”的練習(xí)冊(cè),“可以根據(jù)你對(duì)考點(diǎn)的掌握情況智能出題”。因?yàn)槲易约哼^(guò)去也搞過(guò)一點(diǎn)點(diǎn)大數(shù)據(jù),然后我自己用了用這個(gè)產(chǎn)品,覺(jué)得這個(gè)事情不太對(duì)。主要的問(wèn)題有兩個(gè),第一個(gè)是“先有雞還是先有蛋”。你要有大量的數(shù)據(jù)才可能訓(xùn)練出精準(zhǔn)的推送模型,可是你要足夠“智能”才可能有大量的學(xué)生使用你的產(chǎn)品。冷啟動(dòng)問(wèn)題怎么破?

在回答問(wèn)題前我吐個(gè)槽。去年6月份的時(shí)候我參加了一個(gè)小沙龍,聽(tīng)猿題庫(kù)的朋友說(shuō)用戶量已經(jīng)接近300萬(wàn)了,每天最活躍的時(shí)候是晚上十點(diǎn)多。我特別想吐槽的是,這個(gè)app有個(gè)選項(xiàng)默認(rèn)是打開的,叫做“每日答題提醒”(最新版本在“發(fā)現(xiàn)”里面)。它的作用是每天晚上十點(diǎn)半準(zhǔn)時(shí)打開app并用最大音量提醒你來(lái)做題吧,不管你當(dāng)時(shí)在什么別的app里面或者哪怕你手機(jī)調(diào)的是靜音……囧rz。到了7月份我聽(tīng)說(shuō)猿題庫(kù)拿了1500萬(wàn)刀的C輪,10月份的時(shí)候我看到新聞?wù)f用戶數(shù)突破500萬(wàn),每周新增30萬(wàn)。于是我明白了,冷啟動(dòng)怎么破?有錢?。∴?,有錢真的可以的,數(shù)據(jù)量這一局暫時(shí)你贏了。然后就是第二個(gè)問(wèn)題了,數(shù)據(jù)質(zhì)量,給大家看兩張截圖。

注意圖中的“考點(diǎn)”和“標(biāo)簽”,機(jī)器是不認(rèn)識(shí)“題目”的,機(jī)器學(xué)習(xí)的數(shù)據(jù)就是這些人工打上的“標(biāo)簽”?,F(xiàn)在的題庫(kù)動(dòng)輒號(hào)稱千萬(wàn)題量,其實(shí)哪怕是百萬(wàn),生產(chǎn)一個(gè)上圖這樣標(biāo)準(zhǔn)化的題庫(kù)的唯一辦法就是雇傭大量的廉價(jià)勞動(dòng)力,比如大學(xué)生兼職團(tuán)隊(duì)。在這種情況下,你打出來(lái)的標(biāo)只能是“粗粒度”的?!按至6取痹趺蠢斫??大家都學(xué)過(guò)中學(xué)數(shù)學(xué)的,我們嘗試估計(jì)一下這種標(biāo)簽的種類數(shù)量。整個(gè)高中數(shù)學(xué)約30個(gè)單元,如數(shù)列、立體幾何、函數(shù)、不等式等。按照“等差數(shù)列、等比數(shù)列”、“定義法”、“空間幾何體”、“圖解法”這樣的用詞,每個(gè)單元平均十幾個(gè)標(biāo)簽吧,總數(shù)我猜在300個(gè)左右。好,我們來(lái)感受一下這樣一個(gè)場(chǎng)景,智能題庫(kù)給你推送了5道題,都帶有“直線方程”這個(gè)標(biāo)簽,結(jié)果你全做錯(cuò)了。這時(shí)不管背后的機(jī)器怎么學(xué)習(xí),它一定要再給你推一道帶“直線方程”標(biāo)簽的題吧。這有用嗎?你剛才犯的錯(cuò)誤是“用點(diǎn)斜式設(shè)直線方程時(shí)忘記考慮斜率K不存在的情況”,或者是忘記了“與直線Ax+By+C=0垂直的直線是Bx-Ay+C1=0 (C1≠C)”,再或者是在“用方法四求直線關(guān)于某定點(diǎn)對(duì)稱的直線”時(shí)用錯(cuò)了“中點(diǎn)坐標(biāo)公式”,blablabla……然后這次給你推的題是“求兩條直線的交點(diǎn)坐標(biāo)”。嗯,它們都是“直線方程”。

感謝數(shù)學(xué)不好的小伙伴堅(jiān)持看完上面這一段,我想表達(dá)的觀點(diǎn)是——粗粒度的個(gè)性化是偽個(gè)性化。用俄羅斯方塊做個(gè)比喻,如圖,下面那些坑就是學(xué)生的薄弱點(diǎn)或者叫做用戶的需求,五花八門?,F(xiàn)在你要消掉它,如果落下來(lái)的全是4x4甚至6x6的方塊,那你永遠(yuǎn)也別想成功。

回到上面題庫(kù)的第二個(gè)問(wèn)題就是,任何數(shù)據(jù)所訓(xùn)練出來(lái)的模型的顆粒度不可能超過(guò)數(shù)據(jù)本身的顆粒度。所以,在數(shù)據(jù)質(zhì)量(顆粒度)達(dá)到某個(gè)閾值之前,再多的數(shù)據(jù)可能都是“廢的”,數(shù)據(jù)的質(zhì)量決定了個(gè)性化的有效性。

實(shí)際上,數(shù)據(jù)顆粒度這件事還間接影響了前一篇中我們提到的“學(xué)習(xí)主動(dòng)性”問(wèn)題。這里先賣個(gè)關(guān)子,回頭一并在學(xué)習(xí)主動(dòng)性一節(jié)闡述。

市面上估計(jì)有十幾款題庫(kù),有興趣的朋友可以都裝來(lái)看看,show出來(lái)的知識(shí)點(diǎn)基本都是上面截圖那種粒度的。然后就有個(gè)朋友跟我說(shuō)“真像你說(shuō)的那么多問(wèn)題,人還拿了那么多錢呢”。對(duì)這個(gè)問(wèn)題,我想起前幾個(gè)月有篇文章,講的是對(duì)比IDG和紅杉的投資,標(biāo)題是“賭選手還是賭賽道”之類的。這兩年在這個(gè)領(lǐng)域創(chuàng)業(yè)有兩個(gè)感覺(jué),一是好像全行業(yè)都覺(jué)得所謂風(fēng)來(lái)了,他媽的再有個(gè)三五年,在線教育絕對(duì)是和電商之于傳統(tǒng)零售一樣,對(duì)傳統(tǒng)教育必須是顛覆??;二是至今都沒(méi)有一個(gè)能夠得到較廣泛認(rèn)可的模式或產(chǎn)品,尤其是K12。所以,第一點(diǎn)決定了資本必須布局,得投啊,晚了沒(méi)坑了啊。第二點(diǎn)是都不靠譜那投誰(shuí)呢?其中一個(gè)答案就是“賭賽道”,越有錢越這么干。起碼最好的賽道要有我的份,然后每個(gè)賽道里面盡量挑最好的選手唄。猿題庫(kù)當(dāng)年也是做平臺(tái)(粉筆網(wǎng))的呢。2013年,多少平臺(tái)拿錢了呀,到2013年下半年就開始死了,粉筆網(wǎng)團(tuán)隊(duì)很棒啊,能夠快速轉(zhuǎn)型到第二波最靠譜的模式——題庫(kù)。然后各種題庫(kù)紛紛冒出來(lái)了,到現(xiàn)在題庫(kù)也開始泛濫了,那第三波最靠譜的在哪里?不知道,希望是我們哈。

其實(shí)組題類題庫(kù)還有一種,就是面向老師的,猿題庫(kù)是面向?qū)W生的。我個(gè)人其實(shí)比較喜歡面向老師的組題類產(chǎn)品。可能是因?yàn)樽约鹤隽硕螘r(shí)間老師,覺(jué)得自動(dòng)組卷這玩意真是有用啊。去年我們經(jīng)常用梯子網(wǎng)查題,可惜它倒了。現(xiàn)在也有一些面向老師的組題產(chǎn)品,不過(guò)比較少。想來(lái)想去,面向老師的組題產(chǎn)品不能成為主流的原因可能是兩個(gè),一是盤子小,二是商業(yè)模式不成立。面向?qū)W生的組題產(chǎn)品的商業(yè)模式,我理解核心是導(dǎo)流玩轉(zhuǎn)化率,通過(guò)對(duì)接其他環(huán)節(jié)完成整個(gè)閉環(huán)。用一個(gè)朋友的話講是,“給人特別互聯(lián)網(wǎng)的感覺(jué)”。對(duì)比起來(lái),面向老師的就差的比較多了。這一塊因?yàn)橄氲牟欢?,就先不展開扯淡了。

今天拍了很多猿題庫(kù),猿題庫(kù)的朋友不要打我哈。猿題庫(kù)是題庫(kù)里做的最棒的,我們也偷著學(xué)了點(diǎn)東西。比如公式的處理,latex串用的很棒,在存儲(chǔ)、傳輸和顯示等方面都有極大優(yōu)勢(shì),還有很強(qiáng)的擴(kuò)展性,比起現(xiàn)在很多用圖片的那是高大上太多了。

OK,寫到這里,平臺(tái)和題庫(kù)都講的差不多了,下一節(jié)打算沿著前面的顆粒度一事往下,談點(diǎn)交互,談點(diǎn)我們對(duì)教育行業(yè)核心問(wèn)題的看法,感謝各位捧場(chǎng)。

文章來(lái)自學(xué)吧課堂李行武,僅代表作者個(gè)人觀點(diǎn)。

1、本文是 芥末堆網(wǎng)原創(chuàng)文章,轉(zhuǎn)載可點(diǎn)擊 芥末堆內(nèi)容合作 了解詳情,未經(jīng)授權(quán)拒絕一切形式轉(zhuǎn)載,違者必究;
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。
來(lái)源: 芥末堆
芥末堆商務(wù)合作:王老師 18710003484
  • 題庫(kù)產(chǎn)品:粗粒度的個(gè)性化是偽個(gè)性化分享二維碼