【芥末堆注】:本篇經(jīng)驗(yàn)干貨來(lái)自于業(yè)內(nèi)封閉沙龍活動(dòng)的分享,是由滬江網(wǎng)發(fā)起的互元在線教育創(chuàng)業(yè)聯(lián)盟主辦的名為“【互元】教育創(chuàng)業(yè)聯(lián)盟”微信群發(fā)起的。芥末堆作為唯一媒體支持參加了這次沙龍,并將本次沙龍嘉賓分享的的干貨整理成稿。
“大數(shù)據(jù)”已成為時(shí)下流行的詞匯之一,各個(gè)行業(yè)都將大數(shù)據(jù)的概念融入其中。而在教育行業(yè)中,“大數(shù)據(jù)”一詞該如何來(lái)定義呢?又如何采集并且分析數(shù)據(jù)呢?這其中的過(guò)程與結(jié)果哪個(gè)更為重要呢?數(shù)據(jù)服務(wù)一行采取的又是怎樣的商業(yè)模式呢?本期我們將邀請(qǐng)兒童行為數(shù)據(jù)平臺(tái)底層數(shù)據(jù)分析服務(wù)商,中科韋摩的CEO宋軍輝來(lái)談一談他眼中的教育行業(yè)大數(shù)據(jù)。
分享嘉賓:宋軍輝,中科韋摩CEO,戰(zhàn)略經(jīng)營(yíng)學(xué)碩士,韓國(guó)力學(xué)歸國(guó),曾任教育部下屬某學(xué)會(huì)旗下幼兒中心辦公室主任。
分享主題:我們?cè)谡劷逃髷?shù)據(jù)的時(shí)候,都該聊些什么?
分享提要:
1、如何定義教育行業(yè)的大數(shù)據(jù)?
2、想要分析?先做采集。
3、過(guò)程與結(jié)果,哪個(gè)更關(guān)鍵?
4、數(shù)據(jù)服務(wù)的商業(yè)模式是什么?
一、如何定義教育行業(yè)的“大數(shù)據(jù)”
今天給大家?guī)?lái)的分享是教育行業(yè)內(nèi)在聊到大數(shù)據(jù)的時(shí)候我們應(yīng)該聊些什么,一般來(lái)講大數(shù)據(jù)的定義符合四個(gè)特點(diǎn):大量、高速、多樣和價(jià)值,但是如此巨大的數(shù)據(jù)無(wú)法通過(guò)目前主流的軟件工具在合理時(shí)間內(nèi)達(dá)到截取、管理、處理并整理成為幫助人和企業(yè)做決策的資訊。
目前來(lái)說(shuō),在教育行業(yè),數(shù)據(jù)的主要來(lái)源包括以下幾點(diǎn):考試成績(jī)、入學(xué)率、出勤率、輟學(xué)率、升學(xué)率等等,具體到課堂教學(xué)來(lái)講,就是說(shuō)明教學(xué)效果的,比如:學(xué)生識(shí)字的準(zhǔn)確率,作業(yè)的準(zhǔn)確率、多方面發(fā)展的表現(xiàn)率,積極參與課堂科學(xué)舉手的次數(shù),回答問(wèn)題的字?jǐn)?shù)時(shí)長(zhǎng)與正確率,師生互動(dòng)的頻率與時(shí)長(zhǎng)。
我給大家講一些常用的大數(shù)據(jù)應(yīng)用場(chǎng)景,然后我們一起來(lái)探討一下教育行業(yè)內(nèi)的大數(shù)據(jù)應(yīng)用的整體表現(xiàn)形式。
我們知道人類的大腦跟計(jì)算機(jī)在分析數(shù)據(jù)和獲取結(jié)果的方法上是不一樣的。因此在有一段時(shí)間內(nèi),計(jì)算機(jī)科學(xué)界想盡各種辦法,希望通過(guò)計(jì)算機(jī)來(lái)模擬實(shí)現(xiàn)人腦,就是人類的思考方式。結(jié)果大家都是知道的,最終結(jié)果就是人工智能至今為止還沒有實(shí)現(xiàn)。
但是兩年前,蘋果推出了Siri,微軟也同時(shí)推出了它的人工智能語(yǔ)音分析軟件(同聲傳譯),還有谷歌的在線翻譯系統(tǒng)也實(shí)現(xiàn)了準(zhǔn)確率比較高的一些能力,那么這些是如何實(shí)現(xiàn)的呢? 其實(shí)背后支持他們的都是大數(shù)據(jù)。
一開始,科學(xué)家是嘗試通過(guò)由語(yǔ)言學(xué)家不停的編撰大量的詞典啊,包括語(yǔ)法、句法、語(yǔ)義學(xué)相關(guān)的規(guī)則,將其匯總成詞庫(kù),再來(lái)判斷各種語(yǔ)境、情景等各種情況,然后進(jìn)行機(jī)器翻譯。
這種方式在統(tǒng)計(jì)學(xué)概念里叫窮舉法,最終科學(xué)家們發(fā)現(xiàn),在這種方式下,機(jī)器翻譯的質(zhì)量是沒有辦法保證的,因?yàn)槿祟惖恼Z(yǔ)言實(shí)在是太豐富了。
接下來(lái)的發(fā)展就出現(xiàn)了一個(gè)轉(zhuǎn)機(jī),就是大數(shù)據(jù)的應(yīng)用出現(xiàn),在這個(gè)過(guò)程里面呢,我們發(fā)現(xiàn)可以思考的方式不止有窮舉法,還有匹配法,匹配法的方法的實(shí)現(xiàn)就是我們不去管語(yǔ)法和規(guī)則,而通過(guò)將原文與互聯(lián)網(wǎng)上的翻譯數(shù)據(jù)進(jìn)行對(duì)比,找到其中最相近和被引用次數(shù)最高的翻譯結(jié)果作為輸出。
舉這個(gè)例子是希望告訴大家, 當(dāng)我們?cè)谂c他人進(jìn)行大數(shù)據(jù)方面的討論和交流的時(shí)候,我們發(fā)現(xiàn)絕大部分人是希望大數(shù)據(jù)能直接為他們提供結(jié)果,而實(shí)際上我們來(lái)定義大數(shù)據(jù)的時(shí)候我們會(huì)發(fā)現(xiàn)大數(shù)據(jù)不是萬(wàn)能的,所以呢,我們更傾向于將大數(shù)據(jù)提供的結(jié)果作為由人來(lái)做最終判斷的決策建議。這就引出了我今天要分享的第一個(gè)結(jié)論,我們?nèi)绾稳ザx教育行業(yè)的大數(shù)據(jù),我們認(rèn)為教育行業(yè)的大數(shù)據(jù)的定義應(yīng)該是決策者及老師和學(xué)生提供決策建議的結(jié)果。
二、想要分析,先做采集
剛才我也有提到,我們現(xiàn)在教育行業(yè)內(nèi)主要采集的數(shù)據(jù)包括考試成績(jī)、入學(xué)率、出勤率、輟學(xué)率、升學(xué)率等等這方面的集合,實(shí)際上這些數(shù)據(jù)我們更可以稱之為教學(xué)管理數(shù)據(jù)而不是學(xué)生的學(xué)習(xí)數(shù)據(jù)。
回到一開始提的大數(shù)據(jù)的四個(gè)特點(diǎn),大量、高速、多樣和價(jià)值, 我們回過(guò)頭再來(lái)看我們?cè)诮逃袠I(yè)內(nèi)采集到大量數(shù)據(jù)的特點(diǎn),會(huì)發(fā)現(xiàn)大量是有保證的,而高速、多樣都是沒有保證的,價(jià)值也是沒有太大保證的,因此我們不能說(shuō)現(xiàn)在從教育行業(yè)內(nèi)已經(jīng)可以去采集的數(shù)據(jù)就是可以得到我們想要的結(jié)果的數(shù)據(jù)。
然后我們會(huì)發(fā)現(xiàn),在教育行業(yè)內(nèi)去分析現(xiàn)有的已經(jīng)能提供的數(shù)據(jù),其實(shí)意義不是特別巨大,最多是在宏觀層面上對(duì)改善我們的經(jīng)營(yíng)管理有所幫助,但是對(duì)于幫助學(xué)習(xí)者如何去改善他們提高他們的學(xué)習(xí)效率確實(shí)意義不是很明顯、因此從我們的角度來(lái)說(shuō),要分析數(shù)據(jù)我們先做的是要采集數(shù)據(jù)。
我們現(xiàn)在為學(xué)習(xí)者提供的絕大部分課程內(nèi)容都是由課程設(shè)計(jì)者拍腦門想出來(lái)的內(nèi)容,但是這些內(nèi)容都符合一個(gè)認(rèn)知規(guī)律,就是說(shuō)符合我們想要去傳達(dá)的知識(shí)要點(diǎn),也是有節(jié)奏控制的。只是我們不知道接收這些內(nèi)容的學(xué)習(xí)者的認(rèn)知是否能跟上或者去匹配內(nèi)容的傳輸節(jié)奏或者是認(rèn)知規(guī)律的節(jié)奏。
現(xiàn)在絕大部分行業(yè)內(nèi)的做法,比如說(shuō)題庫(kù)或者一些試題分析,他們的做法是去分析學(xué)生(學(xué)習(xí)者)的答題結(jié)果、考試結(jié)果,尋找他沒有充分掌握的知識(shí)點(diǎn),反過(guò)來(lái)再向他去提供這方面的補(bǔ)足,實(shí)際上在我們看來(lái),我們更關(guān)注的是這個(gè)結(jié)果產(chǎn)生的原因是什么,也就是說(shuō)這個(gè)學(xué)生為什么在這個(gè)知識(shí)點(diǎn)上或者這部分的知識(shí)內(nèi)容的掌握沒有達(dá)成合理的范疇。那我們就需要去回溯比如說(shuō)掌握學(xué)習(xí)者的認(rèn)知狀態(tài)、行為特點(diǎn)以及環(huán)境變量等因素,同時(shí)我們需要去掌握這部分傳輸知識(shí)重點(diǎn)的節(jié)奏以及整體的知識(shí)架構(gòu),在這種匹配關(guān)系之下我們就可以知道針對(duì)這樣的學(xué)習(xí)者,或者說(shuō)針對(duì)這樣認(rèn)知能力水平的學(xué)習(xí)者,這部分內(nèi)容是否已經(jīng)溢出了他的認(rèn)知范疇,或者說(shuō)對(duì)他的知識(shí)的掌握造成了什么樣的影響。
剛才我說(shuō)的這一部分比較枯燥的內(nèi)容,就把我想要分享的大綱內(nèi)容中的二和三已經(jīng)做了解答,就是說(shuō)我們認(rèn)為想要去做好一個(gè)學(xué)習(xí)者或者教育行業(yè)內(nèi)的數(shù)據(jù)分析,首先我們要去關(guān)注的是數(shù)據(jù)的采集。我們所定義的采集不止是數(shù)據(jù)量的大小,同時(shí)還需要關(guān)注數(shù)據(jù)維度的大小,這個(gè)數(shù)據(jù)維度的大小在傳統(tǒng)意義上來(lái)說(shuō)就是數(shù)據(jù)的多樣性,那過(guò)程與結(jié)果哪個(gè)更關(guān)鍵呢,我們認(rèn)為過(guò)程比結(jié)果更關(guān)鍵。
三、數(shù)據(jù)服務(wù)的商業(yè)模式
我們一起來(lái)探討一下第四部分?jǐn)?shù)據(jù)服務(wù)的商業(yè)模式應(yīng)該是什么(問(wèn)答討論環(huán)節(jié))。
問(wèn):對(duì)于數(shù)據(jù)服務(wù)公司,目前國(guó)內(nèi)外有成功的案例嗎?
教育行業(yè)的數(shù)據(jù)服務(wù)公司,國(guó)外絕大部分是公益性,政府行政服務(wù),如果我來(lái)定義他們的成功,能被大多數(shù)家長(zhǎng)接受嗎,并幫助學(xué)生成長(zhǎng),已經(jīng)很好了。
對(duì)于數(shù)據(jù)服務(wù)的成功案例,比比皆是,國(guó)內(nèi)的友盟,Talking data等等都是不錯(cuò)的企業(yè)。
典型案例有一個(gè)可以分享的是NYC政府主導(dǎo)的一個(gè)數(shù)學(xué)教育項(xiàng)目School of one。
對(duì)于不同年齡段的學(xué)習(xí)用戶及他們的決策者會(huì)有那些差異呢?
在我們的概念里,學(xué)習(xí)者不只是單純的按年齡來(lái)劃分,更多的是按認(rèn)知水平劃分的。認(rèn)知水平還包括世界觀價(jià)值觀的發(fā)展?fàn)顟B(tài)。
對(duì)于低齡的學(xué)習(xí)者來(lái)說(shuō),更多的決策輔助是提供給教學(xué)者和保護(hù)者的。實(shí)際上這也是一個(gè)教育家長(zhǎng)和老師的過(guò)程。
最后,我們所處的教育行業(yè),先不談分析,先說(shuō)采集,我們采集的節(jié)點(diǎn)是否能夠真正做到我們采集的數(shù)據(jù)是客觀的有效的有價(jià)值的。
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。