芥末堆 怡彭 2016 年 11 月 11 日 報道
在“互聯(lián)網(wǎng)化”之后,數(shù)據(jù)化正在成為教育變革的下一個主題。教育的數(shù)據(jù)化有多難?需要考慮多少維度?從測評到用戶畫像,再到規(guī)劃用戶的成長路徑,應(yīng)該經(jīng)歷怎樣的過程?
申請方聯(lián)合創(chuàng)始人龔綺在今日的“GET2016教育科技大會”上做了以“數(shù)據(jù)驅(qū)動的教育變革”為主題的演講。
以下為演講實錄:
今天想實打?qū)嵳f一些戰(zhàn)術(shù)層的事情。我們是一家創(chuàng)業(yè)公司,申請方作為專家系統(tǒng),以數(shù)據(jù)驅(qū)動的方式來做面對高等教育學(xué)生的發(fā)展平臺。
看我們的名字叫申請方,很容易讓人聯(lián)想到好像是做留學(xué)的公司,很多人問過我這個問題。我在美國讀博士期間讀的是數(shù)據(jù)模型專業(yè),最開始是以留學(xué)切入,但是我們不只是想做留學(xué),而是通過留學(xué)學(xué)業(yè)場景來研究高等教育的本質(zhì),待會我會講到這個事情。
一個很普通的問題,大家都在談大數(shù)據(jù),數(shù)據(jù)到底是什么?有人說數(shù)據(jù)是用戶一門課分?jǐn)?shù),課程本身的品質(zhì),還包括用戶和用戶之間的關(guān)系等等。可成為數(shù)據(jù)的東西太多了。我們能不能從數(shù)學(xué)的層面上抽離出來它到底是什么東西?經(jīng)過我們的思考,我們認(rèn)為數(shù)據(jù)的本質(zhì)是刻畫的實體(Entity,人、圖書、網(wǎng)站都是實體)以及它的屬性(Attribute),以及各類實體之前的關(guān)系(Relationship)以及關(guān)系的屬性(Attribute)。
舉一個例子,這個圖中我們暫且把Entity分為人和內(nèi)容兩個部分。人那部分有各種各樣的用戶,有各種各樣的屬性和相互關(guān)系。對于內(nèi)容那邊,例如MIT和它開設(shè)的一個的項目,它們之間存在關(guān)系且有自己的屬性。另外人和內(nèi)容之間又有關(guān)系。人這邊有人的圖譜,我們稱之為 Social Network,內(nèi)容這邊有知識圖譜,內(nèi)容投影在人身上是認(rèn)知圖譜。除了圖譜之外,還可以通過數(shù)據(jù)類型來歸類數(shù)據(jù),如圖所示。但無論是從數(shù)據(jù)類型方面歸類還是圖譜方面歸類,只是分類方式不一,他們本身是有對應(yīng)關(guān)系的。我們把這兩者統(tǒng)一起來,來刻畫人的畫像。
有了上面的用戶畫像的數(shù)據(jù)刻畫,我們得出一個非常重要的結(jié)論,人受教育的過程等價于人的畫像被不斷更新的過程,這是我們的認(rèn)識。每個人的畫像有個性化的起點,還有個性化的終點,因為有不同的追求。我想去做計算機,我想做工程師,這是不同的目標(biāo)。畫像與畫像之間的變化過程是受教育的過程,在這個過程中要有作用,它被教育作用了,作用之后一定要被測量,你怎么能知道給他這個教育是好還是壞?所以有測量之后要有反饋去迭代。我們通過畫像的更新定義了教育之后,怎么定義好的教育?基于起點和終點的個性化差異,幫助用戶完成更有效率的畫像,這就是好的教育。
在座很多做垂直領(lǐng)域細(xì)分,你可以考慮我做的這個事情在上述框架中有沒有價值。比如說有人做考試,考試是做什么事情?就是通過考試測試教育成果。有的同學(xué)做慕課或遠(yuǎn)程教育,這個是作用在“環(huán)境”上,讓教育過程變得高效。所以這是好的教育,因為這個符合框架。
前面這些都是很理論的說法,實際上操作時數(shù)據(jù)戰(zhàn)術(shù)到底怎么實施呢?這是一個問題。我們分為理想層和現(xiàn)實層,對于理想層,我們要通過學(xué)術(shù)層、理論層、工程層、技能層、專業(yè)層真正部署自己怎么去產(chǎn)品實施?;诶碚搶游覀円鲂枨蠓治?,要做數(shù)據(jù)模型,要做數(shù)據(jù)的收集,要做數(shù)據(jù)庫的建立,數(shù)據(jù)庫進來之后要做數(shù)據(jù)的清理和整合,要做數(shù)據(jù)的分析,最后做數(shù)據(jù)的傳遞、評估,再反回去做需求的分析。在數(shù)據(jù)安全整個涵蓋所有的路徑,這是基本的理論層。理論層往上學(xué)術(shù)層,是對做的這些事情的學(xué)術(shù)支撐。往下是技能層,指我們做的這些事情需要具備哪些技能。再往下是專業(yè)層,專業(yè)層是指我們找的這些人在哪個專業(yè)去找。由于時間的關(guān)系,這些內(nèi)容我就不展開說了。
實際上你很難找到一個完備的團隊做這樣的事情,我們通過自身的經(jīng)驗,發(fā)現(xiàn)這樣的團隊需要具有以下的基本素質(zhì)。第一要做 Modeling 的人,第二個一定要懂 Programming,第三要懂 Data Processing人,第四要懂 Perceptions。Modeling 是建模,建模之后需要工程化需要 Programming,工程化以后進行一系列的數(shù)據(jù)處理,例如數(shù)據(jù)抓取、網(wǎng)上爬數(shù)據(jù),建數(shù)據(jù)庫以及數(shù)據(jù)分析都是 Data Processing。另外還需要具備Perception 能力的人,也就是需要有洞察力的人。能夠把教育需求分析出來,協(xié)助模型化,并且把數(shù)據(jù)結(jié)果友好的表達給用戶。我們是一個創(chuàng)業(yè)公司,也算是一支奇葩的團隊,作為創(chuàng)業(yè)公司我們成立了高等教育研究部和數(shù)據(jù)部,為什么做這件事情呢?高等教育研究部把的高等教育的規(guī)律把它變成數(shù)學(xué)上可以理解以及建模的元素,數(shù)據(jù)部需要做很多真正數(shù)據(jù)上面的事情。
接下來這張圖,我們申請方是做高等教育的學(xué)業(yè)發(fā)展平臺,我們從高等教育入口和出口換成幾個場景,第一個場景是升學(xué)場景,升學(xué)進來以后有課程的基礎(chǔ)訓(xùn)練,基礎(chǔ)訓(xùn)練之后有以背景提升為核心的高級訓(xùn)練分為科研、職業(yè)、公共服務(wù)、創(chuàng)業(yè)指導(dǎo),我們稱之為RISE。之后通過繼續(xù)深造返回到學(xué)業(yè)入口,或就職到學(xué)術(shù)界、業(yè)界、社會公共服務(wù)、創(chuàng)業(yè)為代表的學(xué)業(yè)的出口。因為我們嘗試做高等教育整個學(xué)業(yè)規(guī)劃底層框架的研究,所以我們需要把高等教育相關(guān)的場景全部囊括下來?;谖覀儓F隊的背景,我們團隊70% 都是海歸,20% 以上都是博士生,經(jīng)歷了完整的高等教育科研訓(xùn)練,且覆蓋了多個學(xué)科領(lǐng)域,因此我們以升學(xué)場景作為切入點,來做整個的學(xué)業(yè)規(guī)劃的底層數(shù)據(jù)研究。
做了這個基礎(chǔ)研究之后怎么去覆蓋各個學(xué)業(yè)場景呢?例如升學(xué)當(dāng)中也包括高考的報考,我們的做法基于本身的個人畫像普適性研究,那是一把尺子,有了這把尺子之后,就可以把其他的學(xué)業(yè)場景要參考的數(shù)據(jù)維度映射到這把尺子上面??隙ㄓ腥苏f了,映射的話你的維度很可能是不全的,那么多的數(shù)據(jù)你也不可能完全知道,那該如何擴展呢?這就涉及到底層結(jié)構(gòu)的問題,這把尺子按照數(shù)學(xué)的方法,所有的維度都是正交的。任何一個新維度進來,一定會被已有的維度被線性表達。我們跨場景跟別人合作。你有你的評價方式,我有我的評價方式,為什么我的評價方式比你好呢?第一,我比你更完備,你所有的維度能夠被我的正交表達,這個很重要,否則做不了融合的事情。第二,我們的維度方便擴展。我們按照這個方式,一個個場景去突破,畫像的維度將變得越來越完備。對人的個人畫像的刻畫,這是我們的核心,隨著場景的拓展會變得非常完備好用。
下面說一下我們2C的產(chǎn)品。我們做的這個事情首先以數(shù)據(jù)為核心。機器端包括PGC數(shù)據(jù)庫,含學(xué)業(yè)數(shù)據(jù)庫、職業(yè)數(shù)據(jù)庫。第二個是管理工具,然后是社區(qū)UGC數(shù)據(jù)庫和測評體系。我們有非常多且內(nèi)容豐富的數(shù)據(jù)庫。有人爬我們的數(shù)據(jù),沒有關(guān)系,因為它只能抄表層的內(nèi)容,不能抄這些數(shù)據(jù)底層的標(biāo)簽,它們之間關(guān)聯(lián)等,這些數(shù)據(jù)背后的維度才更好的為學(xué)業(yè)規(guī)劃所服務(wù)。
重點說一下測評體系,測評體系包含個性化評測,用那把尺子量一下學(xué)業(yè)狀態(tài),量了之后我們給用戶智能化推薦合適的學(xué)業(yè)目標(biāo)。很多的測評產(chǎn)品有了這個推薦之后就到頭了,但我們推完之后會給你規(guī)劃一條路徑,告訴你在什么時間做什么事情,怎么去推進。比如說留學(xué)場景,你做完測試后就可以做智能化推薦。你適合選什么樣的專業(yè),以及適合去申請哪些學(xué)校。再告訴你之后該怎么申請,什么時間做什么事情以及怎么做。你需要學(xué)很多的知識,這些事情就在規(guī)劃中通過教育資源的方式提供給你。怎么做這個事情?因為我們現(xiàn)在有留學(xué)的經(jīng)驗,所以我們可以通過專家系統(tǒng)的方式進行推薦。馬上問題就出來了,你怎么保證這個事情是 OK 的?你推薦的準(zhǔn)確與否?我們的核心是個人畫像,我們希望跟用戶能給我們實時的反饋。你做了某一個我們推薦的資源后,到底離你的學(xué)校近了多少,這個東西可以基于個人畫像功能進行實時反饋。你一旦達到那個目標(biāo)之后,可以反饋我們的推薦模型是不是 OK,模型進行自我進化。我們想把這個做法推廣到其他的場景,包括其他升學(xué)場景、學(xué)業(yè)過程場景以及職業(yè)場景。
對于人機混合部分,人機混合智能引擎形成用戶多平臺、多周期會話,這是很重要的發(fā)展趨勢。另外,我們還希望提供標(biāo)準(zhǔn)化需求智能解決方案:機器在前端、人工后端支持。因為我們是做學(xué)生學(xué)業(yè)發(fā)展規(guī)劃的公司,我們希望通過標(biāo)準(zhǔn)化需求,以及標(biāo)準(zhǔn)化學(xué)業(yè)狀態(tài),告訴用戶可能做什么樣的事情。當(dāng)這個機器不能滿足需求時,人就可以進去,機器在前端人在后端。另外,對于個性化需求智能解決方案,我們可以做 To B 的合作。剛才有人說培訓(xùn)界的咨詢師非常缺乏,缺乏的本質(zhì)是缺乏經(jīng)驗,哪有那么多時間培養(yǎng)咨詢師呢?那是否能做到人在前面,后面有機器支持呢?因為我們是做學(xué)業(yè)規(guī)劃的,這個有可能實現(xiàn)。還是以留學(xué)咨詢?yōu)槔?,一個留學(xué)咨詢師很難完整了解一個學(xué)生當(dāng)前狀態(tài)適合讀什么專業(yè)或什么檔次的學(xué)校?你可以說這個學(xué)生很適合去哈佛,但是需要理由去支持,這個支持并不是把結(jié)論告訴他,而是有一套成熟的推薦體系以及規(guī)劃資源,告訴學(xué)生你為什么這樣選擇,以及該怎么做?這就是人在前,機器在后。
我們的 PGC 數(shù)據(jù)庫有學(xué)校、專業(yè)、課程、校園機會等等的數(shù)據(jù)庫,我覺得做數(shù)據(jù)方面的東西一定有很多的文章可做。我們花了差不多兩年的時間整理這些數(shù)據(jù),而且很好的更新這些數(shù)據(jù)。校園機會包括講座、論壇、講學(xué)機會、競賽等,只要對學(xué)業(yè)有幫助的都可以拿出來。
工具是幫你更好的管理資源以及進行資源搜索。還有UGC的數(shù)據(jù)是社區(qū),還有測評產(chǎn)品。我們其實已經(jīng)發(fā)布了專業(yè)測評、留學(xué)測評、高考報考測評。第四個圖是測評規(guī)劃頁,就是說測了之后告訴你該怎么去做。
另外,做學(xué)業(yè)規(guī)劃,研究用戶畫像,需要一把尺子,這個尺子不是誰都可以定義和推廣的,需要和大B合作,讓大 B 幫助背書,我們做了這樣的嘗試。我們推出了To B 的品牌SquareStrategics(方略)。取自《荀子》中的一句話,由于時間關(guān)系我就不一一解讀了。大概的意思是,一定要提前準(zhǔn)備好策略,才能打勝仗。
我們 To B 有三個目標(biāo)群體,第一個是高等教育、科研機構(gòu)的學(xué)術(shù)組織,第二個是企業(yè)機構(gòu),第三個是公共事業(yè),政府、教育研究機構(gòu)及公益組織。我們對他們是技術(shù)與數(shù)據(jù)驅(qū)動的互聯(lián)網(wǎng)方案提供商,以及踐行教育研究的全球智庫。我們作為創(chuàng)業(yè)公司對于學(xué)術(shù)層級、政府層級有自己的獨特優(yōu)勢。我們在高等教育研究上,會自上而下打一些點,我們會發(fā)一些報告,會發(fā)其他國家高等教育怎么樣,他們的教育評價體系是怎么回事,他們的高等教育機制是怎么回事等等。我們還會有全球戰(zhàn)略的研究報告。基于高等教育入口-過程-出口全過程研究報告,有評價機制研究報告,有高考報考報告,有大學(xué)生的 RISE 體系發(fā)展報告,大學(xué)生就業(yè)機會研究報告等,這些會為我們的理論體系做背書。
謝謝大家!
戳這里查看所有嘉賓精彩演講,立即永久保存,感謝【印象筆記企業(yè)版】友情支持
2、芥末堆不接受通過公關(guān)費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。