芥末堆芥末堆

好未來MathGPT今日上線,來看看各家“教育版大模型產(chǎn)品”進度如何

作者:LAN 發(fā)布時間:

好未來MathGPT今日上線,來看看各家“教育版大模型產(chǎn)品”進度如何

作者:LAN 發(fā)布時間:

摘要:在基礎設施層面,國內(nèi)一直在前進。

截屏2023-08-24 16.54.19.png

圖源:Pixabay

芥末堆文 毫不夸張地說,2023年可以被看做是國內(nèi)“大模型元年”,科創(chuàng)公司、教育企業(yè)全都摩拳擦掌躍躍欲試,只要身處互聯(lián)網(wǎng)就一定會在任一平臺刷到過“大模型”、“AIGC”、“LLM”等關鍵詞,所有人都樂于見證并參與到“大模型改變世界”的新浪潮中去。

科技界人士將大模型創(chuàng)業(yè)的生態(tài)分為四層——芯片層、框架層、模型層、應用層。整體來看,多數(shù)教育公司基于開源的大模型,快速做出了一些有意思的新產(chǎn)品,但主要還是集中在“應用層”。而近段時間,對“大模型”創(chuàng)業(yè)的質疑聲也不少:先是ChatGPT的訪問量出現(xiàn)負增長,窗口期短,開始出現(xiàn)唱衰大模型的聲音;再有業(yè)內(nèi)人士斷言大模型難以落地產(chǎn)業(yè),改變世界言之尚早。

據(jù)量子位統(tǒng)計,包含通用與垂直、開源與閉源不同類型在內(nèi),國產(chǎn)大模型數(shù)量已超百家。那么,目前各大公司的教育大模型產(chǎn)品進度如何?

1.網(wǎng)易有道:聚焦辦公及學習場景中的效率提升

網(wǎng)易有道被認為具備底層技術基因,同時由于在智能學習領域的深耕,也積累了很多教育領域的業(yè)務數(shù)據(jù)和理解。在國內(nèi)的教育科技公司中,網(wǎng)易有道較早宣布要推出大模型產(chǎn)品。

今年2月,先是有爆料稱網(wǎng)易有道AI技術團隊已投入到ChatGPT同源技術(AIGC)在教育場景的落地研發(fā)中,并在AI口語老師、中文作文批改等細分學習場景中嘗試應用,將盡快推出相關的demo版產(chǎn)品。3月,網(wǎng)易有道還推出系列AI應用課程,其中包括“ChatGPT從入門到精通”等。

到了7月,網(wǎng)易正式推出了教育領域垂直大模型“子曰”,并發(fā)布了基于“子曰”大模型研發(fā)的六大創(chuàng)新應用——“LLM翻譯”、“虛擬人口語教練”、“AI作文指導”、“語法精講”、“AI Box”以及“文檔問答”。

8月9日,網(wǎng)易有道發(fā)布了“子曰”教育大模型首次落地的硬件產(chǎn)品——有道詞典筆X6 Pro,有道詞典筆S6和有道聽力寶Pro三款新品,分別定價1399元、499元和1099元。

網(wǎng)易有道介紹,功能上,子曰大模型它能夠作為基座模型支持諸多下游任務,向所有下游場景提供語義理解、知識表達等基礎能力?;诖?,有道研發(fā)團隊在“子曰”大模型的基礎上,為不同學習場景設計了定制化的模型。例如其推出的虛擬人口語教練Hi Echo,主要功能在于理解場景和上下文并給出反饋,發(fā)音可關注到重音、弱讀、升降調等細節(jié),采用啟發(fā)式對話并給出針對性建議。

網(wǎng)易大模型產(chǎn)品的落地方向在教育行業(yè)很具代表性——集中在辦公及學習場景中,聚焦于to c的效率提升方向。在開源模型變多后,小團隊就可以做出類似應用,這些產(chǎn)品可能會受到?jīng)_擊。而另一方面,雖然模型技術在翻譯和語法講解等領域較為成熟,但目前仍舊與真人精講有一定差距,網(wǎng)易稱“產(chǎn)品在英語場景下已經(jīng)能夠做到98%的答題準確率”,不過在學習考試領域,2%的容錯率仍可能讓用戶產(chǎn)生疑慮。

除了教育,網(wǎng)易還主要落地在游戲、工業(yè)、音樂場景。上個月,在浙江省召開的全省平臺經(jīng)濟高質量發(fā)展大會上,丁磊表示,當前網(wǎng)易的首要任務是用最快的速度探索AI大模型的創(chuàng)新應用,最近三年,網(wǎng)易研發(fā)總投入近400億。

2.好未來:自研數(shù)學領域千億級大模型

不同于其他大模型產(chǎn)品多集中于“文本范疇”,5 月 5 日,學而思對外表示,公司正在研發(fā)數(shù)學大模型,命名為「MathGPT」,面向全球數(shù)學愛好者和科研機構,以數(shù)學領域的解題和講題算法為導向,將于 2023 年內(nèi)推出基于該大模型的產(chǎn)品級應用。

由于大語言模型來自對海量語言文本的訓練,因此更擅長語言處理,在數(shù)理邏輯方面表現(xiàn)一般。Google收購的Photomath、微軟數(shù)學、Mathway、專注數(shù)學計算的WolframAlpha等產(chǎn)品,主要利用非LLM的傳統(tǒng)AI技術加上數(shù)據(jù)庫的方式解決數(shù)學問題,學而思則選擇自研基于專業(yè)領域的“數(shù)學大模型”MathGPT。8月24日,好未來自研的數(shù)學領域千億級大模型MathGPT正式上線并開啟公測,具體效果還需要時間的檢驗。

這當然具有很強的意義,根據(jù)世界教育不平等數(shù)據(jù)庫,在印度,來自最貧困20%的家庭的15歲學生,在數(shù)學方面只有最富裕20%的家庭的15歲學生的一半水平,所以ChatGPT在數(shù)學領域的應用會讓教育普及的門檻更低。學而思以數(shù)學起家”,積累了大量數(shù)學相關數(shù)據(jù),但訓練MathGPT需要的不只是數(shù)據(jù)——GPT沒有數(shù)據(jù)飛輪,所以在一定意義上來說并非用的人越多越好;并且數(shù)學領域容錯率更低,如何將準確率提升至100%?如何匹配不同人群的數(shù)學學習場景?可能還有很長一段路要走。

此外,好未來還入股人工智能公司深言科技,深言科技核心成員來自智源悟道大模型研發(fā)團隊,致力于用最前沿的人工智能和自然語言處理技術,尤其是大規(guī)模預訓練模型技術。

3.科大訊飛:從AI學習機硬件切入

談到大模型,科大訊飛可能是不得不提的公司。

梳理時間線,今年2月,科大訊飛稱已于“2022年12月進一步啟動生成式預訓練大模型任務攻關,科大訊飛AI學習機、訊飛聽見等產(chǎn)品將率先落地”。4月該公司發(fā)布AIGC內(nèi)容創(chuàng)作平臺“訊飛智作”,用于音視頻創(chuàng)作場景。

5月6日,科大訊飛正式發(fā)布了訊飛星火認知大模型及應用成果,科大訊飛AI學習機T20系列率先在語數(shù)英主學科上進行了大模型應用落地,首批上線了中英文作文類人批改(學習機端)和生成(家長端)、數(shù)學個性化精準學類人互動輔學、英語類人口語陪練功能。6月9日,訊飛星火V1.5突破開放式問答,并在數(shù)學能力和多輪對話能力上迭代升級,面向教育、醫(yī)療、工業(yè)、辦公等領域的應用全面升級。

在AI學習機領域,科大訊飛又于7月6日發(fā)布了搭載訊飛星火大模型的首款立式大屏 LUMIE 10 系列,進一步擴充了學習機全系列品類,當前已搭載星火大模型的學習機系列包括 T20、LUMIE 10、T10、 X3。

8月15日,訊飛星火V2.0升級:發(fā)布代碼和多模態(tài)能力,同時發(fā)布搭載訊飛星火V2.0的多項應用和產(chǎn)品;與華為聯(lián)合發(fā)布企業(yè)私有專屬大模型解決方案——星火一體機,合作共建全國產(chǎn)化算力底座。

科大訊飛選擇從AI學習機硬件切入,是因為教育硬件貢獻了重要的營收占比。財報顯示,今年5月、6月,大模型加持后學習機GMV分別同比增長136%和217%。與此同時,2023年上半年,科大訊飛的研發(fā)費用為15.17億元,同比增長5.42%。然而,8月1日,蘋果應用商店下架訊飛星火APP,這多少對科大訊飛的大模型之路產(chǎn)生了一些影響。

摩根商研所觀點認為:“現(xiàn)階段較為成熟的生成式AI產(chǎn)品,大都是從模仿ChatGPT起步,功能區(qū)塊可謂是大同小異。”而超越ChatGPT的關鍵一方面是在技術層面實現(xiàn)更快速精準的運算效率;再有就是尋求特色化突破,釋放更多AI工具想象力。

4.百度:ToB和ToC領域兩手布局

在今年5月26日的中關村論壇上,百度創(chuàng)始人、董事長兼CEO李彥宏,發(fā)表了題為《大模型改變世界》的演講。李彥宏稱:“ 未來,所有的應用都將基于大模型來開發(fā),每一個行業(yè)都應該有屬于自己的大模型,大模型會深度融合到實體經(jīng)濟當中去?!?nbsp;

此前,百度推出大語言模型生成式AI產(chǎn)品“文心一言”及百度智能云發(fā)布企業(yè)級大語言模型服務平臺“文心千帆”。百度在今年5月發(fā)布的小度青禾學習手機也搭載了小度靈機大模型,并提供AI互動講題、寫作指導、口語練習等功能。6月,百度推出基于大模型的代碼編寫助手“Comate”,據(jù)百度內(nèi)部人士透露,輔助代碼撰寫是第一階段的主要產(chǎn)品功能,第二階段,“Comate”將實現(xiàn)在特定領域、場景的自然語言代碼生成,第三階段將實現(xiàn)全領域的自然語言開發(fā)。

李彥宏曾透露:“自三月文心一言發(fā)布以來,百度收到來自企業(yè)用戶超10萬份針對文心一言的測試請求,包括金融,軟件,教育,在線旅游等等?!彼€預測,隨著文心一言不斷整合至各個app,尤其是搜索app之中,預計用戶參與度和流量將進一步提升,由此支持在線營銷業(yè)務營收的增長。

百度是國內(nèi)最早推出類ChatGPT產(chǎn)品并開放內(nèi)測的公司,且ToB和ToC領域均有布局。在資金、算力、人才乃至視野上,大廠的優(yōu)勢都很明顯。李彥宏旗下三亞百川致新私募股權投資基金合伙企業(yè)(有限合伙)還投資了前華為“天才少年”稚暉君的機器人項目。外界普遍認為,百度投資智元機器人的真正目的是布局 AGI機器人市場。

5.作業(yè)幫:正在內(nèi)測基于中國市場的教育大模型

6月,媒體披露作業(yè)幫正在內(nèi)測基于中國市場的教育大模型,包含多學科解題、中英文作文批改、多語言對話方向等多個教育應用場景,涉及工具類App、智能硬件、圖書等業(yè)務。

知情人士透露,作業(yè)幫在今年年初啟動了自研教育大模型項目,目前該項目由CTO羅亮牽頭進行底層研發(fā)支持及AIGC大方向建設,研發(fā)經(jīng)費優(yōu)先調撥。同時,除了組織架構調整,作業(yè)幫產(chǎn)研團隊中近百人也已并入GPT相關項目,估計有兩百人以上的團隊規(guī)模。

6.阿里云:未來所有產(chǎn)品都將接入大模型

8月3日,阿里云開源通義千問70億參數(shù)模型,包括通用模型Qwen-7B和對話模型Qwen-7B-Chat,兩款模型均已上線AI模型社區(qū)魔搭 ModelScope ,且兩款模型都是開源、免費、可商用的。

6月末,阿里云與復旦大學、中國電信共同打造的中國高校最大的云上科研智算平臺CFFF(Computing for the Future at Fudan)上線,CFFF定位是為發(fā)現(xiàn)和解決復雜科學問題而建設的科研“超級計算機”,由面向多學科融合創(chuàng)新的AI for Science(人工智能用于科研)智能計算集群“切問”一號和面向高精尖研究的專用高性能計算集群“近思”一號兩部分組成。接下來,平臺還將持續(xù)擴大其算力規(guī)模,并向復旦校外的科研機構、高校、醫(yī)院、高科技企業(yè)等開放。

在IaaS、PaaS之外,阿里云還推出了MaaS(模型即服務),阿里云還官宣:未來阿里所有的產(chǎn)品都將接入大模型進行全面升級,并向全行業(yè)開放通義千問的能力。據(jù)悉,阿里云的單位算力成本較之十年前下降了80%,存儲成本降低90%,但也仍面臨著高昂的訓練成本壓力。

“教育是大模型最容易落地的領域”,大模型賽道中不光有教育巨頭與科技、互聯(lián)網(wǎng)企業(yè),不少有實力的科研院所也紛紛下場。一組數(shù)據(jù)顯示:3月中旬,剛發(fā)布幾天的GPT4回答準確率超過70%,同期已發(fā)布的國產(chǎn)大模型平均準確率20%。5 月,國產(chǎn)大模型的平均準確率已經(jīng)追到50%以上。彼時,一位業(yè)內(nèi)人士告訴我們,教育行業(yè)在對大模型的探索上,國內(nèi)外最大的差異是時間,本質上這種差距花更多時間、投入算力和資金就能追上。截至目前,包含通用與垂直、開源與閉源不同類型在內(nèi),國產(chǎn)大模型數(shù)量已超百家。

7月,《生成式人工智能服務管理暫行辦法》正式頒布,明確推動生成式人工智能基礎設施和公共訓練數(shù)據(jù)資源平臺建設,促進算力資源協(xié)同共享,提升算力資源利用效能。在基礎設施層面,國內(nèi)一直在前進,教育行業(yè)真正需要思考的,也許是如何讓大模型真正落地產(chǎn)業(yè)以及如何回擊教育大模型產(chǎn)品同質化、缺乏突破性產(chǎn)品的質疑聲。

參考資料:

1.《ChatGPT的應用場景暢想:教育篇》https://36kr.com/p/2262739375272073

2.《科大訊飛的機遇,藏在垂類大模型?》https://36kr.com/p/2378266100873217

3.《國產(chǎn)大模型已無公司可投》https://36kr.com/p/2385973327640581

4.《阿里云大模型之戰(zhàn):逍遙子不能輸》https://36kr.com/p/2217597900895617

5.《大模型的“高考沖刺”,教育行業(yè)已率先交卷?》https://36kr.com/p/2291324087834626

6.《大模型不能再繼續(xù)“裸奔”了》https://36kr.com/p/2394442594753673

1、本文是 芥末堆網(wǎng)原創(chuàng)文章,轉載可點擊 芥末堆內(nèi)容合作 了解詳情,未經(jīng)授權拒絕一切形式轉載,違者必究;
2、芥末堆不接受通過公關費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。
來源: 芥末堆
芥末堆商務合作:王老師 18710003484
  • 好未來MathGPT今日上線,來看看各家“教育版大模型產(chǎn)品”進度如何分享二維碼