圖源:Pixabay
芥末堆文 近期,Meta發(fā)布免費(fèi)且可商用的大模型系列——Llama 2。8月3日,阿里云開(kāi)源通義千問(wèn)70億參數(shù)模型,包括通用模型Qwen-7B和對(duì)話模型Qwen-7B-Chat,兩款模型均已上線AI模型社區(qū)魔搭 ModelScope ,且兩款模型都是開(kāi)源、免費(fèi)、可商用的。
據(jù)悉,魔搭ModelScope為阿里巴巴達(dá)摩院模型開(kāi)源社區(qū),阿里云成為國(guó)內(nèi)首個(gè)加入大模型開(kāi)源行列的大型科技企業(yè)。
今年4月,阿里云推出自研大模型通義千問(wèn),據(jù)科技媒體介紹,Qwen-7B是基于Transformer的大語(yǔ)言模型,在超大規(guī)模預(yù)訓(xùn)練數(shù)據(jù)上訓(xùn)練得到。預(yù)訓(xùn)練數(shù)據(jù)包括大量網(wǎng)絡(luò)文本、專業(yè)書(shū)籍、代碼等。它是支持中、英等多種語(yǔ)言的基座模型,在超過(guò)2萬(wàn)億 token 數(shù)據(jù)集上訓(xùn)練,上下文窗口長(zhǎng)度達(dá)到8k;Qwen-7B-Chat是基 Qwen-7B基座模型的中英文對(duì)話模型,已實(shí)現(xiàn)與人類認(rèn)知對(duì)齊。
根據(jù)魔搭ModelScope社區(qū)消息,上個(gè)月,智譜AI及清華KEG實(shí)驗(yàn)室發(fā)布允許ChatGLM-6B和ChatGLM2-6B完全免費(fèi)商用,希望為開(kāi)源社區(qū)發(fā)展作出貢獻(xiàn),為此,在中國(guó)中文信息學(xué)會(huì)社會(huì)媒體處理專委會(huì)的支持下,智譜AI及清華KEG實(shí)驗(yàn)室聯(lián)合安碩信息、阿里云、魔搭社區(qū)、北京交通大學(xué),推出了“ChatGLM金融大模型挑戰(zhàn)賽”。比賽要求參賽選手以ChatGLM2-6B模型為中心制作一個(gè)問(wèn)答系統(tǒng),回答用戶的金融相關(guān)的問(wèn)題,不允許使用其他的大語(yǔ)言模型。
據(jù)悉,近日騰訊自研的 “騰訊混元大模型”也已經(jīng)進(jìn)入應(yīng)用內(nèi)測(cè)階段,騰訊內(nèi)部多個(gè)業(yè)務(wù)已經(jīng)接入混元大模型進(jìn)行測(cè)試。
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫(xiě)信息告訴我們。