芥末堆芥末堆

馬斯克發(fā)布Grok 3大模型,稱(chēng)超越DeepSeek

作者:阿宅 發(fā)布時(shí)間:

馬斯克發(fā)布Grok 3大模型,稱(chēng)超越DeepSeek

作者:阿宅 發(fā)布時(shí)間:

摘要:馬斯克此前稱(chēng)Grok 3是“地球上最聰明的人工智能”。

1.png

圖源:Grok 3發(fā)布會(huì)直播截圖

北京時(shí)間2月18日12時(shí),馬斯克在X平臺(tái)直播,宣布其AI公司xAI發(fā)布最新版的旗艦AI大模型Grok 3。這場(chǎng)直播的在線觀看人數(shù)超200萬(wàn)。

馬斯克此前稱(chēng)Grok 3是“地球上最聰明的人工智能”。

Grok 3大模型包括Grok 3和Grok 3 mini兩個(gè)版本。兩者的區(qū)別是Grok 3 mini回答問(wèn)題的速度更快,但準(zhǔn)確性遜色一些。

6.png

xAI團(tuán)隊(duì)首先展示了Grok 3與其他大模型的比賽結(jié)果。xAI稱(chēng),Grok 3在AIME、GPQA和LCB的基準(zhǔn)測(cè)試中勝過(guò)GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3、Gemini-2 Pro等模型,這意味著Grok 3在數(shù)學(xué)、科學(xué)和代碼等數(shù)據(jù)集上更勝一籌。

5.png

xAI還表示,Grok 3的早期版本chocolate在Chatbot Arena中的分?jǐn)?shù)也更高。Chatbot Arena是由國(guó)際開(kāi)放研究組織LMSYS Or推出的一款大模型競(jìng)技場(chǎng)。

據(jù)xAI官方介紹,Grok 3的訓(xùn)練計(jì)算量是Grok 2的10倍多。

Grok 3支持推理能力,解鎖了測(cè)試時(shí)計(jì)算(test-time compute)能力。當(dāng)使用更多測(cè)試時(shí)間計(jì)算時(shí),Grok 3 Reasoning和Grok 3 mini Reasoning的表現(xiàn)超過(guò)了高配版o3 mini、o1和DeepSeek-R1等其他模型。

4.png

Grok 3和Grok 3 mini有DeepSearch、Think、BigBrain三個(gè)主要的功能按鈕,支持研究、頭腦風(fēng)暴、數(shù)據(jù)分析、圖像生成和代碼生成多個(gè)功能。

使用Think模式,Grok 3和Grok 3 mini可以仔細(xì)地思考問(wèn)題,這個(gè)功能類(lèi)似于OpenAI的o3 mini和DeepSeek-R1等的推理模型。用戶(hù)可以通過(guò)Grok的應(yīng)用程序訪問(wèn)Grok 3。

遇到更難的問(wèn)題時(shí),可以使用Big Brain模式進(jìn)行更全面、更仔細(xì)的推理。xAI表示,這個(gè)模式最適合解決數(shù)學(xué)、科學(xué)和編程的相關(guān)問(wèn)題。

同時(shí),馬斯克指出,Grok 3將部分推理過(guò)程模糊化,以防止被蒸餾。蒸餾指的是AI模型開(kāi)發(fā)人員從另一個(gè)模型中提取知識(shí)。

值得注意的是,Grok新增了DeepSearch的新功能,對(duì)標(biāo)OpenAI的DeepResearch等功能。DeepSearch可以用于深度搜索,掃描互聯(lián)網(wǎng)和X平臺(tái),分析信息,并提供摘要回答用戶(hù)的問(wèn)題。

2.png

X Premium+的訂閱用戶(hù)能優(yōu)先使用Grok 3,要想訪問(wèn)其他功能,還需要訂閱SuperGrok。SuperGrok的價(jià)格為每月30美元或每年300美元,用戶(hù)能解鎖更多的推理和深度搜索查詢(xún)功能,并無(wú)限訪問(wèn)圖像生成功能。

馬斯克說(shuō),在未來(lái),或許大約一周后,Grok將增加語(yǔ)音模式。幾周后,Grok 3模型將與DeepSearch功能一起出現(xiàn)在xAI的企業(yè)API中。幾個(gè)月后,Grok 3的上一個(gè)版本Grok2將開(kāi)源。

“我們通常會(huì)在下一個(gè)版本完全發(fā)布時(shí),開(kāi)源上一個(gè)版本?!瘪R斯克說(shuō)。“當(dāng)Grok 3成熟且穩(wěn)定時(shí),可能在幾個(gè)月內(nèi),我們將開(kāi)源Grok 2?!?/p>

基于xAI介紹的Grok 3的種種功能,預(yù)計(jì)Grok 3在教育方面的應(yīng)用效果將比此前的版本更勝一籌。至于Grok 3的效果是否比其他公司研發(fā)的模型更強(qiáng),還需要等待市場(chǎng)和用戶(hù)的檢驗(yàn)。

但可以肯定的是,日益激烈的AI軍備競(jìng)賽正在為教育帶來(lái)愈發(fā)深遠(yuǎn)的影響。

1、本文是 芥末堆網(wǎng)原創(chuàng)文章,轉(zhuǎn)載可點(diǎn)擊 芥末堆內(nèi)容合作 了解詳情,未經(jīng)授權(quán)拒絕一切形式轉(zhuǎn)載,違者必究;
2、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫(xiě)信息告訴我們。
來(lái)源: 芥末堆
芥末堆商務(wù)合作:王老師 18710003484
  • 馬斯克發(fā)布Grok 3大模型,稱(chēng)超越DeepSeek分享二維碼