国产在线精品一区二区三区直播_精品国产乱码久久久久久影片_欧美老妇人与禽交_男人天堂2018手机在线版_亚洲中文精品久久久久久不卡_国产毛多水多做爰爽爽爽_野外做受三级视频_中文天堂在线www_国产精品无码久久四虎_国产在线观看免费人成视频

您的位置:首頁(yè) >科技 >

快手自研大模型“快意(KwaiYii)”亮相,CMMLU 中文向排名第一


(資料圖片)

IT之家 8 月 21 日消息,近日,快手自研的大語(yǔ)言模型“快意”(KwaiYii)已開(kāi)啟內(nèi)測(cè),并為業(yè)務(wù)團(tuán)隊(duì)提供了標(biāo)準(zhǔn) API 和定制化項(xiàng)目合作方案。

在最新的 CMMLU 中文向排名中,快意的 13B 版本 KwaiYii-13B 同時(shí)位列 five-shot 和 zero-shot 下的第一名,在人文學(xué)科、中國(guó)特定主題等方面較強(qiáng),平均分超 61 分。

IT之家查詢快意 GitHub 頁(yè)面發(fā)現(xiàn),官方介紹顯示:

快意大模型(KwaiYii) 是由快手 AI 團(tuán)隊(duì)從零到一獨(dú)立自主研發(fā)的一系列大規(guī)模語(yǔ)言模型(Large Language Model,LLM),當(dāng)前包含了多種參數(shù)規(guī)模的模型,并覆蓋了預(yù)訓(xùn)練模型(KwaiYii-Base)、對(duì)話模型(KwaiYii-Chat)。這里面我們介紹 13B 規(guī)模的系列模型 KwaiYii-13B,其主要特點(diǎn)包括:

KwaiYii-13B-Base 預(yù)訓(xùn)練模型具備優(yōu)異的通用技術(shù)底座能力,在絕大部分權(quán)威的中 / 英文 Benchmark 上取得了同等模型尺寸下的 State-Of-The-Art 效果。例如,KwaiYii-13B-Base 預(yù)訓(xùn)練模型在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前處于同等模型規(guī)模的領(lǐng)先水平。 KwaiYii-13B-Chat 對(duì)話模型具備出色的語(yǔ)言理解和生成能力,支持內(nèi)容創(chuàng)作、信息咨詢、數(shù)學(xué)邏輯、代碼編寫(xiě)、多輪對(duì)話等廣泛任務(wù),人工評(píng)估結(jié)果表明 KwaiYii-13B-Chat 超過(guò)主流的開(kāi)源模型,并在內(nèi)容創(chuàng)作、信息咨詢和數(shù)學(xué)解題上接近 ChatGPT(3.5)同等水平。

據(jù)了解,快手 AI 團(tuán)隊(duì)將持續(xù)迭代“快意”大模型,一方面將繼續(xù)優(yōu)化模型性能并研發(fā)多模態(tài)能力 ,另一方面也在推進(jìn)更多 C 端與 B 端業(yè)務(wù)場(chǎng)景下的落地。

標(biāo)簽:

熱門(mén)資訊

圖片新聞

精彩新聞