国产在线精品一区二区三区直播_精品国产乱码久久久久久影片_欧美老妇人与禽交_男人天堂2018手机在线版_亚洲中文精品久久久久久不卡_国产毛多水多做爰爽爽爽_野外做受三级视频_中文天堂在线www_国产精品无码久久四虎_国产在线观看免费人成视频

您的位置：首頁(yè) >科技 >

H100 推理性能最高提升 8 倍，英偉達(dá)發(fā)布 TensorRT-LLM 模型

來(lái)源：搜狐號(hào)-IT之家時(shí)間：2023-09-09 15:14:18

(資料圖)

IT之家 9 月 9 日消息，英偉達(dá)今天宣布推出名為 TensorRT-LLM，是一個(gè)深度優(yōu)化的開(kāi)源庫(kù)，能夠在 Hopper 等 AI GPU 上加速所有大語(yǔ)音模型的推理性能。

英偉達(dá)目前已經(jīng)和開(kāi)源社區(qū)合作，利用 SmoothQuant、FlashAttention 和 fMHA 等尖端技術(shù)，實(shí)現(xiàn) AI 內(nèi)核來(lái)優(yōu)化其 GPU，可以加速 GPT-3（175 B），Llama Falcom（180 B）和 Bloom 模型。

TensorRT-LLM 的亮點(diǎn)在于引入了名為 In-Flight batching 的調(diào)度方案，允許工作獨(dú)立于其他任務(wù)進(jìn)入和退出 GPU。

該方案允許同一 GPU 在處理大型計(jì)算密集型請(qǐng)求時(shí)，動(dòng)態(tài)處理多個(gè)較小的查詢(xún)，提高 GPU 的處理性能，可以讓 H100 的吞吐量加快 2 倍。

在性能測(cè)試中，英偉達(dá)以 A100 為基礎(chǔ)，對(duì)比了 H100 以及啟用 TensorRT-LLM 的 H100，在 GPT-J 6B 推理中，H100 推理性能比 A100 提升 4 倍，而啟用 TensorRT-LLM 的 H100 性能是 A100 的 8 倍。

在 Llama 2 中，H100 推理性能是 A100 的 2.6 倍；而啟用 TensorRT-LLM 的 H100 性能是 A100 的 4.6 倍。

IT之家在此附上報(bào)告原文，感興趣的用戶(hù)可以深入閱讀。

標(biāo)簽：

熱門(mén)資訊

京東方藝云亮相世界顯示產(chǎn)業(yè)大會(huì)，低碳智慧新品重磅發(fā)布 9月7日，世界顯示產(chǎn)業(yè)大會(huì)在成都盛...
?駐馬店市安全生產(chǎn)綜合督查組第三督查組督導(dǎo)西平文旅系統(tǒng)安全生產(chǎn)工作 9月8日上午，駐馬店市安全生產(chǎn)綜合...
熟齡肌如何選擇膠原水光，這樣做重塑肌膚，煥發(fā)青春氣息 隨著時(shí)間的流逝，肌膚中的膠原蛋白...
威睿公司與威騰電氣達(dá)成戰(zhàn)略合作，推進(jìn)能源產(chǎn)業(yè)高質(zhì)量發(fā)展 近日，威睿公司與江蘇威騰能源科技...

觀察

圖片新聞

三亞學(xué)院迎來(lái)7000余名新生 三亞新聞網(wǎng)9月9日消息（三亞傳媒融...
“最美的背影”納入天涯區(qū)各校“開(kāi)學(xué)第一課” 師生點(diǎn)贊傳播校園正能量 金秋開(kāi)學(xué)日，天涯區(qū)各校將《三亞日...
海南舉辦主題宣傳推廣全國(guó)會(huì)獎(jiǎng)旅游買(mǎi)家“會(huì)”聚三亞 三亞新聞網(wǎng)9月9日消息（三亞傳媒融...
三亞擬對(duì)35條街道進(jìn)行精品化建設(shè)改造 三亞新聞網(wǎng)9月9日消息（三亞傳媒融...

精彩新聞

藝術(shù)家發(fā)布聯(lián)名信：生成式AI是實(shí)用工具，但需制定完善監(jiān)管 IT之家9月9日消息，一群藝術(shù)家聯(lián)名...
《潛行者 2：切爾諾貝利之心》游戲開(kāi)發(fā)商因電氣故障引發(fā)火災(zāi) IT之家9月9日消息，根據(jù)捷克游戲網(wǎng)...
獲近40億補(bǔ)貼！中國(guó)電池制造商國(guó)軒高科147億在美建廠(chǎng)計(jì)劃敲定 獲近40億補(bǔ)貼！中國(guó)電池制造商國(guó)軒...
Lisa 法國(guó)頂級(jí)夜總會(huì)將挑戰(zhàn)酒杯脫衣舞，瘋馬秀經(jīng)理回應(yīng) Blackpink作為當(dāng)下最火的韓女團(tuán)之...
碳中和周報(bào)｜理想汽車(chē)計(jì)劃進(jìn)軍自動(dòng)駕駛卡車(chē)領(lǐng)域工信部：加強(qiáng)新型儲(chǔ)能產(chǎn)業(yè)發(fā)展統(tǒng)... 《科創(chuàng)板日?qǐng)?bào)》9月9日訊（實(shí)習(xí)記者...
女人最忌諱什么寶石手鏈 女人最忌諱戴著可疑來(lái)歷的寶石手鏈...
手機(jī)基帶是什么意思 手機(jī)基帶是指手機(jī)的一個(gè)重要組成部...
2024年度城鄉(xiāng)居保9月起繳費(fèi) 本報(bào)訊為切實(shí)做好我市2024年度城鄉(xiāng)...
甘肅蘭州：今年購(gòu)買(mǎi)新建商品房可享受50%契稅補(bǔ)貼 甘肅省蘭州市近日出臺(tái)《關(guān)于進(jìn)一步...
摩洛哥南部6.8級(jí)地震已致至少30人死亡 據(jù)摩洛哥媒體報(bào)道，摩洛哥南部8日...
新疆阿克蘇地區(qū)庫(kù)車(chē)市發(fā)生3.7級(jí)地震 中國(guó)地震臺(tái)網(wǎng)正式測(cè)定：09月09日04...
可精準(zhǔn)到毫厘！顯微鏡“手藝人”的“火眼金睛”是如何練成的？ 全國(guó)每賣(mài)出兩臺(tái)牙科手術(shù)顯微鏡，就...
同比增長(zhǎng)40.1%！三亞離島免稅暑期銷(xiāo)售逾38億元 59.4萬(wàn)人次購(gòu)物 三亞新聞網(wǎng)9月9日消息（三亞傳媒融...
海南舉辦主題宣傳推廣全國(guó)會(huì)獎(jiǎng)旅游買(mǎi)家“會(huì)”聚三亞 三亞新聞網(wǎng)9月9日消息（三亞傳媒融...
Mozilla 開(kāi)放 Thunderbird 升級(jí)通道，102 版本用戶(hù)可升至 115 IT之家9月9日消息，Mozilla于今年7...
三亞擬對(duì)35條街道進(jìn)行精品化建設(shè)改造 三亞新聞網(wǎng)9月9日消息（三亞傳媒融...
“最美的背影”納入天涯區(qū)各校“開(kāi)學(xué)第一課” 師生點(diǎn)贊傳播校園正能量 金秋開(kāi)學(xué)日，天涯區(qū)各校將《三亞日...
消息稱(chēng)《足球經(jīng)理 2024》游戲 11 月 6 日發(fā)行，售價(jià) 59.99 歐元 IT之家9月9日消息，消息源Billbil-...
哈爾濱多車(chē)加油后開(kāi)出不遠(yuǎn)就熄火加油站：進(jìn)水了、已賠付 哈爾濱多車(chē)加油后開(kāi)出不遠(yuǎn)就熄火加...
達(dá)人為 Steam Deck 游戲掌機(jī)定制便攜式外接鍵盤(pán) IT之家9月9日消息，硬件黑客Karlis...
三亞學(xué)院迎來(lái)7000余名新生 三亞新聞網(wǎng)9月9日消息（三亞傳媒融...
世界新動(dòng)態(tài)：?潢川：樂(lè)葡葡萄迎來(lái)豐收季 壓架駢枝露顆圓，水精落落照晴軒。...
全球頭條：?2023年息縣慶祝第39個(gè)教師節(jié)表彰大會(huì)召開(kāi) 三尺講臺(tái)育英才，一支粉筆譜華章。...
?羅山縣審計(jì)局召開(kāi)大數(shù)據(jù)審計(jì)工作交流座談會(huì)暨2023年度審計(jì)業(yè)務(wù)工作中期總結(jié)推進(jìn)會(huì) 9月7日，羅山縣審計(jì)局召開(kāi)大數(shù)據(jù)審...
?商城縣觀廟鎮(zhèn)：“流動(dòng)堡壘”聚人心黨旗他鄉(xiāng)一樣紅_天天快訊 為進(jìn)一步發(fā)揮駐外黨支部組織群眾、...
今日?qǐng)?bào)丨?驕陽(yáng)不墜青云志磨礪始得玉初成——西平一中教育集團(tuán)舉行2023年軍訓(xùn)匯報(bào)演出 鏗鏘有力的口號(hào)，矯健有力的步伐，...
?光山：“油茶果”繪就鄉(xiāng)村振興新畫(huà)卷 初秋時(shí)節(jié)，走進(jìn)老區(qū)光山縣的廣袤農(nóng)...
?暖心光山孫鐵鋪派出所連續(xù)幫助群眾尋回走失耕牛 秋收農(nóng)忙時(shí)節(jié)，耕牛是農(nóng)戶(hù)必不可少...
手機(jī)充電發(fā)燙什么原因 手機(jī)充電發(fā)燙的原因有以下幾個(gè)可能...
喝牛奶拉稀是什么原因 喝牛奶拉稀的原因可以有多種可能性...
石家莊第一座“青云闕”開(kāi)啟人居新時(shí)代 近日發(fā)布的《關(guān)于優(yōu)化個(gè)人住房貸款...
海南約談“六水共治”工作考核排名靠后市縣 原標(biāo)題：我省約談“六水共治”工作...
杭州亞運(yùn)會(huì)主媒體中心啟動(dòng)試運(yùn)行 9月9日上午，杭州亞運(yùn)會(huì)主媒體中心...
意大利機(jī)場(chǎng)地勤人員舉行罷工 當(dāng)?shù)貢r(shí)間8日，意大利機(jī)場(chǎng)地勤人員...
機(jī)械、汽車(chē)等四個(gè)重點(diǎn)行業(yè)穩(wěn)增長(zhǎng)工作方案出臺(tái) 工業(yè)和信息化部近日舉行工業(yè)穩(wěn)增長(zhǎng)...
大連：與死神賽跑這個(gè)“片警”3天連救2人 3日18時(shí)10分左右，剛下班回家的大...
安卓 TV 14 Beta 版代碼顯示谷歌將推新款 Chromecast IT之家9月9日消息，開(kāi)發(fā)者M(jìn)ishaalR...
B 社回復(fù)網(wǎng)友：英特爾 Arc A770 未達(dá)《星空》游戲最低要求 IT之家9月9日消息，不少英特爾顯卡...
光照均勻不頻閃色溫自然不刺眼 本報(bào)訊（記者吳悠見(jiàn)習(xí)記者彭家一）...
消息稱(chēng)三星Galaxy S23 FE手機(jī)有黑色、白色、綠色和紫色四種顏色 IT之家9月9日消息，根據(jù)荷蘭科技媒...
《匹諾曹的謊言》PS4/5 版大小曝光，最快 9 月 14 日預(yù)下載 IT之家9月9日消息，PS數(shù)據(jù)爆料者Pl...
我市6名學(xué)生榮獲國(guó)家級(jí)“創(chuàng)新之星” 學(xué)生獲獎(jiǎng)后和家長(zhǎng)、老師一起合影。...
沛縣競(jìng)逐新賽道培育新動(dòng)能 九月，沛縣大地花紅果碩，生機(jī)勃勃...
提升居民參保意識(shí) 擴(kuò)大醫(yī)保參保覆蓋面 “醫(yī)保夜集市”現(xiàn)場(chǎng)。本報(bào)記者秦媛...
“牌子”減下來(lái) 服務(wù)提上去 本報(bào)訊（記者吳云）近日，鼓樓區(qū)九...
喝牛奶對(duì)身體有什么好處和壞處 喝牛奶對(duì)身體有很多好處，同時(shí)也有...
廣東今天部分地區(qū)仍有強(qiáng)降雨粵西珠三角等地或有大暴雨 今天（9月9日），廣東部分地區(qū)仍有...
曬秋丨貴州黔西：天晴好曬秋喜迎豐收景 初秋時(shí)節(jié)，貴州省畢節(jié)市黔西市玉米...
北京今天降雨降溫出行請(qǐng)注意防雨慢行車(chē) 北京市氣象臺(tái)9月9日6時(shí)發(fā)布預(yù)報(bào)，...
一女子濫用職權(quán)威脅理發(fā)店？山東深夜通報(bào)！記者獨(dú)家對(duì)話(huà)被威脅店主！ 9月8日晚間，山東臨沂郯城縣融媒體...