<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > 英偉達推出 Tensor RT-LLM，使大語(yǔ)言模型在搭載 RTX 的 PC 平臺上運行速度提高 4 倍

英偉達推出 Tensor RT-LLM，使大語(yǔ)言模型在搭載 RTX 的 PC 平臺上運行速度提高 4 倍

作者：時(shí)間：2023-10-18 來(lái)源：IT之家

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

IT之家 10 月 18 日消息，英偉達是硬件領(lǐng)域的生成型人工智能之王，該公司的 GPU 為微軟、OpenAI 等公司的數據中心提供動(dòng)力，運行著(zhù) Bing Chat、ChatGPT 等人工智能服務(wù)。今天，英偉達宣布了一款新的軟件工具，旨在提升大型語(yǔ)言模型（LLM）在本地 Windows PC 上的性能。

本文引用地址：http://dyxdggzs.com/article/202310/451713.htm

英偉達推出 Tensor RT-LLM，使大語(yǔ)言模型在搭載 RTX 的 PC 平臺上運行速度提高 4 倍

在一篇博客文章中，英偉達宣布了其 TensorRT-LLM 開(kāi)源庫，這個(gè)庫之前是為數據中心發(fā)布的，現在也可以用于 Windows PC。最大的特點(diǎn)是，如果 Windows PC 配備英偉達 GeForce RTX GPU，TensorRT-LLM 可以讓 LLM 在 Windows PC 上的運行速度提高四倍。

英偉達在文章中介紹了 TensorRT-LLM 對開(kāi)發(fā)者和終端用戶(hù)的好處：

在更大的批量大小下，這種加速可顯著(zhù)改善更復雜的 LLM 使用體驗，如寫(xiě)作和編碼助手，可同時(shí)輸出多個(gè)唯一的自動(dòng)完成結果，從而加速性能并改進(jìn)質(zhì)量，讓用戶(hù)可以有最好的選擇。

IT之家注意到，博客文章展示了一個(gè) TensorRT-LLM 的例子。當向 LLaMa 2 基礎模型提出“《心靈殺手 2》集成了 NVIDIA 的哪些技術(shù)？”這一問(wèn)題時(shí)，它給出“游戲尚未公布”這一毫無(wú)幫助的回答。相反，使用 RAG 將 GeForce 新聞添加到向量庫中，并連接到相同的 Llama2 模型，不僅得到正確答案 ——NVIDIA DLSS 3.5、NVIDIA Reflex 和全景光線(xiàn)追蹤，而且在 TensorRT-LLM 加速的助力下響應速度更快。這種速度與能力的結合為用戶(hù)提供更智能的解決方案。

英偉達推出 Tensor RT-LLM，使大語(yǔ)言模型在搭載 RTX 的 PC 平臺上運行速度提高 4 倍

TensorRT-LLM 很快就會(huì )在英偉達的開(kāi)發(fā)者網(wǎng)站上提供。

英偉達今天還在新的 GeForce 驅動(dòng)更新中增加了一些基于人工智能的功能。其中包括新的 1.5 版本的 RTX Video Super Resolution 功能，可以在觀(guān)看在線(xiàn)視頻時(shí)提供更好的分辨率提升效果和更少的壓縮效果。英偉達還為 Stable Diffusion Web UI 增加了 TensorRT 人工智能加速功能，讓擁有 GeForce RTX GPU 的用戶(hù)可以比正常情況下更快地從人工智能圖片生成器那里獲得圖像。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 英偉達 GPU 人工智能

評論

相關(guān)推薦

消息稱(chēng)英偉達 RTX 4070 及以上顯卡因 GDDR6X 顯存缺貨 8 月供應緊張

消費電子英偉達 GPU | 2024-07-29

具有人工智能的溫度控制電路設計

設計方案具有人工智能溫度控制電路設計 | 2012-07-24

東南大學(xué)人工智能03

資源下載人工智能計算機科學(xué) 聲音識別 | 2007-04-20

傳蘋(píng)果智能將錯過(guò)iOS 18 9月份大升級推遲1個(gè)月發(fā)布

手機與無(wú)線(xiàn)通信蘋(píng)果智能 iOS 18 推遲人工智能 iPhone iPad Apple Intelligence | 2024-07-29

三星通過(guò)英偉達測試內幕：用在中國大陸產(chǎn)品

網(wǎng)絡(luò )與存儲三星英偉達 HBM3 | 2024-07-24

仿人機器人

資源下載仿人機器人傳感器人工智能 | 2007-04-19

有簡(jiǎn)單人工智能的溫度控制電路

設計方案簡(jiǎn)單人工智能溫度控制 | 2009-09-01

Manpower代招上海 US MNC GPU Physical design technical leader

魔都獵頭招聘 | 2013-07-23

傳英偉達曾要求建立專(zhuān)用CoWoS產(chǎn)線(xiàn)，但是被臺積電拒絕

智能計算英偉達 CoWoS 臺積電 | 2024-07-24

具有人工智能的溫度控制電路圖

設計方案具有人工智能溫度控制電路圖 | 2012-07-24

ADI公司：工業(yè)4.0——人工智能的端

視頻 ADI 人工智能工業(yè)4.0 | 2019-11-08

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達創(chuàng )造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

有簡(jiǎn)單人工智能的溫度控制電路圖

設計方案簡(jiǎn)單人工智能溫度控制電路圖 | 2010-09-01

未來(lái)的人工智能世界：技術(shù)與人文的和諧還是斗爭？

藍盒子 | 2007-09-11

東南大學(xué)人工智能02

資源下載人工智能大規模集成電路自適應能力 | 2007-04-20

STC-人工智能二維生命探測儀

renazan2000 | 2013-01-14

在英偉達工作不容易？員工曝高壓高工時(shí)更甚臺積電

國際視野英偉達臺積電 | 2024-07-24

人工智能歷史

Lamborghini | 2011-03-15

Intel 收購 NVDIA 意欲何為

視頻 Intel NVDIA CPU GPU 移動(dòng)處理 | 2012-12-26

消息稱(chēng)英偉達曾向臺積電詢(xún)問(wèn)建設廠(chǎng)外 CoWoS 先進(jìn)封裝專(zhuān)線(xiàn)可能，遭拒絕

EDA/PCB 英偉達 GPU 封裝工藝臺積電 | 2024-07-23

簡(jiǎn)單人工智能的溫度控制電路

設計方案簡(jiǎn)單人工智能溫度控制 | 2009-07-06

gpu_gpu是什么意思

dolphin | 2014-06-12

人工智能與機器人

視頻物聯(lián)網(wǎng) 可穿戴設備智能硬件高峰論壇機器人人工智能 | 2015-01-19

Meta訓練Llama 3遭遇頻繁故障

智能計算 Meta Llama 3 英偉達 H100 顯卡 GPU | 2024-07-29

微軟X英特爾黑客松大賽

視頻英特爾微軟黑客松人工智能 OpenVINO | 2021-07-27

大嘴業(yè)話(huà)：A12真的能改變競爭格局么？

視頻 ARM A12 GPU | 2013-06-21

東南大學(xué)人工智能01

資源下載人工智能語(yǔ)言識別圖像識別自然語(yǔ)言處理專(zhuān)家系統 | 2007-04-20

英偉達RTX 50系顯卡延期至2025年

英偉達顯卡 AMD Intel CES | 2024-07-23

本科畢業(yè)設計：一種基于發(fā)育思想的語(yǔ)音識別系統實(shí)現

資源下載語(yǔ)音識別人工智能自主式機器發(fā)育思想自組織映射網(wǎng)絡(luò ) 簡(jiǎn)單反饋神經(jīng)網(wǎng)絡(luò ) | 2007-04-19

馬斯克詢(xún)問(wèn)網(wǎng)友：特斯拉向xAI投50億美元行不行

智能計算馬斯克特斯拉 xAI 人工智能 | 2024-07-25

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>