<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > 告別視頻通話(huà)“渣畫(huà)質(zhì)”，英偉達新算法最高壓縮90%流量

告別視頻通話(huà)“渣畫(huà)質(zhì)”，英偉達新算法最高壓縮90%流量

作者：時(shí)間：2020-12-02 來(lái)源：量子位

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

為了讓網(wǎng)速慢的用戶(hù)用上高清通話(huà)，英偉達可謂絞盡腦汁。他們開(kāi)發(fā)的新AI算法，可以將視頻通話(huà)的流量最高壓縮90%以上。

本文引用地址：http://dyxdggzs.com/article/202012/420822.htm

　　

　　和其他視頻相比，通話(huà)的場(chǎng)景比較單一，基本上只有人的頭部在運動(dòng)。因此只要能把頭像數據大規模壓縮，就能大大節約流量。

　　

　　英偉達的新算法face vid2vid正是從這一點(diǎn)出發(fā)。只要一張圖片，就能實(shí)現重建各種頭部姿勢圖片。

　　H.264視頻所需的帶寬是這種新算法的2~12倍，從前面的演示也能看出，如果讓二者使用相同比特率，那么H.264視頻幾乎不可用。

　　

　　轉動(dòng)面部不扭曲

　　英偉達提供了一個(gè)試用Demo，可以在Pitch（俯仰角）、Yaw（偏航角）、Roll（翻滾角）三個(gè)方向上任意旋轉。

　　

　　輸入一張人臉，最多可以在每個(gè)方向上最多旋轉30度。以下是三個(gè)方向上旋轉到最大角度生成的圖片。

　　

　　與相比之前的方法，英偉達的這種技術(shù)即使在面部轉動(dòng)幅度較大時(shí)，人臉也不會(huì )扭曲變形。

　　

　　然而，圖片終究是不動(dòng)的，要把生成的人臉?lè )旁谶\動(dòng)的視頻中還要多一個(gè)步驟。

　　合成面部視頻

　　我們把上傳的清晰照片作為源圖像，從中獲取外貌特征。然后把視頻中一幀幀畫(huà)面作為重構視頻的依據，從中提取出面部表情和頭部姿勢等信息。

　　而表情和姿勢這兩個(gè)數據可以通過(guò)關(guān)鍵點(diǎn)進(jìn)行編碼，這樣就分離了人物身份信息和運動(dòng)信息。在傳輸視頻時(shí)只要有運動(dòng)信息即可，從而節約了流量。

　　

　　從源圖像s中，我們得到了兩組數據：關(guān)鍵點(diǎn)坐標x和雅可比矩陣J。這兩組參數與面部的具體特征無(wú)關(guān)，只包含人的幾何特征。

　　其中，雅可比矩陣表示如何通過(guò)仿射變換將關(guān)鍵點(diǎn)周?chē)木植垦a丁轉換為另一幅圖像中的補丁。如果是恒等雅可比矩陣，則補丁將直接復制并粘貼到新位置。

　　

　　下圖展示了計算前5個(gè)關(guān)鍵點(diǎn)的流程。給定源圖像以及模型預測的規范關(guān)鍵點(diǎn)。

　　

　　從運動(dòng)視頻估計的旋轉和平移應用于關(guān)鍵點(diǎn)，帶動(dòng)頭部姿勢的變化。然后可以感知表情的變形將關(guān)鍵點(diǎn)調整為目標表情。

　　接下來(lái)開(kāi)始合成視頻。使用源和運動(dòng)的關(guān)鍵點(diǎn)與其雅可比矩陣來(lái)估計流wk，從生成流組合成掩碼m，將這兩組進(jìn)行線(xiàn)性組合即可產(chǎn)生合成流場(chǎng)w。

　　

　　接著(zhù)輸入人臉面部特征f，即可生成輸出圖像y。

　　這種方法不僅能用于視頻通話(huà)，也有其他“新玩法”。

　　比如覺(jué)得人物頭像有點(diǎn)歪，可以手動(dòng)輸入糾正后的數據，從而將面部轉正。

　　

　　又或者是，把一個(gè)人的面部特征點(diǎn)和雅可比矩陣用于另一個(gè)人，實(shí)現面部視頻動(dòng)作的遷移。

　　

　　團隊簡(jiǎn)介

　　這篇文章的第一作者是來(lái)自英偉達的高級研究員Ting-Chun Wang。

　　

　　文章的通訊作者是英偉達的著(zhù)名研究員劉洺堉。

　　

　　如果你長(cháng)期關(guān)注CV領(lǐng)域，一定對這兩位作者非常熟悉。他們在圖像風(fēng)格遷移、GAN等方面做出了大量的工作。

　　

　　△ GauGAN

　　兩人之前已經(jīng)有過(guò)多次合作。比如。無(wú)監督圖像遷移網(wǎng)絡(luò )（NIPS 2017），還有從涂鴉生成照片的GauGAN（CVPR 2019），都是出自這二位之手。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 英偉達 算法

評論

相關(guān)推薦

數字PID控制及其改進(jìn)算法的應用

設計方案數字控制及其改進(jìn) 算法應用 | 2011-05-11

大嘴業(yè)話(huà)——ARM再次上市，究竟7年時(shí)間算不算被偷走的？（1）

視頻英偉達嵌入式 ARM 軟銀 | 2023-11-06

無(wú)線(xiàn)傳感器網(wǎng)絡(luò )低功耗分簇路由算法設計

設計方案無(wú)線(xiàn) 傳感器網(wǎng)絡(luò ) 功耗路由算法設計 | 2012-09-07

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達創(chuàng )造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

在英偉達工作不容易？員工曝高壓高工時(shí)更甚臺積電

國際視野英偉達臺積電 | 2024-07-24

GPU的形態(tài)已徹底改變，英偉達GTC大會(huì )發(fā)布的到底是什么

視頻英偉達 GPU Blackwell AI GTC | 2024-03-26

三星通過(guò)英偉達測試內幕：用在中國大陸產(chǎn)品

網(wǎng)絡(luò )與存儲三星英偉達 HBM3 | 2024-07-24

浪潮信息回應與英偉達分銷(xiāo)中國特供B20芯片：消息不實(shí)

智能計算英偉達浪潮 B20 | 2024-07-23

英偉達RTX 50系顯卡延期至2025年

英偉達顯卡 AMD Intel CES | 2024-07-23

消息稱(chēng)英偉達曾向臺積電詢(xún)問(wèn)建設廠(chǎng)外 CoWoS 先進(jìn)封裝專(zhuān)線(xiàn)可能，遭拒絕

EDA/PCB 英偉達 GPU 封裝工藝臺積電 | 2024-07-23

“貓和老鼠”的較量軟件破解大揭密（ZT）

武松打虎 | 2004-05-21

求FSK信號的解調算法，主要是鐵路上的移頻信號!

dhlwq007 | 2004-08-04

計算機科學(xué)與技術(shù)反思錄(2)

liujt_ic | 2003-06-06

CRC算法原理及C語(yǔ)言實(shí)現

資源下載 CRC 算法 C語(yǔ)言 | 2007-02-16

基于LPC2138的血壓測量算法開(kāi)發(fā)平臺電路圖

設計方案基于 LPC2138 血壓測量算法開(kāi)發(fā)平臺電路圖 | 2010-01-20

加密算法之MD5算法

資源下載加密算法加密算法 MD5算法 | 2007-02-16

vxwokrs下靜態(tài)圖像壓縮算法（上）

C-- | 2004-07-26

目標跟蹤算法在紅外熱成像跟蹤技術(shù)上的應用

設計方案目標跟蹤算法紅外成像技術(shù)上應用 | 2009-09-03

大嘴業(yè)話(huà)——ARM再次上市，究竟7年時(shí)間算不算被偷走的？（2）

視頻 AI 英偉達 ARM | 2023-11-07

消息稱(chēng)英偉達 RTX 4070 及以上顯卡因 GDDR6X 顯存缺貨 8 月供應緊張

消費電子英偉達 GPU | 2024-07-29

傳英偉達曾要求建立專(zhuān)用CoWoS產(chǎn)線(xiàn)，但是被臺積電拒絕

智能計算英偉達 CoWoS 臺積電 | 2024-07-24

英偉達的挑戰者的來(lái)錢(qián)之道

智能計算英偉達大模型 | 2024-07-23

采用Mean-Shift和Camshift算法相結合的火焰視頻圖像跟蹤設計

設計方案采用 Mean-Shift Camshift 算法相結合 | 2011-06-27

《E點(diǎn)冷知識》：引發(fā)AI行業(yè)大地震的CUDA究竟有多強大

視頻英偉達 GPU CUDA AI | 2024-03-26

大嘴業(yè)話(huà)——英偉達宣布進(jìn)軍CPU市場(chǎng)

視頻英偉達 AI CPU | 2023-11-10

數字PID控制算法之一

資源下載 PID PID控制算法 | 2007-12-28

簡(jiǎn)單實(shí)用的單片機CRC 快速算法

資源下載 CRC 算法單片機 | 2007-02-16

PID算法

資源下載 PID 算法誤差 | 2007-02-16

Meta訓練Llama 3遭遇頻繁故障

智能計算 Meta Llama 3 英偉達 H100 顯卡 GPU | 2024-07-29

[轉帖]us/os就緒表的維護算法分析

amine | 2002-05-17

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>