<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > CVPR 2021 | pixelNeRF：一種基于NeRF的多視圖三維重建網(wǎng)絡(luò )

CVPR 2021 | pixelNeRF：一種基于NeRF的多視圖三維重建網(wǎng)絡(luò )

發(fā)布人：計算機視覺(jué)工坊時(shí)間：2021-05-14 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

概述

作者提出了pixelNeRF，一個(gè)只需要輸入單張或多張圖像，就能得到連續場(chǎng)景表示的學(xué)習框架。由于現存的構建神經(jīng)輻射場(chǎng)【1】的方法涉及到獨立優(yōu)化每個(gè)場(chǎng)景的表示，這需要許多校準的視圖和大量的計算時(shí)間，因此作者引入了一種新的網(wǎng)絡(luò )架構。實(shí)驗結果表明，在所有情況下，pixelNeRF在新視圖合成和單圖像三維重建方面都優(yōu)于當前最先進(jìn)的工作。

簡(jiǎn)介

該項目主要研究的問(wèn)題是如何從一個(gè)稀疏的輸入視圖集中合成這個(gè)場(chǎng)景的新視圖，在可微神經(jīng)渲染出現之前，這個(gè)長(cháng)期存在的問(wèn)題一直沒(méi)有得到進(jìn)展。同時(shí)，最近的神經(jīng)渲染場(chǎng)NeRF通過(guò)編碼體積密度和顏色，在特定場(chǎng)景的新視圖合成方面表現出很好的效果。雖然NeRF可以渲染非常逼真的新視圖，但它通常是不切實(shí)際的，因為它需要大量的位姿圖像和冗長(cháng)的場(chǎng)景優(yōu)化。

在這篇文章中，作者對上述方法進(jìn)行了改進(jìn)，與NeRF網(wǎng)絡(luò )不使用任何圖像特征不同的是，pixelNeRF將與每個(gè)像素對齊的空間圖像特征作為輸入。這種圖像調節允許框架在一組多視圖圖像上進(jìn)行訓練，學(xué)習場(chǎng)景先驗，然后從一個(gè)或幾個(gè)輸入圖像中合成視圖，如下圖所示。

PixelNeRF具有很多特點(diǎn)：首先，Pixel可以在多視圖圖像的數據集上面進(jìn)行訓練，而不需要任何額外的監督；其次，PixelNeRF預測輸入圖像的攝像機坐標系中的NeRF表示，而不是標準坐標系，這是泛化看不見(jiàn)的場(chǎng)景和物體類(lèi)別的必要條件，因為在有多個(gè)物體的場(chǎng)景中，不存在明確的規范坐標系；第三，它是完全卷積的，這允許它保持圖像和輸出3D表示之間的空間對齊；最后，PixelNeRF可以在測試時(shí)合并任意數量的輸入視圖，且不需要任何優(yōu)化。

相關(guān)工作

新視圖合成：這是一個(gè)長(cháng)期存在的問(wèn)題，它需要從一組輸入視圖中構建一個(gè)場(chǎng)景的新視圖。盡管現在有很多工作都已經(jīng)取得了逼真的效果，但是存在比較多的問(wèn)題，例如需要密集的視圖和大量的優(yōu)化時(shí)間。

其他方法通過(guò)學(xué)習跨場(chǎng)景共享的先驗知識，從單個(gè)或少數輸入視圖進(jìn)行新的視圖合成，但是這些方法使用2.5D表示，因此它們能夠合成的攝像機運動(dòng)范圍是有限的。在這項工作中，作者提出了PixelNeRF，能夠直接從相當大的基線(xiàn)中合成新視圖。

基于學(xué)習的三維重建：得益于深度學(xué)習的發(fā)展，單視圖或多視圖的三維重建也得到快速的發(fā)展。問(wèn)題是，很多表示方法都需要3D模型進(jìn)行監督，盡管多視圖監督限制更小、更容易獲取，其中的很多方法也需要物體的mask。相比之下，PixelNeRF可以單獨從圖像中訓練，允許它應用到含有兩個(gè)對象的場(chǎng)景而不需要修改。

以觀(guān)察者為中心的三維重建：對于3D學(xué)習任務(wù)，可以在以觀(guān)察者為中心的坐標系（即視圖空間）或以對象為中心的坐標系（即規范空間）中進(jìn)行預測。大多數現存的方法都是在規范空間中進(jìn)行預測，雖然這使得學(xué)習空間規律更加容易，但是會(huì )降低不可見(jiàn)對象和具有多個(gè)對象場(chǎng)景的預測性能。PixelNeRF在視圖空間中操作，這在【2】中已經(jīng)被證明可以更好地重建看不見(jiàn)的對象類(lèi)別，并且不鼓勵對訓練集的記憶。下表是PixelNeRF和其他方法的對比：

背景介紹：NeRF

NeRF【1】將場(chǎng)景編碼為顏色和密度的連續體積輻射場(chǎng)f。特別地，對于一個(gè)3D點(diǎn)x和

觀(guān)察方向單位向量d，f返回微分密度σ和RGB顏色c：f(x, d) = (σ, c)。體積輻射場(chǎng)可以通過(guò)下面的函數渲染成2D圖像：

其中T(t)處理遮擋。對于具有姿態(tài)P的目標視圖，相機光線(xiàn)可以參數化為r(t)=o+td，o為光線(xiàn)原點(diǎn)(相機中心)。沿著(zhù)相機光線(xiàn)在預定義的深度邊界[tn，tf]之間計算積分。在實(shí)踐中，這種積分是通過(guò)沿每個(gè)像素射線(xiàn)采樣點(diǎn)的數值求積來(lái)近似的。

然后，將攝影機光線(xiàn)r的渲染像素值與對應的真實(shí)像素值C(r)進(jìn)行比較，最后的loss定義如下：

其中R(P)是具有目標姿態(tài)的所有相機光線(xiàn)的集合。雖然NeRF實(shí)現了最新的視圖合成，但它是一種基于優(yōu)化的方法，每個(gè)場(chǎng)景必須單獨優(yōu)化，場(chǎng)景之間沒(méi)有知識共享。這種方法不僅耗時(shí)，而且在單個(gè)或極稀疏視圖的限制下，無(wú)法利用任何先驗知識來(lái)加速重建或完成形狀。

基于圖像的NeRF

為了克服上面提到的關(guān)于NeRF的問(wèn)題，作者提出了一種基于空間圖像特征的NeRF結構。該模型由兩個(gè)部分組成：一個(gè)完全卷積的圖像編碼器E(將輸入圖像編碼為像素對齊的特征網(wǎng)格)和一個(gè)NeRF網(wǎng)絡(luò )f(給定一個(gè)空間位置及其對應的編碼特征，輸出顏色和密度)。

單視圖pixelNeRF：首先固定坐標系為輸入圖像的視圖空間，并在這個(gè)坐標系中指定位置和攝像機光線(xiàn)。給定場(chǎng)景的輸入圖像I，首先提取出它的特征量W=E(I)。然后，對于相機光線(xiàn)上的一個(gè)點(diǎn)x，通過(guò)使用已知的內參，將x投影到圖像坐標π(x)上，然后在像素特征之間進(jìn)行雙線(xiàn)性插值來(lái)提取相應的圖像特征向量W(π(x))。最后把圖像特征連同位置和視圖方向(都在輸入視圖坐標系統中)傳遞到NeRF網(wǎng)絡(luò )：

其中γ()是x上的位置編碼。

合并多個(gè)視圖：多個(gè)視圖提供了有關(guān)場(chǎng)景的附加信息，并解決了單視圖固有的三維幾何歧義。作者擴展了該模型，不同于現有的在測試時(shí)只使用單個(gè)輸入視圖的方法，它允許在測試時(shí)有任意數量的視圖。

在有多個(gè)輸入視圖的情況下，只假設相對的相機姿態(tài)是已知的，為了便于解釋?zhuān)梢詾閳?chǎng)景任意固定一個(gè)世界坐標系。把輸入圖像記為I，其相關(guān)聯(lián)的攝像機記為P=[R t]。對于新的目標攝影機光線(xiàn)，將視圖方向為d的點(diǎn)x轉換到每個(gè)輸入視圖i的坐標系，轉換如下：

為了獲得輸出的密度和顏色，作者獨立地處理每個(gè)視圖坐標幀中的坐標和相應的特征，并在NeRF網(wǎng)絡(luò )中聚合視圖。將NeRF網(wǎng)絡(luò )的初始層表示為f1，它分別處理每個(gè)輸入視圖空間中的輸入，并將最終層表示為f2，它處理聚合視圖。

和單視圖類(lèi)似，作者將每個(gè)輸入圖像編碼成特征體積W(i)=E(I(i))。對于點(diǎn)x(i)，在投影圖像坐標π(x(i))處從特征體W(i)中提取相應的圖像特征，然后將這些輸入傳遞到f1，以獲得中間向量：

最后用平均池化算子ψ將中間向量V(i)聚合并傳遞到最后一層f2，得到預測的密度和顏色：

效果和對比

特定類(lèi)別的單視圖重建

特定類(lèi)別的雙視圖重建

特定類(lèi)別的單視圖和雙視圖重建結果對比

參考文獻：

【1】Ben Mildenhall, Pratul P. Srinivasan, Matthew Tancik,Jonathan T. Barron, Ravi Ramamoorthi, and Ren Ng. Nerf: Representing scenes as neural radiance fields for view synthesis. In Eur. Conf. Comput. Vis., 2020

【2】Daeyun Shin, Charless Fowlkes, and Derek Hoiem. Pixels, voxels, and views: A study of shape representations for single view 3d object shape prediction. In IEEE Conf. Comput.Vis. Pattern Recog., 2018.

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

相關(guān)推薦

瑞薩電子AI單元解決方案成功提高GE醫療（日本）日野工廠(chǎng)的生產(chǎn)力

winni945 | 2018-09-12

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計算 AI 智能計算深圳 | 2024-07-30

大嘴業(yè)話(huà)-AI目前市場(chǎng)分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

AI+機器視覺(jué)成趨勢，圖文詳解N大應用場(chǎng)景

智能計算安森美 AI 機器視覺(jué) | 2024-07-31

蘋(píng)果表示其AI模型是在谷歌的定制芯片上訓練的

智能計算 AI | 2024-07-30

釋說(shuō)芯語(yǔ)16：硬科技：構建企業(yè)未來(lái)之路（附PPT）

jackwang | 2018-10-22

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來(lái)頭？

視頻 AI 機器人 | 2021-02-26

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

AI驅動(dòng)的嵌入式聲音和振動(dòng)識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

加大調整力度，教育部支持高校布局集成電路、AI 等專(zhuān)業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

iPhone 16將不會(huì )預裝AI功能？計劃通過(guò)iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達創(chuàng )造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

“破局AI開(kāi)發(fā)，釋放邊緣算力開(kāi)發(fā)者訪(fǎng)談”，干貨滿(mǎn)滿(mǎn)！

視頻 intel AI OpenVINO | 2021-06-10

WTC-AI型太陽(yáng)能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽(yáng)能熱水器電路熱水器 | 2012-07-30

Nvidia的CEO談AI的未來(lái)：“我們將需要三臺電腦... 一臺來(lái)創(chuàng )建AI... 一臺來(lái)模擬AI... 一臺來(lái)運行AI”

智能計算 AI | 2024-07-31

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過(guò) Meta AI 模型安全系統

智能計算 Meta AI | 2024-07-31

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

繼上次海聯(lián)達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

萬(wàn)家樂(lè )JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬(wàn)家樂(lè ) | 2013-01-17

海聯(lián)達（Aigale）Ai-HD1 無(wú)線(xiàn)全高清套件拆解

zhuwei0710 | 2013-04-28

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

CSR8670CSR8675智能語(yǔ)音Alexa藍牙方案開(kāi)發(fā)

資源下載 AI 智能語(yǔ)音 | 2017-12-14

如何快速搭建手寫(xiě)體識別演示系統

視頻 digikey AI 手寫(xiě)體識別 | 2022-07-29

WTC-AI太陽(yáng)能熱水器電路圖

設計方案 WTC-AI 太陽(yáng)能熱水器電路圖 | 2012-07-24

國際奧委會(huì )：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會(huì ) 體育 | 2024-07-26

蘋(píng)果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋(píng)果 AI 谷歌定制芯片 | 2024-07-30

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>