<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 人臉識別精度提升 | 基于Transformer的人臉識別

人臉識別精度提升 | 基于Transformer的人臉識別

發(fā)布人：CV研究院時(shí)間：2021-07-16 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

現階段的人臉檢測識別技術(shù)已經(jīng)特別成熟，不管在什么領(lǐng)域都有特別成熟的應用，比如：無(wú)人超市、車(chē)站檢測、犯人抓捕以及行跡追蹤等應用。但是，大多數應用都是基于大量數據的基礎，成本還是非常昂貴。所以人臉識別的精度還是需要進(jìn)一步提升，那就要繼續優(yōu)化更好的人臉識別框架。

論文：https://arxiv.org/pdf/2103.14803.pdf

一、技術(shù)回顧——Transformer

相比于卷積，Transformer有什么區別，優(yōu)勢在哪？

卷積有很強的歸納偏見(jiàn)（例如局部連接性和平移不變性），雖然對于一些比較小的訓練集來(lái)說(shuō)，這毫無(wú)疑問(wèn)是有效的，但是當我們有了非常充足的數據集時(shí)，這些會(huì )限制模型的表達能力。與CNN相比，Transformer的歸納偏見(jiàn)更少，這使得他們能夠表達的范圍更廣，從而更加適用于非常大的數據集；

卷積核是專(zhuān)門(mén)設計用來(lái)捕捉局部的時(shí)空信息，它們不能夠對感受野之外的依賴(lài)性進(jìn)行建模。雖然將卷積進(jìn)行堆疊，加深網(wǎng)絡(luò )會(huì )擴大感受野，但是這些策略通過(guò)聚集很短范圍內的信息的方式，仍然會(huì )限制長(cháng)期以來(lái)的建模。與之相反，自注意力機制通過(guò)直接比較在所有時(shí)空位置上的特征，可以被用來(lái)捕捉局部和全局的長(cháng)范圍內的依賴(lài)；

當應用于高清的長(cháng)視頻時(shí)，訓練深度CNN網(wǎng)絡(luò )非常耗費計算資源。目前有研究發(fā)現，在靜止圖像的領(lǐng)域中，Transformer訓練和推導要比CNN更快。使得能夠使用相同的計算資源來(lái)訓練擬合能力更強的網(wǎng)絡(luò )。

二、簡(jiǎn)要

最近，人們不僅對Transformer的NLP，而且對計算機視覺(jué)也越來(lái)越感興趣。我們想知道Transformer是否可以用于人臉識別，以及它是否比cnns更好。

因此，有研究者研究了Transformer模型在人臉識別中的性能?？紤]到原始Transformer可能忽略inter-patch信息，研究者修改了patch生成過(guò)程，使相互重疊的滑動(dòng)塊成為標識。這些模型在CASIA-WebFace和MSSeleb-1M數據庫上進(jìn)行訓練，并在幾個(gè)主流基準上進(jìn)行評估，包括LFW、SLLFW、CALFW、CPLFW、TALFW、CFP-FP、AGEDB和IJB-C數據庫。研究者證明了在大規模數據庫MS-Celeb-1M上訓練的人臉Transformer模型實(shí)現了與CNN具有參數和MACs相似數量的CNN相似的性能。

二、FACE TRANSFORMER

2.1 網(wǎng)絡(luò )框架愛(ài)

人臉Transformer模型采用ViT[A. Dosovitskiy, L. Beyer, A. Kolesnikov, D. Weissenborn, X. Zhai, T. Unterthiner, M. Dehghani, M. Minderer, G. Heigold, S. Gelly et al., “An image is worth 16x16 words: Transformers for image recognition at scale,” arXiv preprint arXiv:2010.11929]體系結構，采用原Transformer。唯一的區別是，研究者修改了ViT的標記生成方法，以生成具有滑動(dòng)塊的標記，即使圖像塊重疊，以便更好地描述塊間信息，如下圖所示。

具體地說(shuō)，從圖像

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 深度學(xué)習

相關(guān)推薦

為什么深度學(xué)習如此容易被愚弄？AI研究員正努力修復神經(jīng)網(wǎng)絡(luò )缺陷

智能計算 DNN 深度神經(jīng)網(wǎng)絡(luò ) 深度學(xué)習 | 2022-07-05

深度強化學(xué)習核心技術(shù)開(kāi)發(fā)與應用

szhlss123 | 2022-08-10

視覺(jué)慣性導航融合算法研究進(jìn)展

物聯(lián)網(wǎng)與傳感器 202302 視覺(jué)慣性導航優(yōu)化耦合算法深度學(xué)習 | 2023-02-21

直覺(jué)有害！Facbook最新研究：易于解釋的神經(jīng)元會(huì )誤導DNN的學(xué)習

智能計算 DNN 深度神經(jīng)網(wǎng)絡(luò ) 深度學(xué)習 | 2022-07-05

深度學(xué)習（人工神經(jīng)網(wǎng)絡(luò )的研究的概念）

大綠葉 | 2020-07-28

基于深度學(xué)習的跌倒檢測技術(shù)對比與分析*

智能計算深度學(xué)習跌倒檢測卷積神經(jīng)網(wǎng)絡(luò ) 長(cháng)短期記憶網(wǎng)絡(luò ) 202212 | 2022-12-22

Deep Learning中文版

資源下載深度學(xué)習中文 | 2019-06-11

TFLite模型的開(kāi)盲盒體驗

嵌入式系統 TFLite 模型推理庫深度學(xué)習 | 2024-05-10

Firefly DL小巧輕便，嵌入式深度學(xué)習加速部署

智能計算 Firefly DL 深度學(xué)習人工智能 | 2023-12-22

深度學(xué)習模型的云邊協(xié)同訓練和部署*

智能計算云邊協(xié)同深度學(xué)習服務(wù)器部署 202212 | 2022-12-22

基于深度學(xué)習的智能電網(wǎng)短期日負荷曲線(xiàn)預測系統設計與實(shí)現

智能計算 202302 深度學(xué)習短期負荷預測卷積神經(jīng)網(wǎng)絡(luò ) 長(cháng)短期記憶網(wǎng)格 Flask | 2023-02-27

射頻系統的深度學(xué)習

資源下載 ADI RF DSP 深度學(xué)習 | 2020-04-20

深度學(xué)習（DeepLearning）

szhlss123 | 2022-08-17

一種改進(jìn)的可遷移深度學(xué)習模型*

智能計算 202210 可遷移深度學(xué)習無(wú)標簽 | 2022-10-25

基于圖結構的圖像注意力網(wǎng)絡(luò )

智能計算 202207 深度學(xué)習注意力機制圖像分類(lèi) 人臉識別 | 2022-07-26

什么是人機交互技術(shù)？

龍騰AI技術(shù) | 2022-11-02

AI深度學(xué)習

loof_lripa | 2024-04-20

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>