<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 康謀分享 | 突破傳統匿名化：先進(jìn)技術(shù)解鎖數據價(jià)值新維度

康謀分享 | 突破傳統匿名化：先進(jìn)技術(shù)解鎖數據價(jià)值新維度

發(fā)布人：康謀自動(dòng)駕駛時(shí)間：2025-02-18 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

海量數據的收集使得新舊企業(yè)能夠利用機器學(xué)習技術(shù)開(kāi)發(fā)新產(chǎn)品并革新舊產(chǎn)品。近年來(lái)，數據質(zhì)量因直接影響了人工智能系統的性能和魯棒性而備受關(guān)注。然而，這對通常通過(guò)破壞像素信息（如模糊化、馬賽克等）來(lái)實(shí)現匿名化的方法提出了挑戰，這些方法導致合規性與數據質(zhì)量之間難以兼得。

我們探索了一種不是簡(jiǎn)單移除像素信息，而是對其進(jìn)行自然替換的深度自然匿名化（Deep Natural Anonymization，DNAT）方法，致力于提高匿名化數據價(jià)值，助力企業(yè)開(kāi)發(fā)創(chuàng )新。

一、匿名化數據的傳統矛盾

DNAT能夠檢測人臉、車(chē)牌等可識別信息，并為每個(gè)對象生成人工替換。每個(gè)替換都盡可能匹配源對象的屬性，但這種匹配是有選擇性的，我們可以靈活控制保留哪些屬性。

例如，對于人臉，保留性別和年齡等屬性可能對后續分析至關(guān)重要。對于可識別信息以外的內容，不包含敏感個(gè)人數據的信息則保留不做修改。通過(guò)這種方式，DNAT成功打破了數據消除與匿名化之間的傳統矛盾。

圖片1.png

圖1: 匿名化工具的比較，從左至右依次為：Facepixelizer，YouTube，Fast Redaction，DNAT，原圖

為了衡量匿名化方法對數據質(zhì)量的影響，我們從Labeled Face in the Wild（LFW）數據集中采樣了圖像。所有圖像均取自測試集。我們比較了代表匿名化技術(shù)的四種不同的匿名化工具，圖1顯示了這些示例的一部分。

二、匿名化的結構一致性

首先，我們分析了圖像在匿名化處理后的整體結構變化。為此，我們仔細研究了圖像分割結果。圖像分割是將圖像的像素劃分為多個(gè)片段的過(guò)程，每個(gè)片段代表一個(gè)對象類(lèi)別。在我們的示例中，最重要的對象是個(gè)人資料圖片中的人物和背景。

圖2和圖3展示了LFW數據集中兩位名人的分割圖。這些分割圖是由語(yǔ)義分割模型DeepLabv3+生成的，采用了官方TensorFlow存儲庫中的實(shí)現和模型權重。

圖片2.png

圖2: AI Pacino DeepLabv3+ 分割結果對比

圖片3.png

圖3: Reese witherspoon DeepLabv3+ 分割結果對比

從圖2和圖3中可以看出，傳統匿名化方法的分割圖明顯退化，其中一些甚至完全錯誤。然而，深度自然匿名化（DNAT）保留了語(yǔ)義分割。分割圖與原始圖像幾乎完全相同。從圖3中可以看出，經(jīng)過(guò)傳統匿名化方法處理的人臉圖像不僅產(chǎn)生了較差的分割邊界，還使分割模型推斷出原始圖像中從未出現的新對象類(lèi)別，如貓、狗或瓶子。

為了量化每種匿名化技術(shù)的影響，我們計算了整個(gè)測試集的平均交并比（mIOU）。計算是在不同方法生成的圖像分割圖與原始圖像分割圖之間進(jìn)行的。結果如表1所示。

表1：用mIOU測量的語(yǔ)義分割一致性（越高越好）

表1.png

三、匿名化的內容一致性

為了評估匿名化圖像與原始圖像之間的整體內容一致性，我們使用了Clarifai的獨立圖像標注模型?！巴ㄓ脠D像標注模型能夠識別超過(guò)11,000種不同的概念，包括對象、主題、情緒等?！边@些標簽描述了模型從輸入圖像中推斷出的內容。

此外，模型還為每個(gè)標簽提供了置信度。圖4展示了Clarifai公共圖像標注模型對原始圖像及其DNAT版本預測的前5個(gè)概念。

圖片4.png

圖4:來(lái)自clarifai的Reese Witherspoon前5個(gè)概念。（左原始圖像，右DNAT）

理想情況下，通用圖像標注模型應該為原始圖像和匿名化圖像預測完全相同的概念。為了衡量一致性，我們使用Clarifai為每種匿名化技術(shù)的所有測試樣本預測概念。然后，我們計算了匿名化圖像與原始圖像之間前N個(gè)預測概念的平均精度（mAP）（其中N代表不同概念的數量）。

通過(guò)mAP，我們評估了兩點(diǎn)：預測概念的一致性及其相關(guān)分數。例如，考慮一個(gè)匿名化圖像及其原始圖像對，經(jīng)過(guò)圖像標注模型處理后，如果某個(gè)概念在匿名化圖像中的置信度值低于其在原始圖像中的置信度值，則對最終mAP分數的影響較??；而如果某個(gè)概念僅出現在匿名化圖像中，而未出現在其原始圖像中，則影響較大。

前5和前50個(gè)概念的結果如表2所示。

表2：用mAP測量圖像概念一致性（越高越好）

表2.png

四、總結

本文探討了如何通過(guò)深度自然匿名化（DNAT）技術(shù)提升匿名化數據的價(jià)值，打破了傳統匿名化方法在合規性與數據質(zhì)量之間的固有權衡。DNAT通過(guò)生成自然替換而非破壞像素信息，不僅有效保護了個(gè)人隱私，還最大限度地保留了數據的分析價(jià)值。

實(shí)驗表明，DNAT在圖像分割和內容一致性方面顯著(zhù)優(yōu)于傳統匿名化方法，能夠更好地支持后續的AI分析和應用。

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 數據匿名化 圖像識別 圖像分割 數據處理

相關(guān)推薦

攝像頭智能循跡小車(chē)設計與實(shí)現

設計方案 Kinetis60 圖像識別 OV7620 | 2015-06-26

USB2 有人做USB2.0的高速數據采集和實(shí)時(shí)數據處理卡的嗎？

jackwang | 2006-09-17

我想做個(gè)汽車(chē)上一個(gè)數據處理的產(chǎn)品，請問(wèn)選哪個(gè)型號的芯片好？

stone123 | 2010-12-23

一款嵌入式數字存儲示波器設計方案

設計方案 ILI9230 數據處理數字存儲示波器 | 2015-06-15

我國最大的數據處理超級服務(wù)器通過(guò)驗收

liujt_ic | 2003-03-17

歷史十大高被引論文

圖像識別 ResNet AI ChatGPT | 2025-05-27

大聯(lián)大品佳集團推出基于MediaTek產(chǎn)品的圖像識別方案

智能計算大聯(lián)大品佳 MediaTek 圖像識別 | 2023-04-06

RK3568核心板ROM-5880助力360°環(huán)視系統破除車(chē)輛盲區

汽車(chē)電子 360環(huán)視 AI 圖像識別 | 2023-12-21

基于紅外光的工業(yè)及汽車(chē)應用設計案例集錦

設計方案紅外光智能語(yǔ)音超聲波數據處理 | 2015-06-24

基于圖像識別技術(shù)的地鐵站智能閘機系統設計

嵌入式系統 202303 疫情防范圖像識別視頻傳輸 | 2023-03-28

如何實(shí)現數據處理性能提升？為你揭曉背后功臣

嵌入式系統 Arm 數據處理 | 2024-09-26

基于ELM改進(jìn)K-SVD算法的多特征融合物體成像識別

智能計算 202308 K-SVD算法算法改進(jìn) 圖像識別 | 2023-08-22

經(jīng)濟高效的AI系統助力語(yǔ)音與圖像識別

智能計算圖像識別語(yǔ)音識別 AI | 2025-02-25

請教一個(gè)有關(guān)數據處理的問(wèn)題，請版主及大俠指點(diǎn)，先謝謝了！

jackwang | 2006-09-17

尺寸測量中的邊緣檢測算法研究

資源下載圖像測量邊緣檢測圖像分割亞像素精度 | 2007-04-19

ARM芯片對未來(lái)3G移動(dòng)應用可能引發(fā)的大數據處理方面作了哪些方面的改進(jìn)

jackwang | 2009-11-02

智能小車(chē)圖像識別系統電路設計分析 —電路圖天天讀（198）

設計方案智能小車(chē) 圖像識別電機驅動(dòng) | 2017-04-05

專(zhuān)題綜述文獻———圖像分割

資源下載圖像分割圖像處理邊界區域 | 2007-04-19

機器視覺(jué)如何辨別「黑白」

機器視覺(jué) 圖像分割全局閾值局部閾值二值化 | 2024-08-13

基于單片機的頻率計

資源下載單片機 89C51 頻率測量數據處理 | 2007-02-16

瑞薩：領(lǐng)跑未來(lái)數據處理與實(shí)時(shí)應用新紀元

嵌入式系統 202405 瑞薩數據處理 | 2024-05-12

垂直供電助力尖端數據處理

電源與新能源 Vicor 數據處理垂直供電 | 2022-12-20

基于DSP的DVB流發(fā)射_接收系統

資源下載 DSP 數字視頻廣播流發(fā)射/接收系統誤碼率數據處理 | 2007-04-19

單片機指紋識別系統及其算法設計與實(shí)現

資源下載指紋識別 FPS200指紋傳感器 MCS-51系列單片機圖像處理圖像識別 | 2007-04-19

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>