圖像識別技術(shù)在內容審核領(lǐng)域的應用研究
互聯(lián)網(wǎng)內容發(fā)展與圖像識別技術(shù)
本文引用地址:http://dyxdggzs.com/article/201612/332879.htm早在2013年,全世界每天會(huì )上傳超過(guò)5億張圖片、上傳20萬(wàn)小時(shí)長(cháng)的視頻到互聯(lián)網(wǎng)。但是人們每天在Instagram分享近6000萬(wàn)張照片,在Facebook分享近3億張——當然,還沒(méi)算上Snapchat、 Google 、 Twitter等大量產(chǎn)圖的應用。據估計,一年后就可達到18億,所以在三年后的今天,這個(gè)數值必然遠超乎我們的想象。確實(shí),人們相比過(guò)去,互聯(lián)網(wǎng)的數據每年都在爆炸式增長(cháng)。IBM 的研究稱(chēng),整個(gè)人類(lèi)文明所獲得的全部數據中, 有 90%是過(guò)去兩年內產(chǎn)生的,等到了 2020 年,全世界所產(chǎn)生的數據規模將達到今天的 44 倍。
可以看得出,圖片和視頻內容已成為用戶(hù)表達、事件記錄分析中 不可或缺的部分,在多方面發(fā)揮越來(lái)越重要的價(jià)值。但隨著(zhù)互聯(lián)網(wǎng)的發(fā)展,內容安全成為互聯(lián)網(wǎng)不得不面臨的嚴峻挑戰。因此,面對互聯(lián)網(wǎng)的基礎需求——內容審核,圖像識別技術(shù)可以以此為契機,為互聯(lián)網(wǎng)圖像內容穩定高效的發(fā)展保駕護航。
圖像識別技術(shù)與人工智能
說(shuō)起圖像識別,我們知道,人的圖像識別能力是非常強大的。圖像距離的改變或圖像在感覺(jué)器官上作用位置的改變,都會(huì )造成圖像在視網(wǎng)膜上的大小和形狀的改變。即使在這種情況下,人們仍然可以認出他們過(guò)去知覺(jué)過(guò)的圖像。甚至圖像識別可以不受感覺(jué)通道的限制。例如,人眼可以看字,當別人在他手上寫(xiě)字時(shí),他也可以認出這個(gè)字。
而計算機圖像識別技術(shù)是計算機對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標和對象的技術(shù)。識別過(guò)程包括圖像預處理、圖像分割、特征提取和判斷匹配。
圖像識別技術(shù)是人工智能的一個(gè)重要領(lǐng)域。簡(jiǎn)單來(lái)說(shuō),圖像識別就是計算機如何像人一樣讀懂圖片的內容。而圖像識別所研究的問(wèn)題,是如何用計算機代替人類(lèi)去自動(dòng)處理大量的物理信息,解決人類(lèi)所無(wú)法識別或者識別過(guò)于耗費資源的問(wèn)題,從而很大程度上解放人類(lèi)的勞動(dòng)力。
圖像識別技術(shù)與內容審核技術(shù)的融合
因此,對于互聯(lián)網(wǎng)如此大量的圖像內容審核需求,圖像識別技術(shù)如何實(shí)現其中的融合與發(fā)展,從而解放大量每日做著(zhù)簡(jiǎn)單重復的工作的內容審核人員是非常值得我們期待。
傳統的圖像審核方式主要有三種:1、純人工審核:企業(yè)員工“三班倒”工作,人眼鑒別該圖片或視頻是否違規;2、建立MD5數據庫:DNA是人類(lèi)唯一的身份識別碼,而圖片、視頻的DNA無(wú)疑是MD5,網(wǎng)監建立了存儲違規圖片、視頻的MD5數據庫,用戶(hù)上傳后自動(dòng)分析MD5是否合法,則可避免涉黃內容重復分享。3、傳統的智能審核:如識別色情圖像,基本是通過(guò)圖片 RGB 值識別膚色比例、通過(guò)建模識別異常動(dòng)作、敏感部位等。
但是三個(gè)審核方式都存在較大的漏洞,“三班倒”的人工容易導致審核效率低、誤判漏判多等主觀(guān)性問(wèn)題;MD5則非常容易被篡改,在視頻中加入文字或者修改任意一幀就能實(shí)現;傳統智能識別色情圖片準確率低、經(jīng)常誤報等。而且這三種審核方式對近兩年熱門(mén)的視頻直播審核需求更難以滿(mǎn)足。
但以圖普科技為代表的互聯(lián)網(wǎng)圖像內容審核專(zhuān)家,基于人工智能與圖像識別技術(shù)領(lǐng)域最新的算法:深度學(xué)習算法,通過(guò)模擬人腦神經(jīng)網(wǎng)絡(luò ),構建具有高層次表現力的模型,能夠對高復雜度數據形成良好的解讀。通過(guò)大數據持續訓練、頻繁的迭代,圖普科技的圖像識別云平臺的內容審核產(chǎn)品的精確度達到 99.5%,有效節省超過(guò) 90%的人工復審工作。
目前,圖普科技基于圖像識別技術(shù)的主要的內容審核產(chǎn)品有:
色情識別
智能識別圖片和視頻內容,并對色情程度進(jìn)行打分,方便用戶(hù)對涉黃內容進(jìn)行快速處理,幫助用戶(hù)減少審核人力,有效降低涉黃風(fēng)險。
暴恐識別
識別ISIS、基地組織、東突等各類(lèi)國家命令禁止的暴恐圖片及視頻內容。
時(shí)政敏感內容識別
建立敏感數據庫,提供定制化的解決方案,如識別國家領(lǐng)導人、政治運動(dòng)場(chǎng)景等時(shí)政敏感性?xún)热荨?/p>
OCR
主要針對廣告內容過(guò)濾,自動(dòng)識別圖像內容是屬于正常、二維碼或者帶文字的廣告等圖片內容。
圖普科技通過(guò)圖像識別技術(shù),將圖片與樣本庫中的海量樣本圖進(jìn)行對比判斷,根據判斷返回圖片的狀態(tài),可判斷一張圖片是否為正常、色情、暴恐、廣告或其他的敏感內容等。
并且,圖普科技的圖像識別云平臺還可以幫助企業(yè)定制自己的圖像識別引擎,使用機器來(lái)代替人工對需要審核圖片和視頻進(jìn)行鑒別。就無(wú)需聘請人工智能識別的專(zhuān)家組建研發(fā)團隊,通過(guò)接入API調用識別服務(wù)即可。這在極大程度上降低了互聯(lián)網(wǎng)行業(yè)應用圖像識別服務(wù)的門(mén)檻,從而為更多互聯(lián)網(wǎng)企業(yè)使用人工智能圖像識別技術(shù)提供了更大的機會(huì )。
內容審核對于互聯(lián)網(wǎng)圖像內容發(fā)展來(lái)說(shuō)是一項艱巨而又關(guān)鍵的任務(wù),是后續的圖像內容運營(yíng)與發(fā)展的最基礎保障。圖普科技深知將要將圖像識別技術(shù)更好地融合到內容審核領(lǐng)域,實(shí)現更高的準確率,是非常值得重視的,因此,盡管在業(yè)界已經(jīng)擁有一定的知名度,圖普科技仍然深耕于內容審核與圖像識別技術(shù)領(lǐng)域,把圖像識別技術(shù)視為內容審核及互聯(lián)網(wǎng)圖像內容發(fā)展領(lǐng)域的未來(lái),在將圖像識別技術(shù)更好地應用于具體的行業(yè)需求方面,為其他的人工智能應用提供了一條有價(jià)值的參考途徑。
評論