揭秘阿里打假AI大腦:數據總量186個(gè)國家圖書(shū)館,1 AI=50000人類(lèi),獲創(chuàng )新大獎
本文經(jīng)AI新媒體量子位(公眾號 ID: QbitAI)授權轉載,轉載請聯(lián)系出處。
本文引用地址:http://dyxdggzs.com/article/201908/403730.htm“令人震驚的是,在打假這方面,美國竟然遠遠落后!”一個(gè)月前,美國司法委員會(huì )副主席、共和黨參議員道格·柯林斯痛陳美國被假貨所困的問(wèn)題,其話(huà)言猶在耳,近日阿里打假技術(shù)又拿下國內高規格的技術(shù)大獎。
8月9日,由工信部、公安部及網(wǎng)信辦三部委指導主辦的“中國人工智能高峰論壇”在廈門(mén)召開(kāi),經(jīng)過(guò)層層評選,阿里巴巴知產(chǎn)保護科技大腦被三部委評為“人工智能創(chuàng )新之星” 。
知識產(chǎn)權保護所指,更喜聞樂(lè )見(jiàn)的叫法就是打假。而阿里的知產(chǎn)保護科技大腦是一套阿里20年間積累的海量線(xiàn)上線(xiàn)下假貨特征庫、打假經(jīng)驗聚合而成的算法技術(shù)系統,獨創(chuàng )“安全AI”大腦是核心。
這套系統24小時(shí)自動(dòng)運轉,96%的疑似侵權鏈接在發(fā)布的那一剎那就已被秒殺。在過(guò)去3年,阿里已使用這套技術(shù)協(xié)助全國31個(gè)省份、227個(gè)區縣的警方抓獲制售假嫌疑人4439人,搗毀制售假窩點(diǎn)4289個(gè)。
從美國議員點(diǎn)贊到國內技術(shù)大獎,可以說(shuō)時(shí)節已至,阿里打假正進(jìn)入爆發(fā)性收獲階段。量子位也了解到這背后的安全AI運作之力、創(chuàng )新之功,接下來(lái)為大家一一揭秘。
1 AI 大腦=5 萬(wàn)人類(lèi)
知產(chǎn)保護科技大腦,就是誠心和技術(shù)創(chuàng )新的集大成產(chǎn)品。
該“大腦”完全由阿里自主研發(fā),已經(jīng)被廣泛應用于阿里生態(tài)內外,對假貨、山寨、侵權盜版等進(jìn)行偵測和打擊。
而且作為一支上崗AI,各方面實(shí)力,不僅比人類(lèi)干得好,而且很多能力人類(lèi)干不了。
阿里方面公布了一系列驚人數據表現:
如果人工查看1張圖片的信息需要10秒鐘,那么5萬(wàn)人同時(shí)工作的效率才能勉強趕上“知產(chǎn)保護科技大腦”掃描甄別圖片的速度。淘寶天貓平臺每日新發(fā)商品量以千萬(wàn)計,如果人工巡查,138889人工作1天才能把這項工作完成。
阿里安全圖靈實(shí)驗室負責人薛暉透露,這套系統的樣本數據總量相當于186個(gè)中國國家圖書(shū)館藏量,僅累積的打假圖片樣本量就超過(guò)137億張,用0.3毫米的標準相紙打印疊加后高達4110千米,是世界最高建筑迪拜塔的4964倍,約等于464個(gè)珠穆朗瑪峰。
驚人的效果背后是阿里在安全場(chǎng)景里不斷進(jìn)化技術(shù)力量所鍛造的“安全AI”風(fēng)控體系。
安全AI如何服務(wù)知識產(chǎn)權保護?
所謂安全AI,是指安全場(chǎng)景中進(jìn)化出的AI,擁有更強、更多元化的能力;與當前通用AI的理念不同,阿里安全更注重在業(yè)務(wù)安全領(lǐng)域垂直縱深的技術(shù)積淀,開(kāi)發(fā)出適應更多安全場(chǎng)景的新一代AI,讓傳統的安全問(wèn)題找到新的AI解法。阿里在今年年初提出這一全新理念,稱(chēng)其將成為未來(lái)網(wǎng)絡(luò )安全問(wèn)題的核心解法。
據悉,阿里知產(chǎn)科技大腦的秘密在于四大智能核心引擎,涵蓋阿里上百項自主研發(fā)的安全AI技術(shù)。分而解之,涉及感知引擎、認知引擎、決策引擎和計算引擎。
實(shí)際也是通用人工智能(AGI)必不可少的四大引擎,只是阿里垂直為打假服務(wù)。
從項目申報說(shuō)明里,也能尋得宏觀(guān)架構脈絡(luò )。
感知引擎:核心技術(shù)是計算機視覺(jué)技術(shù)及語(yǔ)音識別技術(shù),是整個(gè)系統的感官系統,是對象識別的基礎,為形成后續一系列處理動(dòng)作邁出第一步。
包括,用于開(kāi)店身份認證環(huán)節的人臉識別、聲紋識別、活體檢測等生物識別技術(shù);用于開(kāi)店資質(zhì)核驗環(huán)節的證件識別、篡改檢測技術(shù);用于線(xiàn)上商品識別的商標檢測、物體檢測、光學(xué)字符識別技術(shù);用于營(yíng)銷(xiāo)環(huán)節檢測的廣告圖片分析和視頻直播監測技術(shù),以及用于原創(chuàng )作品保護的多媒體檢索和圖像水印技術(shù)等。
正是“感官系統”精準的語(yǔ)音、圖像、音頻、視頻感知能力,整個(gè)系統才能在數億復雜數據中準確識別出需要保護和防御的對象,進(jìn)行下一步處理。
認知引擎:核心技術(shù)是自然語(yǔ)言處理技術(shù)
認知引擎是系統的“翻譯官”,讓機器懂得文字的意思、人類(lèi)聲音的含義,以及人們動(dòng)作的性質(zhì),從而判斷善意惡意、危險安全。
具體包括針對海量商品結構化與非結構化數據構建的知識圖譜技術(shù);面向海外電商的多語(yǔ)言分析和機器翻譯技術(shù),針對外部反饋的評價(jià)、輿情進(jìn)行識別的語(yǔ)義分析技術(shù);以及融合多模態(tài)信息,對商品的全面認知和理解的技術(shù)。
第三,決策引擎:核心技術(shù)包括深度學(xué)習和強化學(xué)習兩塊,用來(lái)解決現實(shí)中的復雜決策問(wèn)題。
它是系統的“軍師”,決定了系統該如何動(dòng)作,如何更合理有效地作出最佳應對。例如當面臨商家實(shí)時(shí)博弈、信息內容的變異,以及黑產(chǎn)的惡意攻擊時(shí),在全局視角下做出更有利的決策。
最后還有計算引擎,包括實(shí)時(shí)指標計算系統、分布式異構計算系統、和大規模圖神經(jīng)網(wǎng)絡(luò )系統。
這是打假AI大腦的發(fā)動(dòng)機,它強大的性能保證了系統在數千并發(fā)、數十億數據面前坦然自若、精準高效。
計算引擎背后,支撐的是阿里云機器學(xué)習平臺 – PAI 3.0。
它可以實(shí)現單任務(wù)支持上千worker并發(fā)訓練,并支持5k+超大規模異構計算集群,保證全天候監控數十億商品異常情況,以及對經(jīng)營(yíng)者行為的全方位監督。
臺上一分鐘,技術(shù)20年功
值得一提的是,四大引擎架構宏觀(guān),但背后每一項技術(shù)積累,都是工程師們日夜苦功的結果。
值得一提的是,打假AI大腦是阿里安全“安全AI”落地應用場(chǎng)景之一。阿里在高風(fēng)險、強對抗的場(chǎng)景中不斷進(jìn)化AI的力量,通過(guò)小樣本學(xué)習、多模態(tài)、自監督學(xué)習等新技術(shù)的持續應用,在內容安全、新零售安全、交易安全等百余場(chǎng)景中持續應用,其凝聚著(zhù)阿里安全圖靈實(shí)驗室在A(yíng)I領(lǐng)域超過(guò)10年的技術(shù)積淀,實(shí)現水滴石穿。
從最近阿里安全圖靈實(shí)驗室在人工智能頂會(huì )的論文中,不難發(fā)現其功力所在。
這是阿里發(fā)表于ECCV Workshop 2018的論文,核心分享了其在視頻分析領(lǐng)域的技術(shù)進(jìn)展。
也是阿里從視頻中識假打假,保護原創(chuàng )的秘訣所在。
當前業(yè)內通行的視頻分析,往往先預訓練CNN網(wǎng)絡(luò )提取特征分類(lèi),其后采用循環(huán)神經(jīng)網(wǎng)絡(luò )(RNN、LSTM)進(jìn)行序列建模。
但視頻的特征序列一般較長(cháng),且含有多級結構(hierarchical data structure),即一個(gè)視頻包含幀、鏡頭、場(chǎng)景、事件等。
而且幀與幀、鏡頭與鏡頭間的關(guān)系十分復雜,不僅僅是前后幀的順序關(guān)系,通過(guò)一般的序列建模方法,RNN無(wú)法表達如此復雜的關(guān)系,建模效果較差。
因此阿里研究團隊通過(guò)深度卷積圖神經(jīng)網(wǎng)絡(luò )(DCGN)對視頻的幀、鏡頭、事件進(jìn)行多級的建模,逐漸地從幀級、鏡頭級,一直到視頻級進(jìn)行抽象,從而獲得視頻全局的表達,進(jìn)而進(jìn)行分類(lèi):
最后方法在youtube8m數據集上驗證后,效果相對其他經(jīng)典的序列建模方法,都有提升。
論文傳送門(mén):https://arxiv.org/abs/1906.00377
還有自然語(yǔ)言處理領(lǐng)域的進(jìn)展,同樣是知產(chǎn)保護科技大腦的關(guān)鍵技術(shù)。
阿里安全圖靈實(shí)驗室入選IJCAI 2019的文章,主題是面向對象的情感分析,主要目標是挖掘出評論對象,同時(shí)判斷情感表達的極性。
一般而言,很多對于商品質(zhì)量描述的蛛絲馬跡,會(huì )隱藏在用戶(hù)對商品的評論中,卻很難從商品本身中發(fā)現問(wèn)題,這也是NLP技術(shù)能夠施展拳腳的場(chǎng)景。
論文中提出的方法,通俗來(lái)說(shuō)是利用全局信息、結合上下文語(yǔ)境去識別情感對象,而不再是預測每個(gè)字對應的序列標簽。
這種方法基于詞塊方法,提出更簡(jiǎn)單高效的聯(lián)合模型,同時(shí)抽取情感表達對象以及判斷其情感極性。
具體步驟上,首先對評論語(yǔ)句中的所有候選詞塊進(jìn)行向量表示,然后提出了一種基于詞塊的注意力機制來(lái)預測詞塊對應的標簽和極性。
最后公開(kāi)數據集評測對比后,證明比現有方法表現更好。
評論