AI企業(yè)下一個(gè)使命:讓生物特征數據使用走向陽(yáng)光透明
著(zhù)名神經(jīng)科學(xué)家、清華大學(xué)教授魯白認為,數據隱私、數據權屬是人工智能進(jìn)一步發(fā)展需要解決的重要課題。數據調查顯示,有接近8成的受訪(fǎng)者擔心某些領(lǐng)域的人工智能會(huì )威脅自己的隱私。
本文引用地址:http://dyxdggzs.com/article/201807/383002.htm魯白教授提到的人工智能時(shí)代的數據隱私,狹義理解指向生物特征數據,生物特征數據包括人臉信息、指紋信息、指靜脈信息、掌紋信息、聲紋信息乃至虹膜信息、以及在醫療場(chǎng)景的器官信號數據。這些生物特征數據正在被各種的傳感器收集,將每天提高我們生活的便捷性。
當我們對智能家庭音箱發(fā)出指令時(shí),它能辨識到這是我發(fā)出的指令,而不是其他人的指令,這里使用了聲紋數據;當我們出門(mén)可以不帶鑰匙,通過(guò)人臉就能夠打開(kāi)門(mén)鎖,這里使用了人臉數據;當我們出入關(guān)口,刷臉比對,秒級通關(guān),這背后也使用了人臉數據,生物特征數據正便捷我們的生活,這是不爭的事實(shí),但是關(guān)注其泄露、丟失所造成的危害的企業(yè)寥寥無(wú)幾。
去年315國際消費者權益日,央視315晚會(huì )現場(chǎng)實(shí)測,人臉識別被瞬間破解,引起了大眾的關(guān)注,一場(chǎng)關(guān)于人臉識別的攻防戰就出現了,活體檢測技術(shù)變成了各家AI公司競相追逐的技術(shù)方向。時(shí)隔一年,生物特征識別技術(shù)不斷被完善,公眾的生物特征數據仍然每天被傳感器收集匯總,但是對于生物特征數據的收集、儲存、使用和流通仍然是半遮半掩的灰色區域,各方好像都等著(zhù)導火索的出現。
生物特征數據的安全空白環(huán)環(huán)相扣
在最近的中新人工智能高峰論壇上,新加坡南洋理工大學(xué)、計算機科學(xué)與工程學(xué)院教授、智慧國家研究中心主任林國恩曾表示,新加坡在數據收集層面比中國要謹慎,數據量比中國要少,盡管新加坡有不錯的數據訓練算法框架,但是沒(méi)有優(yōu)質(zhì)的訓練數據,算法的可用性就會(huì )跟中國產(chǎn)生更大的差距,因此應該好好抓住中國的數據優(yōu)勢??梢?jiàn),生物數據的使用范圍在不斷擴大,另外,生物數據的流通和交易是否陽(yáng)光透明?在這個(gè)環(huán)節中,仍然灰色地帶。
國內不少創(chuàng )業(yè)企業(yè)并沒(méi)有算法優(yōu)勢,憑借谷歌和微軟的開(kāi)源算法,拿來(lái)主義快速優(yōu)化算法模型,或者跟國外高校建立合作,授權使用最新的算法,但是數據的合規調用,包括訓練和推理場(chǎng)景,都處于法律空白。在數據服務(wù)鏈條繼續延伸,數據可泄露的環(huán)節就更多了:比如,在數據標注層面,需求方企業(yè)將數據以文件夾形式推送給標注企業(yè),盡管簽訂了保密協(xié)議,但是大部分的標注所使用的電腦運行環(huán)境都是連網(wǎng)并且沒(méi)有規范的運行環(huán)境,黑客破網(wǎng)而入,盜取原始數據的情況是否存在就像沒(méi)有被揭露的冰山。
生物數據的重要屬性不可更改
前不久,兩則具備震撼力的新聞被不痛不癢地被收錄,包括:
新聞一:3100名谷歌員工聯(lián)名上書(shū)CEO,抵制與美國防部進(jìn)行涉軍用AI技術(shù)合作;
新聞二:韓國科學(xué)技術(shù)研究院KAIST在成立了一個(gè)研究中心,希望在今年年底前研發(fā)出基于「人工智能」的導彈、潛艇和四軸飛行器。以MichaelI.Jordan、李飛飛、周志華為代表,來(lái)自全球20多個(gè)國家、50多名高校頂尖AI學(xué)者集體簽名抵制。
這兩條新聞都不足以成為當天的頭條,大概原因有二:和平時(shí)代已經(jīng)過(guò)了很多年了,大眾對戰爭無(wú)感知;人工智能應用在武器上的危害有多致命,大眾對此缺乏明確的認識,這里面也透出AI武器的研發(fā)不可逆,一旦走上了這條路,生物信息因為不可更改,AI武器能非常精準攻擊到個(gè)體,其毀滅性正是讓人恐懼的。
生物密鑰的緣起是便利性
這一波人工智能浪潮,為了實(shí)現場(chǎng)景的便利性,我們“被”收集了不少信息,包括人臉信息、指紋信息、指靜脈信息、掌紋信息、聲紋信息乃至虹膜信息,這些都是生物信息。
相比密碼簡(jiǎn)史的前三個(gè)發(fā)展階段:古代加密方法、古典密碼和近代密碼,可以發(fā)現,密碼的形態(tài)從數字數學(xué)邏輯推理導向到圖像圖案識別導向。
另外一個(gè)不可忽視的情況是,以前的密鑰可以是單次隨機性的(U盾配合),也可以在泄露后重置密鑰。但是新型的生物特征密鑰沒(méi)有修改的可能,這導致了密鑰的泄露。使用者有兩種選擇:1、放棄更高便利性的生物密鑰、重置數字密鑰;2、等待應用安全防護系統升級。很顯然,生物密鑰的泄密后的主動(dòng)防護是很被動(dòng)的。
生物密鑰的緣起是便利性。新零售推出無(wú)人商店,無(wú)人的基礎是成熟的個(gè)人征信系統構建,在自由市場(chǎng)中,芝麻信用等第三方應用僅積累了以消費數據、常聯(lián)系人圖譜數據為基礎的個(gè)人消費信貸信用評分。數據維度越多,個(gè)人征信體系越完善。無(wú)人商店正以通過(guò)自有應用在收集消費者的人臉數據、指靜脈數據、掌紋數據等生物特征數據,以便配合完成更流暢、更便捷的消費體驗。但是大部分從事無(wú)人商店都是初創(chuàng )企業(yè),生物數據的收集后儲存在私有云或者公有云上,初創(chuàng )企業(yè)基于成本考慮,在數據安全保密體系和數據備災方面沒(méi)有充足的保障資金投入,更有甚者,創(chuàng )業(yè)失敗后,消費者生物數據信息棄置、倒賣(mài)等情況。
生物數據收集缺乏監管,法律空白
那么引出幾個(gè)問(wèn)題:1、生物特征數據本身有保密安全層次,生物特征數據是否需要建立安全等級體系?2、如何定義生物特征數據的類(lèi)型,醫療場(chǎng)景下的器官產(chǎn)生信號信息(心跳、脈搏、血壓、睡眠質(zhì)量等)是否可以納入?3、想要收集相關(guān)生物特征數據的企業(yè)是否需要申請許可證明?4、生物特征數據的儲存是否應該受政府監管?5、生物特征數據的調用、使用范圍是否需要得到使用者充分知曉?
提出這5個(gè)問(wèn)題是希望推動(dòng)政府、學(xué)術(shù)界、社會(huì )機構乃至企業(yè)自身去主動(dòng)思考生物信息的使用安全體系應該盡快建立,而推動(dòng)這個(gè)體系建立并不能等待單方努力,而應該形成合力。目前數據在征集量級仍處于初始階段,隨之更多的物聯(lián)網(wǎng)傳感器進(jìn)入生活和工作場(chǎng)景,更多的公民生物特征數據被收集,被收集的數據越多,法律保護處于空白,其產(chǎn)生的社會(huì )潛在危害越大。因此加強重視,防患于未然,應該是更積極的做法。
評論