大數據是怎么知道你去過(guò)新發(fā)地的?
“經(jīng)過(guò)全市大數據分析,您可能在5月30日(含)以后去過(guò)新發(fā)地批發(fā)市場(chǎng)……”隨著(zhù)新發(fā)地市場(chǎng)新冠源頭被鎖定,近日來(lái),大數據篩查,成為不少北京市民在朋友圈中熱議的話(huà)題
本文引用地址:http://dyxdggzs.com/article/202006/414928.htm一組數據顯示,截止6月17日,在行動(dòng)軌跡一致的情況下,利用大數據分析相關(guān)風(fēng)險人群位置和路徑,北京用了短短幾天時(shí)間,就“找”出了30多萬(wàn)人進(jìn)行核酸檢測。與年初武漢疫情爆發(fā)初期大數據分析人口流動(dòng)相比,此次北京的“大數據篩查”,無(wú)疑體現了更高的技術(shù)含量,和更好的時(shí)效性,對疫情處置發(fā)揮了不可小覷的作用。
圖片顯示了5月29到6月12日到訪(fǎng)過(guò)新發(fā)地的人群,發(fā)現2430人到訪(fǎng)新發(fā)地市場(chǎng)并離開(kāi)北京,其中有91人到訪(fǎng)上海。圖表還詳細列出了這2000多人到訪(fǎng)過(guò)的其他城市,包括廊坊、保定、天津等。(圖片來(lái)自網(wǎng)絡(luò ))
精準查找
三種手段鎖定新發(fā)地接觸者
從6月15日以來(lái),不少路過(guò)或者去過(guò)新發(fā)地的北京市民,都接到了短息或者是社區電話(huà),表示通過(guò)大數據篩查,確認被調查者近期去過(guò)或者路過(guò)新發(fā)地市場(chǎng),要求如實(shí)填報信息,并盡快進(jìn)行核酸檢測。
那么,什么是“大數據篩查”?大數據又是怎樣找到新發(fā)地的路過(guò)者呢?大數據在此次疫情防控中起到了什么作用?
大數據,顧名思義其實(shí)就是海量、大量的資料,這些資料來(lái)源于隨時(shí)產(chǎn)生的數據;而大數據又分為狹義和廣義兩種;狹義的大數據包括個(gè)人私人信息、購物習慣、閱讀習慣等個(gè)人畫(huà)像;而廣義的大數據則是針對社會(huì )或者企業(yè)的,例如電商利用大數據分析顧客購物習慣,做好需求預測,提前布局好倉庫存儲等等。
顯而易見(jiàn)的是,此次新發(fā)地的“大數據篩查”,就是廣義大數據與狹義大數據的一次有機融合,也是海量存儲和快速檢索技術(shù)的一次良好利用。
盡管官方并未公布大數據篩查的具體方法,但中科曙光大數據總工程師首席科學(xué)家、存儲產(chǎn)品事業(yè)部副總經(jīng)理宋懷明博士分析認為,北京之所以能夠實(shí)現利用大數據快速排查篩選新發(fā)地到訪(fǎng)者,有三種技術(shù)路徑可以實(shí)現。
首先是基于手機移動(dòng)數據確定位置信息,也叫基源定位方法,這是最常用的方法,也是此次新發(fā)地大數據篩查當中,效率最高的手段:不過(guò)基源并不是GPS,而是通過(guò)手機基站,與GPS使用時(shí)才打開(kāi)不同,手機會(huì )自動(dòng)連接到距離最近的信號發(fā)射塔,手機的所有活動(dòng),都能通過(guò)包含基站信息的信令數據信號發(fā)射塔篩查回溯,這為追蹤使用者的位置定位及路徑追蹤,提供了真實(shí)準確的第一手數據。
其次是通過(guò)社會(huì )交往信息分析,這并不是指通過(guò)社交軟件信息判斷,而是結合已有數據,通過(guò)電話(huà)調查、摸排走訪(fǎng)等方式,最終形成相對可靠的數據信息,也可以在短時(shí)間內篩選出哪些人在新發(fā)地工作、哪些人曾經(jīng)去過(guò)新發(fā)地、他們這幾天密切接觸了什么人等等。
第三種方法是可以通過(guò)物品信息確認,此次新發(fā)地篩查過(guò)程中,除了對經(jīng)過(guò)者、密切接觸者的篩查,也排查了不少物品和貨品,在這個(gè)過(guò)程當中,通過(guò)對特定攜帶病毒物品的路徑和接觸者追蹤,同樣可以作為排查查找到新發(fā)地密切接觸者的依據之一。但宋懷明強調,這種篩查方法的數據可能并不完全,而新發(fā)地是否真的利用查物的方法尋找接觸者,目前也不能完全確定。
在官方正式回應以外,此前網(wǎng)上還流傳著(zhù)一種是說(shuō)法“支付寶和微信提供數據,鎖定35萬(wàn)人,幫助病毒篩查”但這則消息很快就被兩方進(jìn)行了官方辟謠。
對此,宋懷明認為,通過(guò)二維碼獲取交易記錄,可以確定交易用戶(hù)位置。但對于交易用戶(hù)的行動(dòng)路徑追蹤,無(wú)論是支付寶和微信都無(wú)法實(shí)現。此外,新發(fā)地作為農產(chǎn)品大宗批發(fā)市場(chǎng),還有很多其他交易方式是通過(guò)線(xiàn)上轉賬或者現金的方式進(jìn)行,因此支付寶微信數據,最多只能在大數據篩查當中起到一定的輔助作用。
技術(shù)革新
大數據助力流行病精準防控
除了篩查接觸到訪(fǎng)者,此次新發(fā)地疫情當中,大數據還起到了怎樣的作用?中國疾控中心首席專(zhuān)家吳尊友告訴北京科技報記者,在他看來(lái),此次北京新發(fā)地新冠疫情過(guò)程中,大數據至少發(fā)揮了兩方面作用:一是將早期病例精準鎖定到新發(fā)地市場(chǎng),及時(shí)發(fā)現傳染源,為疾病控制贏(yíng)得了寶貴的時(shí)間。
二是對發(fā)現疫情以后,在去過(guò)高風(fēng)險地區向外流動(dòng)的人員的了解“包括暴露于環(huán)境,和接觸的人員,和密切接觸者,在北京的分布,以及留出北京的情況,對于發(fā)現潛在感染者,阻斷傳播,起到了非常大的作用?!?/p>
實(shí)際上,不僅是北京新發(fā)地,在此次新冠肺炎疫情過(guò)程中,尤其是年初武漢疫情爆發(fā)之時(shí),大數據篩查和分析,就對于疾病防控起到了相當重要的作用。
北京此次做到了精準分級,沒(méi)有‘一刀切封城’,而以街道為單位劃分風(fēng)險等級,進(jìn)行分級管控,大數據起到了關(guān)鍵的作用
疫情爆發(fā)之后,數家科技互聯(lián)網(wǎng)公司陸續通過(guò)數據和技術(shù)能力,給全社會(huì )提供了大量數據支撐;例如百度的遷徙數據,精準計算出離開(kāi)武漢和滯留武漢的人數,為政府防控提供了決策參考;再比如12306票務(wù)平臺,利用實(shí)名制售票的大數據優(yōu)勢,及時(shí)配合地方政府及各級防控機構,第一時(shí)間提供了確診病人車(chē)上密切接觸者信息。
此外,利用大數據技術(shù)實(shí)現信息共享、快速查詢(xún),很多媒體平臺和互聯(lián)網(wǎng)平臺紛紛開(kāi)辟了新冠肺炎動(dòng)態(tài)更新、疫情展示和辟謠功能,使用者在魚(yú)龍混雜的信息當中回歸理性,讓權威信息“跑”在謠言前面,及時(shí)安撫了公眾情緒,從另一個(gè)層面“抑制”了病毒蔓延。
在預防層面,針對人員聚集可以進(jìn)行預警;在擴散源頭方面,把數學(xué)模型和人員社交特征結合,可以很好分析擴散路徑與速度,制定更有針對性的對策與措施“北京此次做到了精準分級,沒(méi)有‘一刀切封城’,而以街道為單位劃分風(fēng)險等級,進(jìn)行分級管控?!彼螒衙髡J為,這都是大數據起到了重要的作用。
與國內相比,在大數據預測分析流行病方面,國外已經(jīng)有了比較成熟的探索和實(shí)踐,早在2008年,谷歌便發(fā)布了“Google Flu Trends”(谷歌流感趨勢),利用關(guān)鍵詞追蹤技術(shù)搜集數據,如果在某一地區的某一時(shí)間段內,有大量關(guān)于流感、發(fā)熱、感冒等關(guān)鍵詞的搜索,就表明此地存在潛在的感染人群,需要引起相關(guān)部門(mén)的重視。
谷歌曾經(jīng)開(kāi)發(fā)了軟件,利用大數據分析流感趨勢,但最終以失敗告終(圖片來(lái)自網(wǎng)絡(luò ))
2009年,墨西哥爆發(fā)的豬流感,研究人員也曾利用通信數據監測,從而獲取公眾對于政府發(fā)布的健康預警信息的反應,以指導有關(guān)部門(mén)更好調整政策;2014年埃博拉疫情在西非爆發(fā),研究人員同樣基于手機通信數據建模,對傳染病的流行進(jìn)行了判斷與分析。
不難發(fā)現,有了大數據+人工智能加持的公共衛生領(lǐng)域:一方面在行動(dòng)效率上更高更快,有效減緩了傳染病的傳播與擴散;另一方面,同樣可以起到,提供預測與分析的重要作用。
未雨綢繆
大數據應用如何“更高、更快、更強”?
新冠疫情情暴發(fā)后,大數據在疫情排查等方面得到迅速應用,國內各領(lǐng)域、行業(yè)、機構、部門(mén)紛紛利用大數據技術(shù),加強互聯(lián)互通,加速了整個(gè)社會(huì )力量的整合,對疫情處置發(fā)揮了不可小覷的作用。
但大數據應用并非完美體,隨著(zhù)疫情應對的深入,它也暴露出了不少短板,和仍需提高完善的之處。
首先是準確性問(wèn)題,從目前的技術(shù)水平來(lái)看,大部分城市的大數據應用,聚焦在城市日常生活管理場(chǎng)景、基礎保障場(chǎng)景,例如在金融領(lǐng)域、安防領(lǐng)域、交通規劃領(lǐng)域等等;但在疫情期間,需要尋求解決方案的“突發(fā)公共衛生事件場(chǎng)景”,不可控的因素較多,很容易讓一些常規算法暴露短板,甚至出現數據不準確的問(wèn)題。
例如此次新發(fā)地防疫過(guò)程當中,由于大數據信息無(wú)法準確分辨“去過(guò)”和“路過(guò)”新發(fā)地市場(chǎng)的區別,加上可操作時(shí)間較短,最終出現了“一刀切”的情況,有些乘坐公共交通工具途徑新發(fā)地的市民,也收到了要求進(jìn)行核酸檢測的短信或通知,讓人頗感意外。
對此吳尊友認為,大數據篩查過(guò)程當中,由于時(shí)間較短,精力有限,的確存在一些錯誤判斷的情況,有些沒(méi)有危險暴露的市民,也被要求填寫(xiě)信息檢測核酸“但數量只是一小部分,目前首要任務(wù)還是控制疫情,未來(lái)還有改進(jìn)提高的空間?!?/p>
宋懷明也認為,除了發(fā)短信以外,排篩查的手段也包括打電話(huà)、上門(mén)走訪(fǎng)和自我填報等等,目的就是為了最大程度減少在突發(fā)公衛事件當中,大數據應用的不準確性和不確定因素。
其次是大數據決策問(wèn)題,宋懷明表示,從實(shí)際效果來(lái)看,大數據目前的作用,更多地依然停留在分析和輔助決策方面,只有很少一部分能夠進(jìn)行自動(dòng)決策“從數據角度來(lái)看,這樣的做法是更科學(xué)的,但從時(shí)間和效率來(lái)看,這樣的手段依然有較大待提升提高空間?!?/p>
出于防控需要,很多人的個(gè)人信息被“暴露”在A(yíng)PP、小程序或是登記單、記錄本當中,哪些是合理采集,哪些又屬于過(guò)度采集,如果個(gè)人信息泄露了怎么辦?目前依然有待商榷(圖片來(lái)自網(wǎng)絡(luò ))
在數據立法、數據安全方面,相關(guān)法律法規也不夠健全:記者了解到,國家層面目前還沒(méi)有出臺針對公共數據管理的法律法規,省市層面也基本處于各自為戰的局面,一些地方出臺了法律條例,一些地方僅僅出臺了規章辦法,還有一些地方并未就此立法。
這在無(wú)形中給數據安全和個(gè)人隱私性,帶來(lái)了不確定因素——疫情期間,多地出現了個(gè)人隱私泄露事件,引發(fā)了公眾的擔憂(yōu);出于防控需要,很多人的個(gè)人信息被“暴露”在A(yíng)PP、小程序或是登記單、記錄本當中,哪些是合理采集,哪些又屬于過(guò)度采集,如果個(gè)人信息泄露了怎么辦?目前依然有待商榷,
實(shí)際上,加強信息共享,消除信息孤島,同時(shí)做好個(gè)人隱私和數據安全的保護,不僅對當下抗擊疫情至關(guān)重要,對實(shí)現政府決策科學(xué)化、社會(huì )治理精準化、公共服務(wù)高效化也有巨大的推動(dòng)作用。
“未來(lái)要著(zhù)力規范數據的所有權、使用權和使用規范,要保護好公眾的隱私和數據安全?!彼螒衙鲝娬{,有關(guān)部門(mén)既要把握好公眾知情權,與保護公眾隱私之間的關(guān)系“也要盡可能的把公眾關(guān)心的數據全面、及時(shí)、準確地發(fā)布出來(lái),并充分調動(dòng)社會(huì )力量積極參與,形成大數據共享的合力”。
評論