大數據戰略打造"數字中國"
中國高度重視大數據發(fā)展。我們秉持創(chuàng )新、協(xié)調、綠色、開(kāi)放、共享的發(fā)展理念,圍繞建設網(wǎng)絡(luò )強國、數字中國、智慧社會(huì ),全面實(shí)施國家大數據戰略,助力中國經(jīng)濟從高速增長(cháng)轉向高質(zhì)量發(fā)展。
當前,我國數字經(jīng)濟總量已超過(guò) 22 萬(wàn)億元,占 GDP 比重逾 30%, 中央政府對于發(fā)展大數據、人工智能等前沿科技產(chǎn)業(yè)極為重視。
大數據的定義
大數據是一個(gè)寬泛的概念,從 2001 年“大數據”一詞在 Gartner 的研究報告出現至今,大數據一直沒(méi)有統一的定義。
Gartner 認為大數據是需要新處理模式才能具有更強的決策力、洞察發(fā)現力和流程優(yōu)化能力的海量、高增長(cháng)率和多樣化的信息資產(chǎn)。
麥肯錫全球研究所給出的定義是:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類(lèi)型和價(jià)值密度低四大特征。
國際數據公司(IDC)從大數據的 4 個(gè)特征來(lái)定義,即海量的數據規模(Volume)、快速的數據流轉和動(dòng)態(tài)的數據體系(Velocity)、多樣的數據類(lèi)型(Variety)、巨大的數據價(jià)值(Value)。
維基百科對“大數據”的定義是“無(wú)法在可承受的時(shí)間范圍內用常規軟件工具進(jìn)行捕捉、管理和處理的數據集合”。
無(wú)論各方對于大數據的定義有何不同,但均體現了大數據“大”的特征。但體量大、結構多樣體現更多的是數據特征,對于數據的處理與應用,則需要新技術(shù)(新型計算架構、智能算法等)、新理念與新知識。因此大數據不僅“大”,而且“新”,是新資源、新工具和新應用的綜合體。
對于大數據的處理與應用,則需要新技術(shù)(新型計算架構、智能算法等)、新理念與新知識。因此大數據不僅“大”,而且“新”,是新資源、新工具和新應用的綜合體。
大數據的四大特征
在IT界雖然對大數據都有著(zhù)自己不同的解讀。但大家都普遍認為,大數據有著(zhù)4“V”特征,即Volume(容量大)?Variety(種類(lèi)多)?Velocity(速度快)和最重要的Value(價(jià)值密度低)。
Volume是指大數據巨大的數據量與數據完整性。十幾年前,由于存儲方式?科技手段和分析成本等的限制,使得當時(shí)許多數據都無(wú)法得到記錄和保存。即使是可以保存的信號,也大多采用模擬信號保存,當其轉變?yōu)閿底中盘柕臅r(shí)候,由于信號的采樣和轉換,都不可避免存在數據的遺漏與丟失。那么現在,大數據的出現,使得信號得以以最原始的狀態(tài)保存下來(lái),數據量的大小已不是最重要的,數據的完整性才是最重要的。
Variety意味著(zhù)要在海量?種類(lèi)繁多的數據間發(fā)現其內在關(guān)聯(lián)。在互聯(lián)網(wǎng)時(shí)代,各種設備連成一個(gè)整體,個(gè)人在這個(gè)整體中既是信息的收集者也是信息的傳播者,加速了數據量的爆炸式增長(cháng)和信息多樣性。這就必然促使我們要在各種各樣的數據中發(fā)現數據信息之間的相互關(guān)聯(lián),把看似無(wú)用的信息轉變?yōu)橛行У男畔?,從而做出正確的判斷。
Velocity可以理解為更快地滿(mǎn)足實(shí)時(shí)性需求。目前,對于數據智能化和實(shí)時(shí)性的要求越來(lái)越高,比如開(kāi)車(chē)時(shí)會(huì )查看智能導航儀查詢(xún)最短路線(xiàn),吃飯時(shí)會(huì )了解其他用戶(hù)對這家餐廳的評價(jià),見(jiàn)到可口的食物會(huì )拍照發(fā)微博等諸如此類(lèi)的人與人?人與機器之間的信息交流互動(dòng),這些都不可避免帶來(lái)數據交換。而數據交換的關(guān)鍵是降低延遲,以近乎實(shí)時(shí)的方式呈獻給用戶(hù)。
大數據特征里最關(guān)鍵的一點(diǎn),就是Value。Value的意思是指大數據的價(jià)值密度低。大數據時(shí)代數據的價(jià)值就像沙子淘金,數據量越大,里面真正有價(jià)值的東西就越少?,F在的任務(wù)就是將這些ZB?PB級的數據,利用云計算?智能化開(kāi)源實(shí)現平臺等技術(shù),提取出有價(jià)值的信息,將信息轉化為知識,發(fā)現規律,最終用知識促成正確的決策和行動(dòng)。
大數據的關(guān)鍵技術(shù)
大數據作為一種新興技術(shù),目前尚未形成完善、達成共識的技術(shù)標準體系。對大數據的理解和分析,提出了大數據參考架構。
大數據參考架構總體上可以概括為“一個(gè)概念體系,二個(gè)價(jià)值鏈維度”?!耙粋€(gè)概念體系”是指它為大數據參考架構中使用的概念提供了一個(gè)構件層級分類(lèi)體系,即“角色—活動(dòng)—功能組件”,用于描述參考架構中的邏輯構件及其關(guān)系;“二個(gè)價(jià)值鏈維度”分別為“IT價(jià)值鏈”和“信息價(jià)值鏈”,其中“IT價(jià)值鏈”反映的是大數據作為一種新興的數據應用范式對IT技術(shù)產(chǎn)生的新需求所帶來(lái)的價(jià)值,“信息價(jià)值鏈”反映的是大數據作為一種數據科學(xué)方法論對數據到知識的處理過(guò)程中所實(shí)現的信息流價(jià)值。這些內涵在大數據參考模型圖中得到了體現。
大數據的關(guān)鍵技術(shù)有:
1、數據收集
大數據時(shí)代,數據的來(lái)源極其廣泛,數據有不同的類(lèi)型和格式,同時(shí)呈現爆發(fā)性增長(cháng)的態(tài)勢,這些特性對數據收集技術(shù)也提出了更高的要求。數據收集需要從不同的數據源實(shí)時(shí)的或及時(shí)的收集不同類(lèi)型的數據并發(fā)送給存儲系統或數據中間件系統進(jìn)行后續處理。數據收集一般可分為設備數據收集和Web數據爬取兩類(lèi),常常用的數據收集軟件有Splunk、Sqoop、Flume、Logstash、Kettle以及各種網(wǎng)絡(luò )爬蟲(chóng),如Heritrix、Nutch等。
2、數據預處理
數據的質(zhì)量對數據的價(jià)值大小有直接影響,低質(zhì)量數據將導致低質(zhì)量的分析和挖掘結果。廣義的數據質(zhì)量涉及許多因素,如數據的準確性、完整性、一致性、時(shí)效性、可信性與可解釋性等。
大數據系統中的數據通常具有一個(gè)或多個(gè)數據源,這些數據源可以包括同構/異構的(大)數據庫、文件系統、服務(wù)接口等。這些數據源中的數據來(lái)源現實(shí)世界,容易受到噪聲數據、數據值缺失與數據沖突等的影響。此外數據處理、分析、可視化過(guò)程中的算法與實(shí)現技術(shù)復雜多樣,往往需要對數據的組織、數據的表達形式、數據的位置等進(jìn)行一些前置處理。
數據預處理形式上包括數據清理、數據集成、數據歸約與數據轉換等階段。
3、數據存儲
分布式存儲與訪(fǎng)問(wèn)是大數據存儲的關(guān)鍵技術(shù),它具有經(jīng)濟、高效、容錯好等特點(diǎn)。分布式存儲技術(shù)與數據存儲介質(zhì)的類(lèi)型和數據的組織管理形式直接相關(guān)。目前的主要數據存儲介質(zhì)類(lèi)型包括內存、磁盤(pán)、磁帶等;主要數據組織管理形式包括按行組織、按列組織、按鍵值組織和按關(guān)系組織;主要數據組織管理層次包括按塊級組織、文件級組織以及數據庫級組織等。
不同的存儲介質(zhì)和組織管理形式對應于不同的大數據特征和應用特點(diǎn)。
4、數據處理
分布式數據處理技術(shù)一方面與分布式存儲形式直接相關(guān),另一方面也與業(yè)務(wù)數據的溫度類(lèi)型(冷數據、熱數據)相關(guān)。目前主要的數據處理計算模型包括MapReduce計算模型、DAG計算模型、BSP計算模型等。
(1)MapReduce分布式計算框架
MapReduce是一個(gè)高性能的批處理分布式計算框架,用于對海量數據進(jìn)行并行分析和處理。與傳統數據倉庫和分析技術(shù)相比,MapReduce 適合處理各種類(lèi)型的數據,包括結構化、半結構化和非結構化數據,并且可以處理數據量為T(mén)B 和 PB 級別的超大規模數據。
(2)分布式內存計算系統
使用分布式共享內存進(jìn)行計算可以有效的減少數據讀寫(xiě)和移動(dòng)的開(kāi)銷(xiāo),極大的提高數據處理的性能。支持基于內存的數據計算,兼容多種分布式計算框架的通用計算平臺是大數據領(lǐng)域所必需的重要關(guān)鍵技術(shù)。
(3)分布式流計算系統
在大數據時(shí)代,數據的增長(cháng)速度超過(guò)了存儲容量的增長(cháng),在不遠的將來(lái),人們將無(wú)法存儲所有的數據,同時(shí),數據的價(jià)值會(huì )隨著(zhù)時(shí)間的流逝而不斷減少,此外,很多數據涉及用戶(hù)的隱私無(wú)法進(jìn)行存儲。對數據流進(jìn)行實(shí)時(shí)處理的技術(shù)獲得了人們越來(lái)越多的關(guān)注。
5、數據分析
大數據分析技術(shù)包括已有數據信息的分布式統計分析技術(shù),以及未知數據信息的分布式挖掘和深度學(xué)習技術(shù)。分布式統計分析技術(shù)基本都可藉由數據處理技術(shù)直接完成,分布式挖掘和深度學(xué)習技術(shù)則可以進(jìn)一步細分為:
(1)聚類(lèi)
聚類(lèi)指將物理或抽象對象的集合分組成為由類(lèi)似的對象組成的多個(gè)類(lèi)的過(guò)程。
(2)分類(lèi)
分類(lèi)是指在一定的有監督的學(xué)習前提下,將物體或抽象對象的集合分成多個(gè)類(lèi)的過(guò)程。也可以認為,分類(lèi)是一種基于訓練樣本數據(這些數據已經(jīng)被預先貼上了標簽)區分另外的樣本數據標簽的過(guò)程,即另外的樣本數據應該如何貼標簽。
(3)關(guān)聯(lián)分析
關(guān)聯(lián)分析是一種簡(jiǎn)單、實(shí)用的分析技術(shù),就是發(fā)現存在于大量數據集中的關(guān)聯(lián)性或相關(guān)性,從而描述了一個(gè)事物中某些屬性同時(shí)出現的規律和模式。關(guān)聯(lián)分析在數據挖掘領(lǐng)域也稱(chēng)為關(guān)聯(lián)規則挖掘。
(4)深度學(xué)習
深度學(xué)習是機器學(xué)習研究中的一個(gè)新的領(lǐng)域,其動(dòng)機在于建立、模擬人腦進(jìn)行分析學(xué)習的神經(jīng)網(wǎng)絡(luò ),它模仿人腦的機制來(lái)解釋數據,例如圖像,聲音和文本。深度學(xué)習的實(shí)質(zhì),是通過(guò)構建具有很多隱層的機器學(xué)習模型和海量的訓練數據,來(lái)學(xué)習更有用的特征,從而最終提升分類(lèi)或預測的準確性。
6、數據可視化
數據可視化(Data Visualization)運用計算機圖形學(xué)和圖像處理技術(shù),將數據換為圖形或圖像在屏幕上顯示出來(lái),并進(jìn)行交互處理。它涉及到計算機圖形學(xué)、圖像處理、計算機輔助設計、計算機視覺(jué)及人機交互等多個(gè)技術(shù)領(lǐng)域。數據可視化概念首先來(lái)自科學(xué)計算可視化(Visualization in Scientific Computing),科學(xué)家們不僅需要通過(guò)圖形圖像來(lái)分析由計算機算出的數據,而且需要了解在計算過(guò)程中數據的變化。
大數據產(chǎn)業(yè)鏈
大數據產(chǎn)業(yè)鏈包括一切與大數據產(chǎn)生與聚集(數據源)、組織與管理(儲存)、分析與發(fā)現(技術(shù))、交易、應用與衍生產(chǎn)業(yè)相關(guān)的所有活動(dòng)。按照數據價(jià)值實(shí)現流程,貴陽(yáng)大數據交易所發(fā)布的《2016 年中國大數據交易產(chǎn)業(yè)白皮書(shū)》將大數據產(chǎn)業(yè)鏈分為六大層級:數據源、大數據硬件支撐層、大數據技術(shù)層、大數據交易層、大數據應用層與大數據衍生層,其中每一層都包含相應的 IT 硬件設施、軟件技術(shù)與信息服務(wù)等,構成了大數據產(chǎn)業(yè)鏈的完整閉環(huán)。
數據源:
大數據產(chǎn)業(yè)基礎。數據源是大數據產(chǎn)業(yè)鏈的第一個(gè)環(huán)節,是大數據產(chǎn)業(yè)發(fā)展的基礎。由于中國大數據流通在全社會(huì )還未形成規模,目前數據源區塊主要集中在政府管理部門(mén)、互聯(lián)網(wǎng)巨頭、移動(dòng)通訊企業(yè)等手中。隨著(zhù)互聯(lián)網(wǎng)滲透不斷深入,數據產(chǎn)生方式也變得更加多樣,數據源已經(jīng)呈現出爆炸式增長(cháng),越來(lái)越多的企業(yè)將加入數據生產(chǎn)和采集行業(yè),數據源將進(jìn)一步擴大。
硬件支撐:
大數據底層支柱。大數據硬件是指數據產(chǎn)生、采集、傳輸、存儲、計算等一系列與大數據產(chǎn)業(yè)鏈相關(guān)的硬件設備。包含傳感器、移動(dòng)智能終端、各種有線(xiàn)/無(wú)線(xiàn)傳輸設備、存儲設備、服務(wù)器、網(wǎng)絡(luò )/安全設備等。在大數據需求的刺激下,越來(lái)越多的硬件產(chǎn)品都打出“智能牌”。智能硬件逐漸改變人們日常生活的同時(shí),還在用戶(hù)無(wú)觸發(fā)、無(wú)感知的情況下,24 小時(shí)不間斷采集數據。
技術(shù)層:
大數據價(jià)值實(shí)現手段。大數據技術(shù)層指實(shí)現一切大數據采集與預處理、存儲管理、大數據分析挖掘、大數據安全和大數據可視化的技術(shù)手段。大數據技術(shù)能夠將大規模數據中隱藏的信息和知識挖掘出來(lái),為社會(huì )經(jīng)濟活動(dòng)提供依據,提高各個(gè)領(lǐng)域的運行效率,甚至整個(gè)社會(huì )經(jīng)濟的集約化程度,是大數據價(jià)值實(shí)現的重要條件。
交易層:
最大化數據價(jià)值。隨著(zhù)大數據技術(shù)的成熟和發(fā)展,大數據在商業(yè)上的應用越來(lái)越廣泛,有關(guān)大數據的交互、整合、交換日益增多,大數據交易也應運而生。大數據交易可以打破信息孤島及行業(yè)信息壁壘,匯聚海量高價(jià)值數據,對接數據市場(chǎng)的多樣化需求,完善產(chǎn)業(yè)生態(tài)環(huán)境,實(shí)現數據價(jià)值的最大化,對推進(jìn)大數據產(chǎn)業(yè)創(chuàng )新發(fā)展方面具有深遠意義。目前大數據交易有交易所模式、電商模式、API 模式,大數據的價(jià)值通過(guò)數據確權、清洗、交易等形式得以釋放和體現。
應用層:
大數據價(jià)值體現。大數據的價(jià)值體現在大數據應用上。大數據產(chǎn)業(yè)的下游由大量公司組成,它們基本上扮演的角色是大數據生態(tài)圈里的數據提供者、特色服務(wù)運營(yíng)者和產(chǎn)品分銷(xiāo)商,基本通過(guò)開(kāi)放平臺和搜索引擎獲取用戶(hù),處于產(chǎn)業(yè)的邊緣地帶。目前,大數據應用在各行各業(yè)的發(fā)展呈現“階梯式”格局:互聯(lián)網(wǎng)行業(yè)是大數據應用的領(lǐng)跑者,政府、金融、電信、交通、醫療等領(lǐng)域積極嘗試大數據,其中政府、金融會(huì )在近幾年呈爆發(fā)式增長(cháng)。
衍生層:
大數據下的新業(yè)態(tài)。大數據衍生層是指基于大數據分析和應用而衍生出來(lái)的各種新業(yè)態(tài)。大數據分析和應用,在經(jīng)濟社會(huì )各領(lǐng)域的擴散滲透,不僅促進(jìn)相關(guān)產(chǎn)業(yè)生產(chǎn)率水平的提升,同時(shí)也衍生出很多與之相關(guān)聯(lián)的新興產(chǎn)業(yè),使得人類(lèi)生產(chǎn)生活、工作消費方式發(fā)生根本性轉變。
我國大數據產(chǎn)業(yè)發(fā)展現狀
1 、政策支撐大數據產(chǎn)業(yè)發(fā)展
2017 年 1 月工信部發(fā)布《大數據產(chǎn)業(yè)發(fā)展規劃(2016-2020 年)》,規劃認為我國大數據產(chǎn)業(yè)發(fā)展有五點(diǎn)現狀:
1)、信息化積累了豐富的數據資源,我國已成為產(chǎn)生和積累數據量最大、數據類(lèi)型最豐富的國家之一;
2)、大數據技術(shù)創(chuàng )新取得明顯突破,在軟硬件、平臺建設、智能分析及開(kāi)源技術(shù)方面均取得一定進(jìn)展;
3)、大數據應用推進(jìn)勢頭良好,在互聯(lián)網(wǎng)服務(wù)中得到廣泛應用,同時(shí)向傳統產(chǎn)業(yè)積極滲透;
4)、我國大數據產(chǎn)業(yè)體系初具雛形。龍頭企業(yè)引領(lǐng)下上下游企業(yè)互動(dòng)的產(chǎn)業(yè)格局初步形成,同時(shí)基于大數據的創(chuàng )新創(chuàng )業(yè)日趨活躍,大數據技術(shù)、產(chǎn)業(yè)與服務(wù)成為社會(huì )資本投入的熱點(diǎn);
5)、大數據產(chǎn)業(yè)支撐能力日益增強,形成了大數據標準化工作機制,標準體系初步形成,同時(shí)大數據安全保障體系和法律法規不斷完善。
應用為代表的下游產(chǎn)業(yè)將成為大數據主體。中國大數據應用市場(chǎng)規模重點(diǎn)集中在政府和金融等領(lǐng)域,與這幾個(gè)領(lǐng)域數據量大有關(guān)。隨著(zhù)大數據產(chǎn)業(yè)上游格局逐漸穩定,硬件設備及技術(shù)逐漸成熟,以及政府的不斷推動(dòng),大數據應用行業(yè)增速也將超過(guò)其他行業(yè)。
目前,大數據也已經(jīng)成為我國戰略方向之一。2017 年 12 月 8 日中央政治局就實(shí)施國家大數據戰略進(jìn)行了第二次集體學(xué)習,習近平在主持會(huì )議時(shí)說(shuō):“大數據發(fā)展日新月異,我們應該審時(shí)度勢、精心謀劃、超前布局、力爭主動(dòng)” 。
2、互聯(lián)網(wǎng)巨頭引領(lǐng)產(chǎn)業(yè)發(fā)展
BAT 等互聯(lián)網(wǎng)巨頭引領(lǐng)大數據產(chǎn)業(yè)。國內互聯(lián)網(wǎng)企業(yè)業(yè)務(wù)布局各個(gè)方向擁有大量用戶(hù),擁有巨量的數據,企業(yè)對這些數據進(jìn)行采集于分析,用于支撐其自身的電子商務(wù)、定向廣告和影視娛樂(lè )等傳統業(yè)務(wù),來(lái)獲取更多的經(jīng)濟效益。同時(shí),在互聯(lián)網(wǎng)產(chǎn)業(yè) O2O的趨勢下,互聯(lián)網(wǎng)企業(yè)逐漸將業(yè)務(wù)延伸到金融、保險、旅游、教育、交通服務(wù)等多個(gè)領(lǐng)域,在這一過(guò)程中又進(jìn)一步豐富了數據來(lái)源,促進(jìn)了分析技術(shù)的發(fā)展,擴展了大數據分析在諸多行業(yè)的應用。
熱門(mén)行業(yè)應用競爭較為激烈。隨著(zhù)大數據逐漸成熟,基礎設施逐漸完善,產(chǎn)業(yè)上游已經(jīng)初具規模,各種行業(yè)應用不斷落地。從需求方來(lái)看,企業(yè)對于大數據應用的需求持續增強,并著(zhù)力培育自身的數據資產(chǎn),各類(lèi)大數據應用逐漸落地,并成為產(chǎn)業(yè)鏈的核心。
從供給方來(lái)看,新興技術(shù)推動(dòng)大數據技術(shù)環(huán)境趨向成熟,行業(yè)大數據應用逐漸豐富,大數據生態(tài)系統多元化程度加強。相比于全球大數據應用于廣泛的領(lǐng)域,我國應用主要集中在政府、金融、電商、醫療健康等領(lǐng)域,競爭較為激烈。
3、工業(yè)互聯(lián)網(wǎng)下大數據價(jià)值凸顯
數據是工業(yè)互聯(lián)網(wǎng)的核心。工業(yè)互聯(lián)網(wǎng)是互聯(lián)網(wǎng)和新一代信息技術(shù)與全球工業(yè)系統深度融合集成所形成的產(chǎn)業(yè)的應用生態(tài)。工業(yè)互聯(lián)網(wǎng)的實(shí)質(zhì)首先是全面互聯(lián),在全面互聯(lián)的基礎上,通過(guò)數據流動(dòng)和分析,形成智能化變革,形成新的模式和新的業(yè)態(tài),因此工業(yè)互聯(lián)網(wǎng)比互聯(lián)網(wǎng)更強調數據,更強調充分的聯(lián)接,數據的傳輸、集成以及分析和建模,數據是工業(yè)互聯(lián)網(wǎng)的核心。
大數據應用將帶來(lái)工業(yè)企業(yè)創(chuàng )新和變革的新時(shí)代。通過(guò)互聯(lián)網(wǎng)、移動(dòng)物聯(lián)網(wǎng)等帶來(lái)的低成本感知、高速移動(dòng)連接、分布式計算和高級分析,信息技術(shù)和全球工業(yè)系統正在深入融合,給全球工業(yè)帶來(lái)深刻的變革,創(chuàng )新企業(yè)的研發(fā)、生產(chǎn)、運營(yíng)、營(yíng)銷(xiāo)和管理方式。
80 多家企業(yè)聯(lián)盟,打造工業(yè)數據生態(tài)體系。2017 年 12 月8 日包括聯(lián)想牽頭海爾、騰訊云、TCL 智能制造等 80 多家企業(yè)成立了“工業(yè)大數據產(chǎn)業(yè)應用聯(lián)盟”,旨在打造覆蓋工業(yè)企業(yè)全價(jià)值流程、全產(chǎn)業(yè)生命周期的數據生態(tài)體系。
4 、“數字中國”加碼大數據
數字經(jīng)濟已經(jīng)成為帶動(dòng)中國經(jīng)濟增長(cháng)的核心動(dòng)力。根據騰訊研究院發(fā)布的《中國互聯(lián)網(wǎng)+數字經(jīng)濟指數(2017)》數據,2016 年,中國數字經(jīng)濟總量達到 22.6 萬(wàn)億元,同比增長(cháng)超過(guò) 18.9%,顯著(zhù)高于當年 GDP 增速,占 GDP 的比重達到 30.3%,對 GDP 的貢獻已達到 69.9%。同時(shí),報告測算得出 2016 年數字經(jīng)濟對于我國新增就業(yè)的貢獻已經(jīng)超過(guò) 1/5,成為帶動(dòng)就業(yè)增長(cháng)的新引擎。
5、美國大數據發(fā)展領(lǐng)跑世界,中美仍有明顯差異
美國大數據進(jìn)入國家戰略,發(fā)展領(lǐng)跑世界。2009 年至今,Data.gov(美國政府數據庫)全面開(kāi)放了 40 萬(wàn)聯(lián)邦政府原始數據集,同時(shí)宣布采用新的“開(kāi)源政府平臺”管理數據,代碼將向各國開(kāi)發(fā)者開(kāi)放。從這個(gè)角度看,大數據已成為美國國家創(chuàng )新戰略、國家安全戰略、國家 ICT 產(chǎn)業(yè)發(fā)展戰略以及國家信息網(wǎng)絡(luò )安全戰略的核心領(lǐng)域。
根據貴陽(yáng)大數據交易所發(fā)布的《2016 年中國大數據交易產(chǎn)業(yè)白皮書(shū)》的數據,2017 年美國大數據市場(chǎng)規模為 1431 億美元,按當年人民幣對美元平均匯率 6.75 計算,2017 年美國大數據市場(chǎng)規模為中國的 2.7 倍。同時(shí),貴陽(yáng)大數據交易所預計 2020 年美國大數據市場(chǎng)規模將達到 3823 億美元,占全球市場(chǎng)份額達到 37.2%,遠遠超過(guò)排名第二的中國,發(fā)展領(lǐng)跑世界。雖然近年來(lái)中國大數據產(chǎn)業(yè)發(fā)展迅速,且日趨成熟,但與領(lǐng)跑者美國仍有三到五年的差距。
十九大結束之后,政治局第二次集體學(xué)習即“審時(shí)度勢精心謀劃超前布局力爭主動(dòng),實(shí)施國家大數據戰略加快建設數字中國”, 更突顯國家大數據戰略在國家持續發(fā)展中的核心地位!明確了大數據戰略的核心思想:大數據是信息化發(fā)展的新階段;大數據產(chǎn)業(yè)生態(tài)要自主可控;推動(dòng)實(shí)體經(jīng)濟和數字經(jīng)濟融合發(fā)展;建設全國信息共享體系和平臺;大數據要在改善民生領(lǐng)域有所作為;保障國家數據安全。
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。