十項標準出臺在即 大數據告別“躍進(jìn)式”發(fā)展
大數據企業(yè)如何發(fā)展,市場(chǎng)正在做出自己的選擇。
本文引用地址:http://dyxdggzs.com/article/279821.htm8月末,北京某酒店的一場(chǎng)大數據企業(yè)展上,聚集了全國各地的企業(yè)?,F場(chǎng)展示有隨著(zhù)《江南style》起舞的機器人,有早期科幻電影里走出來(lái)的“觸摸式數據可視化屏幕”……
“你們的具體業(yè)務(wù)是做什么的”、“和大數據有什么關(guān)系”……和直觀(guān)的服裝展、美食展不同,大數據行業(yè)作為當下的風(fēng)口新業(yè)態(tài),其行業(yè)標準、商業(yè)模式正在探索中,參展的大數據企業(yè)們,以各種可視化的方式,把大數據產(chǎn)業(yè)的最新成果展示給觀(guān)眾。這場(chǎng)活動(dòng)吸引了大批企業(yè)和研究人員,其中還包括自費從國外過(guò)來(lái)學(xué)習的教授。
中國的人口數量,讓其成為大數據大國,但卻不是生來(lái)的大數據強國。國內大數據市場(chǎng)正在經(jīng)歷炒作、探路和實(shí)踐期。21世紀經(jīng)濟報道記者采訪(fǎng)發(fā)現,今年的大數據行業(yè)聚會(huì ),探討的內容已經(jīng)從2014年的數據是什么,發(fā)展到大數據產(chǎn)業(yè)的商業(yè)模式怎么做。
從業(yè)務(wù)定位到市場(chǎng)開(kāi)發(fā),從產(chǎn)品生產(chǎn)到服務(wù)提供,大數據企業(yè)的發(fā)展還處于初始階段。在大數據生態(tài)圈里,看上去很美的商業(yè)價(jià)值,已經(jīng)吸引了一批創(chuàng )業(yè)者,將之視作彎道超車(chē)BAT的最大機遇;也有傳統企業(yè)和行業(yè)巨頭借勢圈地擴張,寄望完成轉型和整合。
有學(xué)界和業(yè)界人士預測,大數據已經(jīng)從概念炒作走向了穩步發(fā)展時(shí)期。另外,8月份出臺的促進(jìn)大數據產(chǎn)業(yè)發(fā)展行動(dòng)綱要,系列鼓勵和規范政策正在密集出臺中。在大數據這個(gè)具體政策和標準近乎空白,正在野蠻生長(cháng)的大數據產(chǎn)業(yè)生態(tài)鏈中,21世紀經(jīng)濟報道記者通過(guò)采訪(fǎng)大數據產(chǎn)業(yè)生態(tài)鏈上的各類(lèi)企業(yè),摸底大數據產(chǎn)業(yè)的商業(yè)化落地進(jìn)程。
應用行業(yè)參差不齊
“掃碼送牛奶”、“掃碼送雨傘”……進(jìn)入2015年,從中關(guān)村地鐵站出來(lái),簇擁圍住你的人群,不再給你發(fā)傳單,而是各類(lèi)APP掃碼推廣。APP推廣的大量聚集,讓這里被戲稱(chēng)做“掃碼一條街”。
在大數據被各方合力推上風(fēng)口的當下,這些APP推廣工作人員會(huì )介紹,這款應用是基于某領(lǐng)域海量數據庫的處理和分析的產(chǎn)品。在很多新上線(xiàn)APP的宣傳里,“數據為王”,“企業(yè)對大數據的態(tài)度決定未來(lái)的高度”,類(lèi)似的說(shuō)法越發(fā)常見(jiàn)。
事實(shí)上,這些企業(yè)是不是純粹的大數據企業(yè)尚有爭議。一部分人認為,嚴格意義上來(lái)說(shuō)他們只是通過(guò)互聯(lián)網(wǎng)+的方式應用大數據,是大數據生態(tài)鏈上最終的消費者,是大數據得以應用的主要場(chǎng)景,而不是純粹的大數據從業(yè)企業(yè)。
拋開(kāi)爭論,這些大數據應用企業(yè),對大數據產(chǎn)業(yè)發(fā)展的重要性毋庸置疑?!捌髽I(yè)對數據的應用,是大數據行業(yè)發(fā)展的引擎”,有專(zhuān)家表示。
21世紀經(jīng)濟報道記者發(fā)現,在每一次關(guān)于大數據相關(guān)的活動(dòng)中,大數據的商業(yè)應用,是最受關(guān)注的板塊。在8月26日的中國國際大數據大會(huì )開(kāi)幕論壇上,關(guān)于大數據的商業(yè)應用,學(xué)界和業(yè)界即產(chǎn)生了兩種完全對立的觀(guān)點(diǎn)。
北京大學(xué)鄂維南院士提到:“現在的數據分析公司是風(fēng)起云涌,我把它說(shuō)成是小鍋爐戰場(chǎng),想當年大煉鋼鐵的時(shí)候,就是自己在家里就建了鍋爐就煉?!倍蹙S南稱(chēng),現在的確什么人都可以做,沒(méi)有什么技術(shù)含量。
鄂維南還提到,數據交易存在經(jīng)濟學(xué)上的悖論,數據服務(wù)作為一個(gè)業(yè)務(wù)模式,它的商業(yè)模式現在沒(méi)有真正被認可,數據通過(guò)什么方式賺錢(qián),前景不是那么清楚。
晶贊科技董事長(cháng)湯奇峰在中國國際大數據大會(huì )上發(fā)言稱(chēng),大數據交易并不存在經(jīng)濟學(xué)上的悖論。我國企業(yè)對大數據應用的現狀基本都是初期的狀態(tài)。應用的主要形式還是,基于大數據得到的商業(yè)洞悉,業(yè)務(wù)推薦和智能獲客等三個(gè)領(lǐng)域。其中的典型就是個(gè)性化推薦和智能廣告。
湯其峰在接受21世紀經(jīng)濟報道記者采訪(fǎng)時(shí)表示,大數據的商業(yè)模式體現在很多方面,大數據價(jià)值在交易和流通的過(guò)程中體現,并且會(huì )發(fā)生聚變效應,實(shí)現邊際效應遞增。
21世紀經(jīng)濟報道記者了解到,目前國內對于大數據應用,發(fā)展較好的還是以大企業(yè)為主,比如BAT、滴滴快的、Uber等互聯(lián)網(wǎng)企業(yè)。不管是對外數據源采集,還是企業(yè)內部的數據資產(chǎn)管理,其互聯(lián)網(wǎng)企業(yè)基因,以及自身的資本優(yōu)勢,使得他們在大數據的應用上同樣處于領(lǐng)先的態(tài)勢。
同時(shí),由于這些擁有大量數據資源的企業(yè),在分析挖掘數據形成應用的同時(shí),放棄直接依靠出售數據獲利,而選擇對外提供數據服務(wù)和分析結果,為應用類(lèi)企業(yè)的決策和東西提供了便利條件。這也是應用類(lèi)的數據企業(yè)或產(chǎn)品數量較大,占到了行業(yè)總數的三分之一的重要原因。
而對于部分中小企業(yè)而言,資金缺乏和技術(shù)難題導致數據獲取難,缺乏數據資產(chǎn)管理意識,其對大數據的使用,仍在探路中。
另外,我國的大數據應用領(lǐng)域分布仍然不夠全面,相關(guān)企業(yè)主要集中在互聯(lián)網(wǎng)、市場(chǎng)營(yíng)銷(xiāo)、電信、金融領(lǐng)域,而政府公共服務(wù)、農業(yè)類(lèi)應用,發(fā)展還在原始階段,近期個(gè)別企業(yè)還不時(shí)爆出數據造假的傳聞。同時(shí),數據應用的方式單一,思路狹窄,一些企業(yè)盲目學(xué)習國外的數據應用模式,也是大數據應用企業(yè)發(fā)展的一大短板。
搶占數據分析高地
如果說(shuō)大數據的應用,是大數據產(chǎn)業(yè)的商業(yè)價(jià)值終端,那么大數據行業(yè)公認的大數據分析,將會(huì )是大數據產(chǎn)業(yè)的核心,是大數據能夠點(diǎn)石成金的關(guān)鍵。
這樣的判斷是基于大數據的特性。數據本身不產(chǎn)生價(jià)值,當數據經(jīng)過(guò)挖掘、歸類(lèi)和分析,能夠給企業(yè)決策提供幫助之后,才具有價(jià)值。
數據堂公司今年發(fā)布了一份《大數據產(chǎn)業(yè)調研及分析報告》,其中將大數據分析工作歸類(lèi)為商業(yè)分析、語(yǔ)音識別、圖像分析、實(shí)時(shí)處理、空間分析、基因分析、用戶(hù)分析、日志分析,和數據可視化等九個(gè)種類(lèi)。目前,國內在各個(gè)領(lǐng)域都已出現了一批相關(guān)大數據企業(yè)。
與上述橫向劃分不同,另一些看法則偏向將大數據分析按商業(yè)價(jià)值的高低進(jìn)行區分。前LinkedIn商業(yè)分析部總監,GrowingIO的創(chuàng )始人張溪夢(mèng)介紹說(shuō),在數據分析發(fā)展更早的美國,數據分析區塊已經(jīng)按商業(yè)價(jià)值從低到高地細分為數據采集、大數據架構、響應性分析,診斷性分析、戰略性分析、預測性分析和全自動(dòng)分析。而一旦做到數據分析全自動(dòng)化,將會(huì )利用10%的時(shí)間,創(chuàng )造出這個(gè)行業(yè)90%的價(jià)值。
在美國數據分析領(lǐng)域工作十余年的張溪夢(mèng)認為,“數據分析前端過(guò)程復雜,分析昂貴,導致在過(guò)去若干年里,數據科學(xué)家90%的時(shí)間和工作都是進(jìn)行數據清洗、整理、傳輸和存儲,但真正產(chǎn)生價(jià)值的是剩下的10%。我們必須要利用各種先進(jìn)技術(shù),把金字塔底部做得非常狹窄,把以往很緩慢的流程縮短甚至透明化?!?/p>
21世紀經(jīng)濟報道記者獲悉,目前國內的數據分析產(chǎn)品,在與國外產(chǎn)品的競爭中仍處劣勢。以日志搜索系統為例,雖然國內已有自主研發(fā)的日志實(shí)時(shí)搜索分析引擎面世,但市場(chǎng)使用的主流還是HADOOP、STORM和SPARK等國外開(kāi)放計算框架下的產(chǎn)品,有部分互聯(lián)網(wǎng)和金融企業(yè)則選擇了SPLUNK等第三代日志搜索軟件包,這同樣也是美國開(kāi)發(fā)的大數據工具。
然而國內企業(yè)并非毫無(wú)競爭力,日志搜索分析引擎“日志易”的創(chuàng )始人兼CEO陳軍介紹,這些國外數據搜索處理系統價(jià)格非常昂貴,同時(shí)由于之前的“棱鏡門(mén)”事件,國外系統的軟件后門(mén)也令一些國內的企業(yè)尤其是金融企業(yè)擔憂(yōu)。
人才短缺是限制國內大數據分析企業(yè)發(fā)展的另一大主因?!豆鹕虡I(yè)評論》曾將數據分析師稱(chēng)為“21世紀最性感的職業(yè)”,當下也是稀缺和搶手的職業(yè)。鄂維南院士介紹,我國大數據發(fā)展最大的優(yōu)勢是龐大的市場(chǎng),最大的劣勢是缺乏人才,“我們國家目前沒(méi)有建立起非常好的培養大數據人才的機制,在大數據涉及的統計、機械學(xué)習等這些領(lǐng)域相比而言更加弱勢?!?/p>
滴滴快的CEO程維在講述如何到硅谷挖人時(shí)提到,人才是最大的瓶頸,中國沒(méi)有那么多的大數據和機器算法的科學(xué)家,后來(lái)發(fā)現硅谷一線(xiàn)的互聯(lián)網(wǎng)企業(yè),像Uber、Facebook里面20%的工程師是華人?!拔覀兣闪薈TO和一個(gè)代表團在硅谷把他們請到一起交流?!背叹S說(shuō)。
鄂維南認為,大數據分析人才的缺乏,當下數據人才市場(chǎng),不僅有國內和國外的競爭,學(xué)術(shù)界與企業(yè)界也在競爭。要想彌補人才短缺,在大數據領(lǐng)域取得領(lǐng)先地位,需要建立一個(gè)開(kāi)放的,既可以做科研也可以產(chǎn)業(yè)化做市場(chǎng)的國際標準的研究平臺,或是解決之道。
數據平臺期待全覆蓋
相對大數據分析企業(yè)的專(zhuān)業(yè)和專(zhuān)一定位,產(chǎn)業(yè)覆蓋面廣的大數據平臺類(lèi)企業(yè),則是在國際大數據大會(huì )的企業(yè)展廳中,占比最高的行業(yè)類(lèi)型。
一位參展的大數據平臺商人告訴記者,“大數據平臺會(huì )是大數據行業(yè)的基石和中堅?!睋私?,阿里,百度,華為等企業(yè)都早已布局大數據平臺,阿里云更是從2010年就對外開(kāi)放了其在云計算領(lǐng)域的技術(shù)服務(wù)。
然而,大數據平臺的準確定義至今仍未有定論。廣州工業(yè)大學(xué)大數據戰略研究院副院長(cháng)謝衛紅告訴記者,與數據分析、數據應用不同,大數據平臺是隨著(zhù)大數據產(chǎn)業(yè)興起而誕生的新興事物,目前還沒(méi)有官方定義。大數據平臺的數據規模和具體功用,都還有待界定。
21世紀經(jīng)濟報道記者采訪(fǎng)發(fā)現,當下市面上所謂的平臺主要有兩類(lèi),一類(lèi)是通過(guò)各種渠道搜集、整理數據,并為數據應用企業(yè)提供有償數據的數據交易類(lèi)平臺;一類(lèi)是為了處理企業(yè)內部生產(chǎn)運營(yíng)中產(chǎn)生的海量數據,以存儲、運算、展現這些數據為目的的數據處理類(lèi)平臺,其工作內容包括了數據的輸入、導入、分析以及加工。
在整個(gè)大數據生態(tài)中,大數據平臺處于行業(yè)中上游位置,是進(jìn)行數據分析和應用的基礎。其中,大數據交易平臺由于數據權屬和交易規則尚未制定的緣故,發(fā)展相對滯后,基本都是2014年后開(kāi)始投入運營(yíng);大數據處理平臺則開(kāi)發(fā)較早,商業(yè)化程度相對較高。
目前,大數據處理平臺的服務(wù)對象以企業(yè)為主。除了一些中小型的創(chuàng )業(yè)公司,一些大公司也相繼推出自己的相關(guān)業(yè)務(wù),如華為的FusionInsight,和海爾的SCRM(社交化客戶(hù)關(guān)系管理)平臺。
其中,大多數平臺主要解決企業(yè)特別是大企業(yè)內部的數據孤島問(wèn)題,將CRM(客戶(hù)關(guān)系管理)、ERP(企業(yè)資源計劃)、OA(辦公自動(dòng)系統)等業(yè)務(wù)系統打通,實(shí)現跨行業(yè)、跨部門(mén)的數據分析與整合,以協(xié)助企業(yè)的運營(yíng)、管理和決策。
在這部分數據處理平臺中,包括依靠技術(shù)模塊的變化,提供不同行業(yè)平臺服務(wù)的平臺,和針對專(zhuān)門(mén)行業(yè)的平臺;后者數量較少,在交通、建筑和媒體行業(yè)都有較為典型的專(zhuān)業(yè)化平臺出現。
此外,數據處理平臺中還有一類(lèi)針對特定業(yè)務(wù)系統的大數據平臺,比如海爾的SCRM,就是專(zhuān)門(mén)的社交化客戶(hù)關(guān)系管理的數據平臺。
由于大數據平臺在大數據產(chǎn)業(yè)中的基礎性地位,國內的大數據處理平臺企業(yè)數量相對較多。對其業(yè)務(wù)性能和服務(wù)的評價(jià)體系也相應較為完整。
大數據處理平臺供應商,九章云極的CEO方磊稱(chēng),數據集成能力、存儲和計算能力、分析能力、部署能力、運維能力、開(kāi)發(fā)定制能力,和管理協(xié)調能力等七大方面的能力,會(huì )是廠(chǎng)商在挑選平臺服務(wù)時(shí)的主要尺度和標準。其中前六者形成數據資源挖掘和計算能力閉環(huán),管理協(xié)調能力則影響著(zhù)平臺的工作效率。
然而需求方的要求似乎并沒(méi)有得到滿(mǎn)足。方磊向21世紀經(jīng)濟報道記者透露,在他們與平臺需求企業(yè)的對接中,“端到端”、在數據處理平臺上直接實(shí)現數據分析的要求,越來(lái)越多。需求方,往往也是數據應用企業(yè),希望平臺能夠提供一體化、一鍵式的自動(dòng)化數據服務(wù)。
在商業(yè)價(jià)值開(kāi)放較好的大數據處理平臺區塊,需求正加速推動(dòng)著(zhù)產(chǎn)品的轉型?!拔磥?lái)大數據平臺和大數據分析的融合會(huì )是一種趨勢,大數據分析企業(yè)會(huì )向下滲透到數據收集和整理,大數據平臺企業(yè)會(huì )往數據分析上發(fā)展,這種擴張是必然的?!狈嚼谡f(shuō)。
不過(guò)在當下的技術(shù)和人才條件下,大多數大數據處理平臺,還只能實(shí)現基礎性的數據分析,和簡(jiǎn)單的可視化呈現。清華大學(xué)數據科學(xué)研究院執行副院長(cháng)韓亦舜,在接受21世紀經(jīng)濟報道記者采訪(fǎng)時(shí)表示,目前一鍵式的自動(dòng)化數據服務(wù),只能在一些數據結構單一的特定領(lǐng)域實(shí)現。對于多源異構的數據,想要實(shí)現一鍵式自動(dòng)化服務(wù),還有很長(cháng)的路要走。未來(lái)的數據平臺,實(shí)現針對不同行業(yè)領(lǐng)域的垂直細分后,可能會(huì )在某些行業(yè)率先實(shí)現突破。
十項大數據標準制定中
在業(yè)界構想中的完整大數據生態(tài)鏈里,不同人的分類(lèi)不同,大數據企業(yè)的類(lèi)型也很多。其中必須要提的,就是大數據產(chǎn)業(yè)最基礎的工作——數據源。一些數據源企業(yè)和數據存儲系統企業(yè),都已在市場(chǎng)上占據了一席之地。
目前,由于數據流通尚未形成規模,國內數據源區塊中的平臺比例較為明顯。作為當下僅有的幾家號稱(chēng)專(zhuān)門(mén)從事數據源業(yè)務(wù)的公司之一,數據堂搜集線(xiàn)下數據,開(kāi)展線(xiàn)上業(yè)務(wù)的市場(chǎng)定位和數據眾包、采集加工流通三位一體的“數據銀行”的業(yè)務(wù)模式較有代表性。
然而,由于行業(yè)規則和行業(yè)標準缺失、數據的權屬不明,當下大量的數據交易是不規范且有爭議的。國務(wù)院發(fā)展研究中心技術(shù)經(jīng)濟部副部長(cháng)田杰棠稱(chēng),數據交易的前提是產(chǎn)權要清晰,尤其是個(gè)人在線(xiàn)活動(dòng)產(chǎn)生的數據,其產(chǎn)權到底屬于個(gè)人還是企業(yè),對于整個(gè)產(chǎn)業(yè)的發(fā)展和數據資源的配置都有很大影響。
數據源企業(yè)的發(fā)展必然伴隨著(zhù)數據交易,不規范交易、個(gè)人隱私界定模糊和數據產(chǎn)權劃分不清晰帶來(lái)的安全擔憂(yōu),是造成國內專(zhuān)門(mén)從事數據源工作的企業(yè)數量稀缺的重要原因。
與數據源區塊不同,在大數據存儲區塊,核心技術(shù)的缺失成為了最大的問(wèn)題。一家參展的廈門(mén)數據存儲系統開(kāi)發(fā)商負責人告訴記者,國內的數據儲存企業(yè)擁有自主知識產(chǎn)權的很少,特別在硬件上的技術(shù)落后國外更多。
不過(guò)這樣的情況正在好轉,韓亦舜告訴21世紀經(jīng)濟報道記者,隨著(zhù)近年來(lái)硬件開(kāi)源的興起,國內在數據存儲領(lǐng)域實(shí)現自主可控的速度有望加快。
另外,國內大數據標準化進(jìn)程也在逐步推進(jìn)中,困擾大數據行業(yè)的瓶頸或將迎來(lái)部分解決。
據中國電子信息標準化研究院技術(shù)總監王立建介紹,國家標準委正在著(zhù)手制定首批共十項大數據標準,分別是大數據術(shù)語(yǔ)、大數據技術(shù)參考模型、數據交易平臺交易數據描述、數據交易服務(wù)平臺通用功能要求、數據能力成熟度評價(jià)模型、多媒體數據語(yǔ)義描述要求、科學(xué)數據引用、數據溯源描述模型、數據質(zhì)量評價(jià)指標和通用數據導入接口規范。
其中前四項處在征求意見(jiàn)稿狀態(tài),中間四項已完成草案,最后兩項還在草案大綱階段。另外,大數據標準體系框架也已在征求意見(jiàn)稿階段。
隨著(zhù)政策頂層設計的越發(fā)清晰和行業(yè)標準的逐漸形成,對于大數據企業(yè)的未來(lái)發(fā)展方向,各方也有了不同的判斷。
一些大數據商人認為,長(cháng)遠看單純從事數據生態(tài)某一環(huán)節的企業(yè),都存在重大轉型壓力,特別是底層的數據搜集和挖掘企業(yè),針對不同行業(yè)領(lǐng)域的大數據企業(yè)將會(huì )整合該領(lǐng)域的數據收集、儲存和分析業(yè)務(wù)。
而另一些大數據交易平臺的支持者則認為,大數據行業(yè)未來(lái)會(huì )圍繞大數據交易平臺,形成縱向細分的垂直行業(yè)生態(tài),以及橫向產(chǎn)業(yè)鏈精細化分工的網(wǎng)格狀發(fā)展態(tài)勢與布局。
來(lái)自業(yè)內的預測更為樂(lè )觀(guān)。阿里研究院數據經(jīng)濟研究中心秘書(shū)長(cháng)潘永花表示,根據2014年的Gartner新興技術(shù)曲線(xiàn)顯示,大數據已經(jīng)從炒作高峰,進(jìn)入5到10年的穩步發(fā)展期,2015年大數據已經(jīng)成為主流技術(shù)。
評論