肯睿(Cloudera)運用靈活的跨云混合數據戰略,實(shí)現深度業(yè)務(wù)洞察
企業(yè)在管理數據和從數據中獲得洞察的過(guò)程面臨著(zhù)諸多挑戰。由于越來(lái)越多的數據被創(chuàng )建并在多個(gè)位置進(jìn)行存儲,采用靈活的混合數據戰略對于管理和編排各種不同的數據集則變得至關(guān)重要。誠然,單靠技術(shù)無(wú)法解決以下挑戰,但它是解決方案的關(guān)鍵要素,企業(yè)必須結合指導原則和政策來(lái)應對這些挑戰。
本文引用地址:http://dyxdggzs.com/article/202304/446015.htm肯睿Cloudera亞太區首席技術(shù)官Daniel Hand
挑戰1:提高創(chuàng )新力和業(yè)務(wù)敏捷性
第一項挑戰來(lái)自于如何提高創(chuàng )新力和業(yè)務(wù)敏捷性,包括如何實(shí)現數據和數據資產(chǎn)平權。這能夠幫助企業(yè)避開(kāi)數據關(guān)守(Data Gatekeeper),以便更好地利用他們所擁有的數據。
創(chuàng )新的另一個(gè)要素是幫助企業(yè)快速擴展并向新的市場(chǎng)提供數據產(chǎn)品和服務(wù)。如果需要在數據中心建立一個(gè)新的分析集群,尤其是在一個(gè)新的國家,則往往需要延長(cháng)周期。在公有云中管理數據和運行分析可以大幅加快價(jià)值變現周期,但需要應對風(fēng)險和運營(yíng)復雜性。
以近乎實(shí)時(shí)的方式獲取洞察與傳統的批量分析方法存在明顯的區別。從數據中獲得的洞察,其價(jià)值會(huì )隨著(zhù)時(shí)間的推移而減少,因此企業(yè)越來(lái)越需要通過(guò)近乎實(shí)時(shí)的流處理來(lái)增強批處理分析。
挑戰2:管理運營(yíng)風(fēng)險
第二項挑戰來(lái)自于管理運營(yíng)風(fēng)險,包括企業(yè)如何確保在每個(gè)所支持的環(huán)境中統一、可靠地實(shí)施安全政策和控制。
這方面的另一個(gè)變量因素是需要在整個(gè)數據生命周期中捕獲數據沿襲和來(lái)源。如果企業(yè)無(wú)法了解數據來(lái)源以及誰(shuí)在數據生命周期中訪(fǎng)問(wèn)并改造了數據,那么從數據中獲得的洞察價(jià)值就會(huì )降低。
隨著(zhù)所采集的數據量成倍增加,企業(yè)越來(lái)越需要對數據進(jìn)行自動(dòng)剖析、分類(lèi)和采取適當的控制手段,比如新的數據集是否包含敏感的個(gè)人身份信息(PII)數據等;此外,另一個(gè)相關(guān)的挑戰是如何高效地管理和分析高達PB量級的海量數據。
為了應對監管和治理變化,企業(yè)還可能需要在不同環(huán)境之間安全、高效地移動(dòng)數據和應用。這不僅包括將數據從云遣返到本地,還包括當平臺被監管機構認為缺乏足夠的控制手段來(lái)應對政策變化時(shí),在公有云供應商之間移動(dòng)數據。
挑戰3:管理運營(yíng)復雜性
最后一項挑戰是管理各種數據集和分析工作負載所帶來(lái)的運營(yíng)復雜性。若在每個(gè)公有云平臺和本地均采用不同的解決方案,那么不論是承擔運營(yíng)費用或是維系一支具備合適技能的團隊,都會(huì )帶來(lái)沉重負擔。這些因素綜合起來(lái)將引發(fā)并增加運營(yíng)風(fēng)險,影響敏捷性。
基于以上三項挑戰,以下是一些指導原則和政策,以幫助企業(yè)在構建強大的數據戰略時(shí)克服障礙。在考慮采用何種技術(shù)時(shí),企業(yè)應牢記:在支持混合云、多云基礎架構和處理引擎開(kāi)放生態(tài)的同時(shí)也應留有余地。這樣,在整個(gè)數據生命周期便可以部署集成分析服務(wù)集,也可以規定安全策略和控制手段,使其在任何受支持的環(huán)境中都能統一一致地執行。
理想情況下,該技術(shù)應該可以進(jìn)一步擴展,不但能夠支持當前的數據管理和分析需求,還能夠支持未來(lái)幾年可預測的需求。并且,該技術(shù)最好是專(zhuān)為云而設計,以實(shí)現計算和存儲能夠獨立擴展。
總結
支持數據編織、湖倉一體、數據網(wǎng)格等現代化數據架構的功能繼續影響著(zhù)當前提供給企業(yè)的解決方案。因此,企業(yè)可以采用一個(gè)能夠在多種環(huán)境中統一管理不同數據集的平臺,結合數據湖和數據倉庫的統一化,以及支持數據產(chǎn)品、域所有權和自助服務(wù)。Cloudera Data Platform(CDP)與其他企業(yè)數據平臺解決方案的不同之處在于,其能夠在整個(gè)數據生命周期內借助共享安全和治理結構持續實(shí)現這一點(diǎn)。對于幫助全球各大企業(yè)制定和實(shí)施靈活的數據戰略來(lái)說(shuō),這項能力是不可或缺的。
評論