Gartner:企業(yè)通過(guò)數據管理獲取AI價(jià)值的五大要素
DeepSeek R1的推出加快了大語(yǔ)言模型在生成式人工智能領(lǐng)域的商品化和多極化,使未來(lái)數據管理戰略的重點(diǎn)轉向了人工智能(AI)就緒度和數據主權。Gartner預測,到2028年,80%的生成式AI(GenAl)業(yè)務(wù)應用將在企業(yè)現有的數據管理平臺上開(kāi)發(fā),從而使部署的復雜度和交付時(shí)間降低50%。到2028年,50%的AI數據管理工作內容將是管理數據主權和多極化AI所帶來(lái)的偏見(jiàn),使其至少符合三個(gè)地區的法規。
圖1 企業(yè)數據-AI平臺的價(jià)值金字塔
DeepSeek將其R1模型做成開(kāi)源模型并顯著(zhù)降低了推理和訓練成本,引領(lǐng)了大語(yǔ)言型格局的變革。其實(shí)在DeepSeekR1推出之前,大語(yǔ)言模型的價(jià)格在過(guò)去兩年中就已大幅下降。
Gartner高級研究總監顧星宇表示:“這些創(chuàng )新勢必引發(fā)一波成本和能耗下降,進(jìn)一步壓低大語(yǔ)言模型價(jià)格,加速模型的商品化。這一戰略性舉措不僅使大語(yǔ)言模型更加觸手可及,而且促進(jìn)了AI技術(shù)格局的全球演變。在這種情況下,特定的大語(yǔ)言模型將不再被視為企業(yè)取得GenAl成功的關(guān)鍵差異點(diǎn)。相反,其他企業(yè)難以獲得或復制的獨特內部數據將成為AI之旅成功的唯一競爭優(yōu)勢?!?/p>
AI提供商的多極化給各企業(yè)機構帶來(lái)了數據管理挑戰,包括更復雜的數據主權和合規要求以及對影子AI和偏見(jiàn)的數據治理。企業(yè)必須積極加強數據管理戰略,以降低風(fēng)險并充分利用AI演進(jìn)動(dòng)態(tài)帶來(lái)的機遇。
模型提供商的多極化需要更加穩健和合理的數據主權和合規管理
作為一家中國公司,DeepSeek利用其特定的訓練數據,滿(mǎn)足了中國及周邊市場(chǎng)特有的語(yǔ)言、文化和監管要求。這種方法建立了一個(gè)獨特的“極點(diǎn)”,使其區別于美國流行的GPT-4和Gemini,特別是在法律、政治、文化和技術(shù)方面,其中許多與數據有關(guān)。這種多極化引起了人們對AI治理和偏見(jiàn)的擔憂(yōu),特別是在全球政治環(huán)境不確定的情況下。
Gartner研究副總裁孫鑫表示:“多極化生態(tài)系統有助于打破壟斷控制,鼓勵創(chuàng )新和韌性,但同時(shí)也需要有系統的數據管理框架,以及與數據生態(tài)系統供應商建立強有力的伙伴關(guān)系,以確保符合數據合規和數據主權的要求?!?/p>
知識源與大語(yǔ)言模型的脫鉤已變得至關(guān)重要
一些GenAl的早期采用者已開(kāi)始咨詢(xún)如何用DeepSeek R1替換現有GenAI應用中的大語(yǔ)言模型,這表明他們之前用的與大語(yǔ)言模型緊密耦合的GenAI應用正在成為沉沒(méi)成本。R1發(fā)布后不到兩周,OpenAl和Google就分別于2025年2月1日和2月5日發(fā)布了最新的大語(yǔ)言模型——o3 mini和Gemini 2.0。企業(yè)不應將任何特定大語(yǔ)言模型(包括DeepSeek R1)視為其GenAl計劃中的永久組成部分。
Gartner高級研究總監方琦表示:“數據和分析(D&A)領(lǐng)導者應該與AI領(lǐng)導者合作,采用更強健的架構,將大語(yǔ)言模型和企業(yè)內部知識源慢慢脫鉤。集中管理AI相關(guān)的數據戰略有助于減少知識孤島,從而在A(yíng)I計劃規模擴大后提高數據治理的效率?!?/p>
將無(wú)監督AI使用作為企業(yè)運營(yíng)的新常態(tài)
AI推理成本的大幅降低,減少了業(yè)務(wù)用戶(hù)與企業(yè)數據交互的障礙。圍繞DeepSeek的媒體宣傳已經(jīng)導致員工不受管理地使用DeepSeek應用(如移動(dòng)設備和聊天機器人)。AI正勢不可擋地涌向業(yè)務(wù)的每一個(gè)角落。在這種新常態(tài)下,以控制為重點(diǎn)的數據治理流程正迅速變得過(guò)時(shí),并且會(huì )阻礙員工的數據驅動(dòng)型創(chuàng )新。
數據編織領(lǐng)域的主動(dòng)元數據,特別是運行時(shí)元數據(操作元數據和社交元數據)的管理,是使數據管理團隊始終處于企業(yè)數據使用前沿的關(guān)鍵方法。Gartner高級研究總監顧星宇表示:“為了應對這些挑戰,D&A領(lǐng)導者應優(yōu)先考慮有助于跨平臺輸出和導入元數據的工具,從而支持更廣泛的協(xié)調和優(yōu)化。評估當前的數據管理能力對于支持高級元數據功能,尤其是運行時(shí)元數據共享和元數據標準,以確?;ゲ僮餍??!?/p>
擁抱云部署,獲得最佳數據-AI平臺
DeepSeek降低了推理成本,因此可以在各種基礎設施(包括本地甚至個(gè)人計算機)上進(jìn)行部署。然而,云數據生態(tài)系統提供了獨特的優(yōu)勢,包括以較低的前期成本試驗新數據管理技術(shù)的機會(huì ),以及快速適應新AI模式的能力。因此,當前總體趨勢仍然傾向于GenAI應用的云部署。
在考慮部署涉及內部數據的GenAl業(yè)務(wù)應用時(shí),企業(yè)應同時(shí)評估云部署和本地部署,以確定最適合其需求的方法。
提升數據管理團隊的數據和AI素養,充分利用推理模型
DeepSeek R1仍然會(huì )產(chǎn)生幻覺(jué),但其推理能力使人類(lèi)能夠以更透明、更高效的方式檢查其輸出內容。這意味著(zhù),在數值預測、代碼開(kāi)發(fā)、數據工程等重要業(yè)務(wù)流程中,GenAl的采用將逐漸增加,但要經(jīng)過(guò)人工審查。
D&A領(lǐng)導者應該為這一變化做好準備,提高數據管理專(zhuān)家的技能水平,使其能夠使用由推理模型賦能的AI增強功能。
評論