快速了解數據倉庫及數據建模的常用新術(shù)語(yǔ)
數據倉庫
數據倉庫是一個(gè)支持管理決策的數據集合。數據是面向主題的、集成的、不易丟失的并且是時(shí)間變量。
數據倉庫是所有操作環(huán)境和外部數據源的快照集合。它并不需要非常精確,因為它必須在特定的時(shí)間基礎上從操作環(huán)境中提取出來(lái)。
數據集市
數據倉庫只限于單個(gè)主題的區域,例如顧客、部門(mén)、地點(diǎn)等。數據集市在從數據倉庫獲取數據時(shí)可以依賴(lài)于數據倉庫,或者當它們從操作系統中獲取數據時(shí)就不依賴(lài)于數據倉庫。
事實(shí)
事實(shí)是數據倉庫中的信息單元,也是多維空間中的一個(gè)單元,受分析單元的限制。
事實(shí)存儲于一張表中(當使用關(guān)系數據庫時(shí))或者是多維數據庫中的一個(gè)單元。
每個(gè)事實(shí)包括關(guān)于事實(shí)(收入、價(jià)值、滿(mǎn)意記錄等)的基本信息,并且與維度相關(guān)。
在某些情況下,當所有的必要信息都存儲于維度中時(shí),單純的事實(shí)出現就是對于數據倉庫足夠的信息。我們稍后討論有關(guān)缺無(wú)事實(shí)的情況。
維度
維度是綁定由坐標系定義的空間的坐標系的軸線(xiàn)。數據倉庫中的坐標系定義了數據單元,其中包含事實(shí)。
坐標系的一個(gè)例子就是帶有 x 維度和 y 維度的 Cartesian(笛卡爾)坐標系。
在數據倉庫中,時(shí)間總是維度之一。
數據挖掘
在數據倉庫的數據中發(fā)現新信息的過(guò)程被稱(chēng)為數據挖掘,這些新信息不會(huì )從操作系統中獲得。
分析空間
分析空間是數據倉庫中一定量的數據,用于進(jìn)行數據挖掘以發(fā)現新信息同時(shí)支持管理決策。
切片
一種用來(lái)在數據倉庫中將一個(gè)維度中的分析空間限制為數據子集的技術(shù)。
切塊
一種用來(lái)在數據倉庫中將多個(gè)維度中的分析空間限制為數據子集的技術(shù)。
星型模式
一種使用關(guān)系數據庫實(shí)現多維分析空間的模式,稱(chēng)為星型模式。
星型模式將在本白皮書(shū)中稍后進(jìn)行進(jìn)一步討論。
雪花模式
不管什么原因,當星型模式的維度需要進(jìn)行規范化時(shí),星型模式就演進(jìn)為雪花模式。
評論