開(kāi)源嵌入式數據庫Bericel ey DB和SQLite的比較
通常,我們采用數據庫來(lái)實(shí)現對數據的存儲、檢索等功能。像MySQL這類(lèi)基于C/S結構的關(guān)系型數據庫系統,雖然代表著(zhù)目前數據庫應用的主流,卻并不能滿(mǎn)足所有應用場(chǎng)合的需要。很多的應用,僅僅利用到了這些數據庫產(chǎn)品的基本特性而已。有時(shí)我們需要的可能只是一個(gè)簡(jiǎn)單的基于磁盤(pán)文件的數據庫系統,這樣就不必安裝龐大的數據庫服務(wù)器,以簡(jiǎn)化數據庫應用程序的設計。在某些特殊應用場(chǎng)合,比如在嵌入式系統中,由于系統的硬件軟件資源都有限,這些數據庫產(chǎn)品就明顯有一些臃腫,甚至是不可實(shí)現的。在這些情況下,嵌入式數據庫的優(yōu)勢就特別明顯了。
嵌入式數據庫通常與操作系統和具體應用集成在一起,無(wú)須獨立運行的數據庫引擎,由程序直接調用相應的API去實(shí)現對數據的存取操作。更直白地講,嵌入式數據庫是一種具備了基本數據庫特性的數據文件。嵌入式數據庫與其它數據庫產(chǎn)品的區別是,前者是程序驅動(dòng)式,而后者是引擎響應式。嵌入式數據庫的一個(gè)很重要的特點(diǎn)是它們的體積非常小,編譯后的產(chǎn)品也不過(guò)幾十KB,在一些移動(dòng)設備上極具競爭力。
從目前嵌入式應用的發(fā)展趨勢來(lái)看,嵌入式數據庫的實(shí)現必須充分體現系統的可定制性,即系統選擇的技術(shù)路線(xiàn)要面向具體的行業(yè)應用,因而研究源碼開(kāi)放的嵌入式數據庫具有特殊意義。
2 Berkeley DB和SQLite
DBkeley DB是一款健壯的、高速的工業(yè)級開(kāi)放源代碼的嵌入式數據庫管理系統。應用它,程序員只需要調用一些簡(jiǎn)單的API就可以完成對數據的訪(fǎng)問(wèn)和管理。
Berkeley DB的源代碼有C和Java兩種,函數庫本身只有300KB左右,但卻能夠用來(lái)管理多達256TB的數據。Berkeley DB作為一種嵌入式數據庫系統在許多方面有著(zhù)獨特的優(yōu)勢。首先,由于其應用程序和數據庫管理系統運行在相同的進(jìn)程空間當中,進(jìn)行數據操作時(shí)可以避免繁瑣的進(jìn)程間通信,因此耗費在通信上的開(kāi)銷(xiāo)自然也就降低到了極低程度。其次,Berkeley DB使用簡(jiǎn)單的函數調用接口來(lái)完成所有的數據庫操作,而不是在數據庫系統中經(jīng)常用到的SQL語(yǔ)言,避免了對結構化查詢(xún)語(yǔ)言進(jìn)行解析和處理所需的開(kāi)銷(xiāo)。
SQLite的源代碼是C,其源代碼完全開(kāi)放。SQLite第一個(gè)Alpha版本誕生于2000年5月。今年5月,SQLite又迎來(lái)了一個(gè)新的里程一SOLite 3。
SQLite有以下特性:支持ACID事務(wù);零配置一無(wú)需安裝和管理配置;儲存在單一磁盤(pán)文件中的一個(gè)完整的數據庫;數據庫文件可以在不同字節順序的機器間自由共享;支持數據庫大小至2TB;足夠小,全部源碼大致3萬(wàn)行c代碼,250KB;比目前流行的大多數數據庫對數據的操作要快;提供了對事務(wù)功能和并發(fā)處理的支持,應用Transaction既保證了數據的完整性,也會(huì )提高運行速度,因為多條語(yǔ)句一起提交給數據庫的速度會(huì )比一條一條的提交方式更快;獨立,沒(méi)有額外依賴(lài)。
目前,對Berkeley DB的研究開(kāi)發(fā)工作主要是美國的sleepycat公司在進(jìn)行,在國內幾乎沒(méi)有關(guān)于這方面的研究;而SQLite在國內也是鮮有人問(wèn)津。
2.1 Berkeley DB和SOLite的數據庫操作
與常用的數據庫管理系統(如MySQL和Oracle等)有所不同,在Berkeley DB中并沒(méi)有數據庫服務(wù)器的概念。應用程序不需要事先同數據庫服務(wù)建立起網(wǎng)絡(luò )連接,而是通過(guò)內嵌在程序中的Berkeley DB函數庫來(lái)完成對數據的保存、查詢(xún)、修改和刪除等操作。所有與數據庫相關(guān)的操作都由函數庫負責統一完成,這樣無(wú)論是系統中的多個(gè)進(jìn)程,或者是相同進(jìn)程中的多個(gè)線(xiàn)程,都可以在同一時(shí)間調用訪(fǎng)問(wèn)數據庫的函數;而底層的數據加鎖、事務(wù)日志和存儲管理等都在Berkeley DB函數庫中實(shí)現。它們對應用程序來(lái)講是完全透明的。
Berkeley DB不是關(guān)系型的數據庫,不能應用標準的SQL語(yǔ)句對數據庫操作,對它的操作要調用專(zhuān)用的API實(shí)現。這些API提供了查詢(xún)、插入、刪除等功能。比如com.sleepycat.db.Db類(lèi)代表數據庫對象。Db類(lèi)的put( )方法完成的是插入功能;get( )方法完成的是讀出數據的功能;com.sleepycat.db.Dbc是Berkeley DB的游標類(lèi),提供了遍歷數據庫記錄的功能。
使用Berkeley DB提供的函數來(lái)進(jìn)行數據庫的訪(fǎng)問(wèn)和管理并不復雜。在大多數場(chǎng)合下,只需按照統一的接口標準進(jìn)行調用就可以完成最基本的操作,Berkeley DBEnvironment為一組數據庫同時(shí)提供參數設置。更為重要的是,如果要應用更高級的特性,必須要使用Environment功能,比如在要對保存的數據進(jìn)行加密存儲、利用其Transaction、數據加密、同步加鎖控制、錯誤日志等功能的時(shí)候。
SQLite的SQL語(yǔ)言很大程度上實(shí)現了ANSI SQL92標準,特別是支持視圖、觸發(fā)器、事務(wù),支持嵌套SQL。它通過(guò)SQL編譯器(SQL Complier)來(lái)實(shí)現SQL語(yǔ)言對數據庫進(jìn)行操作,支持大部分的SQL命令,如attach database、begin transaction、comment、commit transaction、copy、create index、create table、create trigger、create view、delete、detach database、drop index、drop table、drop trigger、drop view、end transaction、explain、expression、insert、On conflict clause、pragma、replace、rollback transaction、select、update。
當然,也有一部分SQL命令SQLite并不支持。比如:不支持:Exists,雖然支持in(in是Exists的一種情況);不支持多數據庫,如create table dbl.tablel as select*from db2.table 1;:不支持存儲過(guò)程;不支持Alter View/Trigger/Table:不支持Truncate, 在SQLite中Delete不帶Where字句時(shí)和Truancate的效果是一樣的;不支持Floor和Ceiling函數,還有其它許多的函數;沒(méi)有Auto Increment(自增)字段,但其實(shí)SQLite是支持Auto Increment的,即在將該字段設置為“INTEGER PRIMARY KEY”的時(shí)候;不支持If Exists等。
2.2 Berkeley DB和S0Lite與普通數據庫的差別
Berkeley DB引入了一些新的基本概念,使得數據庫應用程序訪(fǎng)問(wèn)和管理數據庫變得相對簡(jiǎn)單起來(lái)。
(1)關(guān)鍵字和數據
關(guān)鍵字(key)和數據(data)是。Berkeley.DB用來(lái)進(jìn)行數據庫管理的基礎,由這兩者構成的key/data對,組成了數據庫中的一個(gè)基本結構單元。整個(gè)數據庫實(shí)際上就是由許多這樣的結構單元構成的。通過(guò)使用這種方式,在通過(guò)API函數訪(fǎng)問(wèn)數據庫時(shí),只需提供關(guān)鍵字就能夠訪(fǎng)問(wèn)到相應的數據。
關(guān)鍵字和數據在Berkeley DB中都是用一個(gè)名為DBT的簡(jiǎn)單結構來(lái)表示的。實(shí)際上兩者都可以是任意長(cháng)度的二進(jìn)制數據。DBT的作用主要是保存相應的內存地址及其長(cháng)度,其結構如下所示:
typedef struct {
void*data;
u_int32_t size;
u_int32_t ulen;
u_int32_f dlen;
u_int32_f doff;
u_int32_f flags;
}DBT;
在使用Berkeley DB進(jìn)行數據管理時(shí),缺省情況下是一個(gè)關(guān)鍵字對應于一個(gè)數據;但也可以將數據庫配置成一個(gè)關(guān)鍵字對應于多個(gè)數據,而鍵值和數據必須是類(lèi)com.sleepycat.db.Dbt的對象或其子類(lèi)的對象。
(2)對象句柄
在Berkeley DB函數庫定義的大多數函數都遵循同樣的調用原則:首先創(chuàng )建某個(gè)結構,然后再調用該結構中的某些方法。從程序設計的角度來(lái)講,這一點(diǎn)同面向對象的設計原則是非常類(lèi)似的,即先創(chuàng )建某個(gè)對象的一個(gè)實(shí)例,然后再調用該實(shí)例的某些方法。正因為如此,.Berkeley DB引入了對象句柄的概念來(lái)表示實(shí)例化后的結構,并且將結構中的成員函數稱(chēng)為該句柄的方法。對象句柄的引入使得程序員能夠憑借面向對象的思想,來(lái)完成對Berkeley DB數據庫的訪(fǎng)問(wèn)和操作。
(3)錯誤處理
對于任何一個(gè)函數庫來(lái)說(shuō),如何對錯誤進(jìn)行統一的處理都是需要考慮的問(wèn)題。Berkeley DB提供的所有函數都遵循同樣的錯誤處理原則,即函數成功執行后返回零,否則返回非零值。
對于系統錯誤(如磁盤(pán)空間不足),返回的是一個(gè)標準的值;而對于非系統錯誤,返回的則是一個(gè)特定的錯誤編碼。例如,如果在數據庫中沒(méi)有與某個(gè)特定關(guān)鍵字所對應的數據,那么在通過(guò)該關(guān)鍵字檢索數據時(shí)就會(huì )出現錯誤。此時(shí)函數的返回值將是DB―NOTF0uND,表示在數據庫中并沒(méi)有所請求的關(guān)鍵字。所有標準的e rrn0值都大于零,而由Berkeley DB定義的特殊錯誤編碼則都小于零。
Berkeley。DB提供了相應的函數來(lái)獲得錯誤代號所對應的錯誤描述。一旦有錯誤發(fā)生,只需首先調用db_strerror( )函數來(lái)獲得錯誤描述信息,然后再調用DB一>err()或DB->errx()就可以很輕松地輸出格式化后的錯誤信息。
而SQLite最大的特點(diǎn)在于其數據類(lèi)型為無(wú)數據類(lèi)型(typelessness)。這意味著(zhù)可以保存任何類(lèi)型的數據到所想要保存的任何表的任何列中,無(wú)論這列聲明的數據類(lèi)型是什么。雖然在生成表結構的時(shí)候,要聲明每個(gè)域的數據類(lèi)型,但sQLite并不做任何檢查。開(kāi)發(fā)人員要靠自己的程序控制輸入與讀出數據的類(lèi)型。這里有一個(gè)例外,就是當主鍵為整型值時(shí),如果要插入一個(gè)非整型值時(shí)會(huì )產(chǎn)生異常。
誠然,SQLite允許忽略數據類(lèi)型,但是,仍然建議在Create Table語(yǔ)句中指定數據類(lèi)型,因為數據類(lèi)型有利于增強程序的可讀性。SQLite支持常見(jiàn)的數據類(lèi)型,如VARCHAR、NVARCHAR、TEXT、INTEGER、FLOAT、BOOLEAN、CLOB、BLOB、TIMESTAMP、NUMERIC、VARYING、CHARACTER、NATl0NAI, VARYINGCHARACTER。
另外,雖然在插入或讀出數據的時(shí)候是不區分類(lèi)型的,但在比較的時(shí)候,不同數據類(lèi)型是有區別的。比如:CREATE TABLE MyTable (a INTEGER,b TEXT);
INSERT INT0 MyTable VALIUES(0,0);
當執行查詢(xún)
SELECT count(*)FROM MyTable WHERE a=='00';時(shí),會(huì )返回一條記錄。因為字段a的類(lèi)型是整型,而數字00與0是相等的。而執行查詢(xún)
SELECT count(*)FROM MyTable WHERE b=='00':時(shí),則不會(huì )返回記錄。因為字段b是字符類(lèi)型,字符"00"與“0”是不相等的。
2.3 Betkeley DB和SQLite數據存儲方式比較
Berkeley DB對任何存入的數據都是按原樣直接存儲到數據文件中去,無(wú)論其是二進(jìn)制數據還是A S C I I或Unicode等編碼的文本。Berkeley DB提供了四種存儲數據的模式:Btree、Hash、Queue和Recno。在打開(kāi)數據庫的時(shí)候,要指定一種存儲模式。比如,上例中open( )方法中的參數Db.DB_BTREE就是指定以Btree模式打開(kāi)數據庫。
SQLite只提供了Btree存儲數據的模式。對二進(jìn)制數據,SQLite不能直接保存,但可以先將二進(jìn)制的數據轉換成ASCII編碼,然后再保存。Base64.編碼機制是最常見(jiàn)的把二進(jìn)制數據轉換成ASCII編碼的手段。在SQLite的C語(yǔ)言代碼encode.c中,提供了Base64編碼的功能。
Btree模式是以排序的二叉樹(shù)的方式存儲的,Hash是以線(xiàn)性哈希表的方式存儲。Queue用邏輯記錄號作為鍵值,以定長(cháng)的數據為記錄值。Recno方式也以邏輯記錄號作為鍵值,但可以保存定長(cháng)或變長(cháng)的記錄值。這里提到的邏輯記錄號有兩種,即可變的和固定的??勺冞壿嬘涗浱枙?huì )根據數據記錄的增加與刪除作相應的變化。Queue模式下,邏輯記錄號只能是固定方式。Recno模式則可通過(guò)配置來(lái)選擇是采用哪種類(lèi)型的記錄號作為鍵值。Btree模式也可以通過(guò)設置,將可變的邏輯記錄號作為鍵值。
這幾種存儲模式各有優(yōu)缺點(diǎn),當鍵值不想用邏輯記錄號時(shí),Btree或Hash是必須的選擇。Btree方式比較適合連續的順序讀取。比如,當鍵值是時(shí)間值,如果經(jīng)常有從某一時(shí)間點(diǎn)開(kāi)始連續讀取后繼的記錄的操作,Btree是一種很好的選擇。對隨機的跳躍式讀取,Hash模式則更為恰當。Queue和Recno都以記錄號為鍵值,但前者適合先進(jìn)先出的讀取方式。Recno則通常是存取變長(cháng)文本記錄的理想存儲模式。
2.4 Berkeley DB和S0Lite適用的系統
Berkeley DB為許多編程語(yǔ)言提供了實(shí)用的API接口,包括C、C++、Java、:Perl、Tcl、Python和PHP等。它適用平臺UNIX/POSIX systems、win32以及嵌入式操作系統WinCE、VxWorks等。
通過(guò)Wrapper,SQLite實(shí)現了與其它語(yǔ)言的連接。所謂Wrapper即對SQLite提供的接口進(jìn)行封裝,使其它語(yǔ)言可以訪(fǎng)問(wèn),使用SQLite。SQLite本身提供C和Tcl的接口,世界各地的程序員還提供了各種語(yǔ)言的SQLite的接口封裝, 如Python、C++、Java、.Net等幾乎所有流行的語(yǔ)言基本都有。sQLite提供一個(gè)抽象的操作系統接口層,來(lái)保證其在POSIX 與 Win32系統之間的兼容性。
2.5 其它方面
Berkeley DB沒(méi)有數據庫服務(wù)器的概念,使用簡(jiǎn)單的函數調用接口來(lái)完成所有的數據庫操作,不使用SQL語(yǔ)言;接口簡(jiǎn)明實(shí)用,避免了對結構化查詢(xún)語(yǔ)言進(jìn)行解析和處理所需的開(kāi)銷(xiāo),提高了執行速度;速度極快,可靠性高,但學(xué)習起來(lái)有一定難度。SQLite則簡(jiǎn)單易用,速度也很快,但功能卻較Berkeley略有遜色,比如加密功能、二進(jìn)制數據的處理等。
Berkeley DB雖然是開(kāi)源的產(chǎn)品,但對某些條件下的商業(yè)性應用,卻不是免費的,而且價(jià)格頗為昂貴。這些商業(yè)條件包括排除了開(kāi)源的情況,不發(fā)放分布版本的情況等。SQLite是源代碼完全的開(kāi)放,可以免費用于任何用途,包括商業(yè)目的。
結語(yǔ)
隨著(zhù)人們對移動(dòng)數據處理和管理需求的不斷提高,與各種智能設備緊密結合的嵌入式數據庫技術(shù)已經(jīng)得到了學(xué)術(shù)界、工業(yè)界、民用部門(mén)等各方面的廣泛重視。嵌入式數據庫將會(huì )使得人們希望隨時(shí)隨地存取任意思數據信息的愿望成為現實(shí),嵌入式數據庫將無(wú)處不在。開(kāi)源的嵌入式數據庫Berkeley DB和SQLite,內核微小,有能夠充分適應硬件的能力,能很好地適應嵌入式系統的需要。在具體的嵌入式應用中可以根據具體情況選擇應用。
linux操作系統文章專(zhuān)題:linux操作系統詳解(linux不再難懂)
c++相關(guān)文章:c++教程
評論