基于XML和本體的物聯(lián)網(wǎng)數據交換標準體系研究
摘要:針對當前物聯(lián)網(wǎng)應用層中相關(guān)數據交換標準紛繁復雜,相關(guān)標準主體各行其是的問(wèn)題,從XML(可擴展標記語(yǔ)言)和本體的角度出發(fā),從互聯(lián)網(wǎng)、語(yǔ)義網(wǎng)和物聯(lián)網(wǎng)的關(guān)系入手,提出了建立物聯(lián)網(wǎng)數據交換標準體系的思路,即標準應以XML為語(yǔ)法格式,以標準化的本體為語(yǔ)義共識;標準體系應以頂級本體為基礎,以縱向的領(lǐng)域本體和橫向的任務(wù)本體為支撐,建立起各種不同的應用本體標準。文章最后通過(guò)一個(gè)應用實(shí)例分析了所述標準體系發(fā)展的若干關(guān)鍵要點(diǎn)。
本文引用地址:http://dyxdggzs.com/article/160572.htm關(guān)鍵詞:物聯(lián)網(wǎng);數據交換標準;可擴展標記語(yǔ)言;標準本體
0 引言
2009年被稱(chēng)為中國的物聯(lián)網(wǎng)元年,這一年,溫家寶總理在無(wú)錫視察時(shí)提出了“感知中國”戰略。2010年的“兩會(huì )”期間,物聯(lián)網(wǎng)首次被寫(xiě)入政府工作報告中,被確定為國家要大力發(fā)展的戰略性新興產(chǎn)業(yè)。近年來(lái),從中央到地方、從政府到企業(yè),一餳物聯(lián)網(wǎng)建設的熱潮正在如火如荼地展開(kāi)。然而,當前物聯(lián)網(wǎng)的發(fā)展仍處于初級階段,還面臨著(zhù)傳感器技術(shù)不成熟、缺乏商業(yè)應用模式、信息安全和隱私等諸多問(wèn)題與挑戰,其中制約物聯(lián)網(wǎng)發(fā)展的最大瓶頸,則是缺乏統一的技術(shù)標準,尤其是數據表達、交換和處理標準。因為傳感器關(guān)鍵技術(shù)的突破、商業(yè)應用模式的推廣等等,都只是物聯(lián)網(wǎng)中“物”的問(wèn)題,而數據交換標準則涉及物聯(lián)網(wǎng)中“聯(lián)”的問(wèn)題。如果不能實(shí)現物與物之間暢通無(wú)阻的信息交換,就不能稱(chēng)之為真正的物聯(lián)網(wǎng)。
1 物聯(lián)網(wǎng)數據交換標準現狀
物聯(lián)網(wǎng)系統主要分為三個(gè)層面:感知層、傳輸層和應用層。感知層主要是對物體進(jìn)行識別或數據采集;傳輸層是通過(guò)現有的通信網(wǎng)絡(luò )將信息進(jìn)行可靠傳輸;應用層則是對采集的數據進(jìn)行智能處理或展示。在這三層體系中,感知層中基于物理、化學(xué)、生物等技術(shù)發(fā)明的傳感器“標準”多已成為專(zhuān)利。而傳輸層的各種通信標準也已基本成熟,建立新的物聯(lián)網(wǎng)通信標準難度較大,可行性較小。因此,物聯(lián)網(wǎng)標準的關(guān)鍵和亟待統一的是關(guān)于應用層的標準,而其中尤以數據表達、交換和處理標準為核心。
目前,針對物聯(lián)網(wǎng)應用層的數據交換標準主要有PML、EDDL、M2MXML、NGTP等。其中,PML是實(shí)體標注語(yǔ)言,它是EPC(產(chǎn)品電碼)物聯(lián)網(wǎng)中交換信息的共同語(yǔ)言,用來(lái)描述人及機器都可以使用的自然物體的描述標準。EDDL是電子設備描述語(yǔ)言,它可以描述現場(chǎng)設備中的數據,以用于工程、調試、監視運行和診斷。M2MXML是一種用于終端設備間的通信協(xié)議,它包含一個(gè)用于分析協(xié)議的、與語(yǔ)義無(wú)關(guān)的JavaAPI。NGTP是寶馬公司推出的開(kāi)放式Telematics協(xié)議架構平臺,它使用統一、開(kāi)放的接口來(lái)區分Telematics服務(wù)供應鏈的各個(gè)環(huán)節。此外,還有智能建筑領(lǐng)域的OB1X標準、公共安全與應急領(lǐng)域的CAP標準以及PCM(脈碼調制)遙測技術(shù)的IRIG標準等。
可以看出,現有的物聯(lián)網(wǎng)應用層的數據交換標準大多是針對某一特定領(lǐng)域或行業(yè)業(yè)務(wù)提出的,有一定的局限性,所以當前物聯(lián)網(wǎng)缺少的是一個(gè)統一的物聯(lián)網(wǎng)數據交換大集成應用標準(或標準體系)。歐盟有關(guān)機構正在進(jìn)行數據交換標準“融合”的研究,目標是綜合考慮相關(guān)領(lǐng)域已有的基于XML的數據交換標準,以便為那些在不同的標準中語(yǔ)義上具有等價(jià)性的數據元素(盡管他們可能有不同的名字)提供全球唯一的交叉引用方式和標識結構,從而提煉出一個(gè)基礎的元數據標準,把這個(gè)標準作為物聯(lián)網(wǎng)數據交換的核心,那么,對于不同的行業(yè)應用,就可以基于元數據擴展出相應的行業(yè)數據交換標準。
總體來(lái)說(shuō),物聯(lián)網(wǎng)的標準化工作已經(jīng)得到了業(yè)界的普遍重視,但對于應用層的標準化工作來(lái)說(shuō),還需要客觀(guān)分析物聯(lián)網(wǎng)標準的整體需求,從國際標準、國家標準、行業(yè)標準、地區標準等多個(gè)層次進(jìn)行統籌設計;其次,還需要協(xié)調各個(gè)標準的推進(jìn)策略,優(yōu)化資源配置。
2 物聯(lián)網(wǎng)數據交換標準體系的構建
2.1 構建物聯(lián)網(wǎng)數據交換標準體系的基石
XML技術(shù)是為了克服HTML在互聯(lián)網(wǎng)信息交換和表示方面的缺陷而設計的,本體論最初也是起源于哲學(xué)領(lǐng)域,隨后在研究人工智能時(shí)被引入計算機領(lǐng)域。雖然兩者的出現都不是為了解決物聯(lián)網(wǎng)領(lǐng)域的數據交換標準問(wèn)題,但它們卻為這一問(wèn)題的解決提供了必要的理論基礎和技術(shù)手段。
2.1.1 物聯(lián)網(wǎng)數據交換標準的語(yǔ)法基礎——XML
XML(eXtensible Markup Language,可擴展標記語(yǔ)言)是W3C組織于1998年推出的一種用于數據描述的元標記語(yǔ)言標準。作為SGML(Stan dard Generalized Markup Language,標準通用標識語(yǔ)言)的一個(gè)簡(jiǎn)化子集,它結合了SGML豐富的功能和HTML的簡(jiǎn)單易用,同時(shí)具有可擴展性、自描述性、開(kāi)放性、互操作性、可支持多國語(yǔ)言等特點(diǎn),因而得到了廣泛地支持與應用。
對于作為物聯(lián)網(wǎng)數據交換標準的格式來(lái)說(shuō),XML具有以下顯著(zhù)優(yōu)點(diǎn):
(1)可定義行業(yè)或領(lǐng)域標記語(yǔ)言
XML可以用DTD或者Schema來(lái)定義,一份遵循DTD或者Schema定義的XML文檔才是有效的。因此,XML可以針對不同的應用建立相關(guān)的標準語(yǔ)言,如化學(xué)標記語(yǔ)言(CML)、數學(xué)標記語(yǔ)言(MathML)、語(yǔ)音標識語(yǔ)言(VoiceXML)等,包括目前物聯(lián)網(wǎng)中很多已經(jīng)存在的標準都是基于XML定義的。
(2)具有結構化的通用數據格式
XML使用樹(shù)形目錄結構形式,可以自行定義文字標簽并指定元素間的關(guān)系,同時(shí)它也是W3C公開(kāi)的一種數據格式,沒(méi)有版權的使用限制,因而十分適合作為小同應用程序之間的信息交換格式。
(3)可提供整套方案
XML擁有一整套技術(shù)體系,如可擴展樣式表語(yǔ)言XSL、數據查詢(xún)技術(shù)xQuery、文檔對象模型DOM等等。
2.1.2 物聯(lián)網(wǎng)數據交換標準的語(yǔ)義基礎——本體
本體(Ontology)起源于哲學(xué),被Neches等人引入計算機科學(xué)領(lǐng)域后,在人工智能、語(yǔ)義Web、軟件工程、圖書(shū)館學(xué)以及信息架構等領(lǐng)域得到了廣泛應用。關(guān)于本體最流行的定義是Gruber在1993年給出的,即“本體是概念模型的明確的規范說(shuō)明”。Studer在對前人的定義進(jìn)行概括后提出:本體的概念包括四個(gè)方面:
(1)概念模型:它是客觀(guān)世界現象的抽象模型,其表示的含義獨立于具體的環(huán)境狀態(tài);
(2)明確:所使用的概念及使用這些概念的約束都有明確的定義;
(3)形式化:本體的表示是形式化的,可以被計算機處理;
(4)共享:本體中體現的是共同認可的知識,反映的是相關(guān)領(lǐng)域中公認的概念集,它所針對的是團體而不是個(gè)體。
本體的目標是獲取相關(guān)的領(lǐng)域知識,提供對該領(lǐng)域知識的共同理解,確定該領(lǐng)域內共同認可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術(shù)語(yǔ))和詞匯間相互關(guān)系的明確定義。所以,本體是具有小同知識表示的Web應用系統之間進(jìn)行數據或知識交換共享的基礎結構。通過(guò)定義共享和公共的領(lǐng)域知識,本體可幫助機器之間或機器與人之間更加精確地交流,實(shí)現相互之間的語(yǔ)義交換,而不只是語(yǔ)法級的交互。
按照領(lǐng)域依賴(lài)程度,Guarino將本體劃分為四類(lèi):第一類(lèi)是頂級本體,用于描述通用的概念和概念之間的關(guān)系,如時(shí)間、空間、物質(zhì)、對象、事件、動(dòng)作等,頂級本體獨立于特定的問(wèn)題和領(lǐng)域,與具體的應用無(wú)關(guān);第二類(lèi)是領(lǐng)域本體,用于描述特殊領(lǐng)域(如教育或金融)中的概念,即陳述性知識;第三類(lèi)是任務(wù)本體,用于描述特定任務(wù)或活動(dòng)(如入學(xué)或取款)中的概念,即過(guò)程性知識;第四類(lèi)是應用本體,應用本體可通過(guò)進(jìn)一步特殊化領(lǐng)域本體和任務(wù)本體,將其用于描述既依賴(lài)于特定領(lǐng)域,又依賴(lài)于特定任務(wù)的概念,這些概念通常對應于領(lǐng)域個(gè)體執行特定活動(dòng)時(shí)所扮演的角色(如學(xué)生入學(xué)或客戶(hù)取款)。
2.2 構建物聯(lián)網(wǎng)數據交換標準體系的思路
顧名思義,物聯(lián)網(wǎng)就是物與物相連的網(wǎng)絡(luò ),要想實(shí)現物與物之間暢通無(wú)阻的“交流”,就需要在語(yǔ)法上相同,在語(yǔ)義上互通。通俗的說(shuō),就是用相同的格式表達同一個(gè)意思。
XML在語(yǔ)法上的結構化信息表達能力和本體在語(yǔ)義上的透明性之間的優(yōu)勢互補為物聯(lián)網(wǎng)數據交換標準的建立提供了很好的解決思路。
評論