基于模糊聚類(lèi)的電子信息資源整合方法
摘要:由于進(jìn)行電子信息資源整合的過(guò)程中,沒(méi)有進(jìn)行資源轉換降維處理,導致資源整合效率低,為此提出基于模糊聚類(lèi)的電子信息資源整合方法。通過(guò)模糊ORM技術(shù)抽取電子信息資源,采用等效轉換降維的方法對抽取的電子信息資源進(jìn)行轉換降維處理,根據處理結果,結合模糊聚類(lèi)分析,構建EAD電子信息資源整合模型,采用模糊聚類(lèi)分析的方式,將所屬的信息資源依據特征或者屬性劃分為不同額定整合區域,計算整合隸屬度,布設信息資源的整合層級。最終的測試結果表明:與傳統的LAM信息資源整合測試組及傳統改進(jìn)ORM信息資源整合測試組相對比,所設計的模糊聚類(lèi)信息資源整合測試組最終得出的響應時(shí)間相對較短,電子信息資源整合效率較高,所提方法具有實(shí)際的應用價(jià)值。
本文引用地址:http://dyxdggzs.com/article/202308/449387.htm關(guān)鍵詞:模糊聚類(lèi);電子信息;信息匯總;資源整合;數據控制
電子信息資源是以數字化形式( 即二進(jìn)制代碼0,1)把文字、圖象、聲音、動(dòng)畫(huà)等多種形式的信息存儲在光、磁等非印刷型介質(zhì)上,并以光信號、電信號的形式傳輸,通過(guò)響應的計算機和其他外部設備再現出來(lái)的信息資源。電子信息資源整合主要是針對于龐大的數據信息群,構建的一種特殊的數據匯總方法[1]。近年來(lái),隨著(zhù)計算機以及網(wǎng)絡(luò )技術(shù)的成熟普及,數據資源急劇增長(cháng),逐漸成為資源處理的主流。通常情況下,數字資源自身具有復雜性、異構性、海量性以及多元性等特征,這在一定程度上也增加了信息資源整合的速度以及效率,增加元數據的可靠性,給未來(lái)信息發(fā)展奠定更為堅實(shí)的基礎[2]。
模糊聚類(lèi),實(shí)際上指的是一種按模糊界限以及基本要求對事物進(jìn)行分類(lèi)的數學(xué)方法[3]。本質(zhì)上是客觀(guān)的劃分,并采用數理統計的方式,獲取最終處理結果。模糊聚類(lèi)為信息整合處理提供了極大的便利條件,進(jìn)一步確保數據計算的精準度,同時(shí),關(guān)聯(lián)系統聚類(lèi)法和逐步聚類(lèi)法等方法,形成一個(gè)可無(wú)限延伸與擴展的資源整合體系,優(yōu)化需要整合的信息資源,避免出現信息孤島這一類(lèi)問(wèn)題,推動(dòng)信息整合相關(guān)企業(yè)邁入一個(gè)新的發(fā)展階段。因此,本文提出一種基于模糊聚類(lèi)的電子信息資源整合方法??紤]到最終測試結果的精準性與可靠性,本文會(huì )在較為真實(shí)的背景下進(jìn)行實(shí)驗測試,并驗證本文方法能夠安全、高效的進(jìn)行信息資源整合。
1 模糊聚類(lèi)下電子信息資源整合方法
1.1 基于模糊ORM技術(shù)的電子信息資源抽取
在對模糊聚類(lèi)下電子信息資源整合方法設計之前,需要先采用模糊ORM 技術(shù)對電子信息資源抽取。通常情況下,針對于不同的整合范圍,所導出的資源以及定向整合目標也是不同的,這也使得內部執行程序存在差異[4-6]??梢圆捎秒p向處理模式,在平臺中構建多層級的模糊ORM 資源整合程序,與數據庫相關(guān)聯(lián)的同時(shí),獲取數據集,在聚類(lèi)中心,對信息劃歸分類(lèi),計算出聚類(lèi)質(zhì)心數,具體如式(1)所示。
(1)
式(1)中: B 表示聚類(lèi)質(zhì)心數; p 表示聚類(lèi)范圍; Z 表示質(zhì)心集合;f 表示映射系數。通過(guò)上述計算,最終可以得出實(shí)際的聚類(lèi)質(zhì)心數[7]。根據得出的聚類(lèi)質(zhì)心數,核定不同層級數值資源的占比,以此為基礎,在特定的電子信息資源庫中,利用雙向信息集成法來(lái)代替傳統的單一信息集成方式,結合模糊ORM 技術(shù),電子信息資源抽取,具體如式(2)所示。
(2)
式(2)中:H表示數據定向抽取結果;a 表示疊合距離;d 表示集成次數; s 表示允許出現的極限差值。此時(shí),完成對信息的抽取,隨后,在標定的資源整合范圍之內,依據實(shí)際的處理標準,更改調整ORM 模糊引導指令,在確保數據唯一性、準確性、及時(shí)性、完整性的同時(shí),實(shí)現整合目標的更改調整,為后續的匯總處理奠定基礎[8]。
1.2 電子信息資源轉換降維處理
在通過(guò)模糊ORM 技術(shù)對信息資源進(jìn)行抽取后,對電子信息資源進(jìn)行轉換降維處理。所謂轉換降維處理,主要指的是在對信息資源抽取的過(guò)程中,信息資源通常處于集合的狀態(tài),資源維數也存在較大的差異,而維數的存在并不利于數據的整合、匯總,嚴重的甚至會(huì )造成數據誤差等,因此,需將高維信息資源轉換為低維信息資源??梢圆捎玫刃мD換降維的方法,按照統一的元數據標準或者降維格式進(jìn)行周期性轉換,計算出轉換降維比率,具體如式(3)所示。
(3)
式(3)中:A 表示轉換降維比率;n 表示中心整合距離;c表示聚類(lèi)差值。通過(guò)上述計算,最終可以得出實(shí)際的轉換降維比率。根據信息資源的屬性與特征,結合轉換降維比率,實(shí)現定向轉換。
接下來(lái),在實(shí)現標定信息資源的轉換降維后,結合定向集成信息資源整合現狀,計算出信息資源處理的單元速度,具體如式(4)所示。
(4)
式(4)中: U 表示信息資源處理單元速度; x 表示縱向整合距離; q 表示傳輸路徑; t 表示動(dòng)態(tài)平均值。通過(guò)上述計算,最終可以得出實(shí)際的信息資源處理單元速度。在中心元數據庫中,依據降維映射規則將統一元數據標準分化為幾個(gè)轉換降維層級。不同降維層級的轉換格式也是不同的,可以根據所設定的整合目標,作出更改調整,舉例來(lái)說(shuō):可以賦予定義XML、RDF 等輸出格式,一定程度上擴大整體的信息整合降維范圍,以此來(lái)適應用戶(hù)的不同需求。
1.3 EAD模糊聚類(lèi)整合模型構建
在完成電子信息資源轉換降維處理后,構建EAD模糊聚類(lèi)整合模型。將上述轉換降維處理后的電子信息資源輸入到模型之中,將模型調整為可共享的形式化概念模型,關(guān)聯(lián)局域網(wǎng)以及聚類(lèi)數據中心,調整數據組織形式為單向。將不同元數據指令應用到本體集成框架中,設定具體的集成速度和資源整合映射比,具體如表1所示。
表1 集成速度、資源整合映射比測定表
根據表1,可以完成對集成速度、資源整合映射比的測定。隨后,遵循標定的整合目標,結合模糊聚類(lèi)分析,構建EAD 信息資源整合結構,具體如圖1所示。
圖1 EAD信息資源整合模型結構圖示
根據圖1,可以完成對EAD 信息資源整合模型結構的建立。此時(shí)以本體為中心的,調整定向映射標準,使用多層級的映射描述框架,綜合EAD 模型執行基準,完成對EAD 模糊聚類(lèi)整合模型的構建,細化信息資源的整合效果。
1.4 分布式自適應處理實(shí)現信息資源整合
在完成對EAD 模糊聚類(lèi)整合模型的構建之后,接下來(lái),需要采用分布式自適應處理,實(shí)現信息資源整合。首先,采用模糊聚類(lèi)分析的方式,將所屬的信息資源依據特征或者屬性劃分為不同額定整合區域,設定整合目標為動(dòng)態(tài),依據虛擬整合的范圍,對定向目標作出更改和調整,計算出信息資源整合的隸屬度,具體如式(5)所示。
K=3.5T+(7y?1) (5)
式(5)中: K表示隸屬度; T表示質(zhì)心聚類(lèi)系數; y表示歐氏距離。通過(guò)上述計算,最終可以得出實(shí)際的隸屬度。與此同時(shí),利用所得的隸屬度,布設自適應模糊整合區域,細化引導的指令,采用EAD 模糊聚類(lèi)整合模型測定出此時(shí)電子信息的自適應程度,具體如式(6)所示。
F=5W?1.5+6G (6)
式(6)中: F 表示自適應程度; W表示定向資源分析速度; G 表示特征向量。通過(guò)上述計算,最終可以得出實(shí)際的自適應程度,依據得出的自適應程度,布設信息資源的整合層級,采用分布式的整合方式,對信息資源定向分類(lèi),結合模糊聚類(lèi)法實(shí)現最終的整合分析。構建對應的信息資源整合環(huán)節,具體如圖2所示。
圖2 信息資源整合環(huán)節
2 方法測試
為了驗證本文提出的基于模糊聚類(lèi)的電子信息資源整合方法在實(shí)際應用中的效果,選取A 數據庫作為測試的主要目標,通過(guò)在Matlab 軟件進(jìn)行測試分析。分別設定傳統LAM 信息資源整合測試組、傳統改進(jìn)ORM信息資源整合測試組以及本文所設計的模糊聚類(lèi)信息資源整合測試組。采用對比的方式,確保3 種方法在相同的環(huán)境之下同時(shí)測試,最終得出的結果以對比的方式展開(kāi)分析,接下來(lái),進(jìn)行測試環(huán)境的搭建。
2.1 測試準備
在對模糊聚類(lèi)下電子信息資源整合方法的實(shí)際應用效果進(jìn)行分析與研究,需要先搭建相關(guān)的測試環(huán)境。根據測定的實(shí)際需求以及執行標準,先對測試基礎指標參數進(jìn)行預設,具體如下表2所示。
表2 基礎指標參數預設表
根據表2,可以完成對基礎指標參數的預設。實(shí)驗數據主要針對RBI、AWS、UCI、KDD Cup、MovieLens相關(guān)數據。
表3 數據集
隨后,利用測定的設備,營(yíng)造相應的信息整合環(huán)境。為進(jìn)一步確保信息資源整合的穩定性,采用無(wú)線(xiàn)局域網(wǎng)的通信模式,結合模糊聚類(lèi)框架,對數據資源的基礎整合情況作出分析,具體如圖3所示。
圖3 信息資源整合程度對比分析圖示
根據圖3,可以完成對信息資源整合程度的對比分析。調整信息資源的單元處理速度,調整整合處理標準,完成對測試環(huán)境的搭建。核定測試的設備與網(wǎng)絡(luò )是否處于穩定的運行狀態(tài),同時(shí)確保不存在影響最終測試結果的外部因素,核定無(wú)誤后,開(kāi)始具體的測定分析。
2.2 測試過(guò)程及結果分析
在完成對上述測試環(huán)境的搭建之后,接下來(lái),需要進(jìn)行具體的測試。首先,為了提升信息資源整合的速度,本文選擇使用指令引導的方式,關(guān)聯(lián)對應的局域網(wǎng)和數據庫,在網(wǎng)絡(luò )中尋找所需要的信息資源,并采用特殊的格式,按照指令的歸納順序,分批次導入數據庫的對應位置中,結合數據的種類(lèi),劃定對應的處理階層,獲取基礎指標數值。計算信息資源的整合定向范圍,具體如式(7)所示。
(7)
式7中: Y表示整合定向范圍; V表示單向引導距離。通過(guò)上述計算,最終可以得出實(shí)際的整合定向范圍。在標定的范圍之內,結合模糊聚類(lèi)方式,將所屬的信息資源整合,劃歸至對應的整合層級之中。在模糊聚類(lèi)分析背景下,構建批量信息資源的整合環(huán)節,具體如圖4所示。
圖4 信息資源模糊聚類(lèi)整合環(huán)節設計圖示
根據圖4,可以完成對信息資源模糊聚類(lèi)整合環(huán)節的設計。與此同時(shí),關(guān)聯(lián)無(wú)線(xiàn)局域網(wǎng)絡(luò ),構建定向的信息整合程序,賦予每一個(gè)層級對應的聚類(lèi)指令,營(yíng)造穩定的信息處理整合環(huán)境。隨后,將測試數據庫與XML數據中心相關(guān)聯(lián),可以更好地完成局部數據模式向全局數據模式的定向轉化,實(shí)現信息資源的適配處理之后,對數據庫中的元數據定義,將所選擇的數據劃定為4 個(gè)小組,每一個(gè)小組的數據量均不同,利用模糊聚類(lèi)分析法,對電子信息資源整合的響應時(shí)間計算,具體如式(8)所示。
M=3b-0.2+ (8)
式8中:M 表示響應時(shí)間; b 表示定向測定距離;g表示虛擬迭代次數。通過(guò)上述計算,最終可以得出實(shí)際的響應時(shí)間。對得出的結果對比分析,如表3 所示。
表3 測試結果對比分析表
根據表3,可以完成對測試結果的對比分析:與傳統的LAM 信息資源整合測試組及傳統改進(jìn)ORM 信息資源整合測試組相對比,本文所設計的模糊聚類(lèi)信息資源整合測試組最終得出的響應時(shí)間相對較為迅速,表明在對電子信息資源整合的處理上,效率較高,誤差較小,整合環(huán)節得到了更好地處理,具有實(shí)際的應用價(jià)值。
3 結束語(yǔ)
綜上所述,便是對基于模糊聚類(lèi)的電子信息資源整合方法的分析和研究。對比于傳統的信息資源整合方法,本文在模糊聚類(lèi)分析的輔助之下,構建更為靈活、多變的信息整合模式,在復雜的背景環(huán)境之下,可以更為迅速、清晰地完成目標任務(wù)的處理,最大程度降低信息整合誤差的發(fā)生概率,與網(wǎng)絡(luò )相關(guān)聯(lián),形成動(dòng)態(tài)的信息處理程序,通過(guò)指令引導,營(yíng)造一個(gè)穩定、安全的處理環(huán)境,更加符合現代化發(fā)展的需求,促使信息資源整合配置更為高效,通信效率大幅提升,發(fā)展前景廣闊。
參考文獻:
[1]朱智斌. 大數據背景下不動(dòng)產(chǎn)登記檔案信息資源整合方法研究[J]. 城建檔案,2020,14(12):109-110.
[2]孟學(xué)堯,郭倩倩,郭海儒. 一種改進(jìn)螢火蟲(chóng)算法的模糊聚類(lèi)方法[J]. 小型微型計算機系統,2021,42(6):1165-1170.
[3]王慧,王海江,高攀,等. 新疆生產(chǎn)建設兵團農業(yè)資源數據采集與整合方法研究[J].農業(yè)大數據學(xué)報, 2021,3(2):31-41.
[4]顧羽. 基于FCM模糊聚類(lèi)方法以變電站為單元的電力系統負荷分類(lèi)研究[J]. 機電信息,2020, 25(33):22-23+25.
[5]熊學(xué)鋒,彭小慶,曹鑫. 基于改進(jìn)ORM的Oracle數據庫異構資源整合方法研究[J]. 電子設計工程,2020,28(21):38-41 +46.
[6]張小靜,楊曉靈,劉青松. 數字轉型背景下科研檔案資源整合實(shí)踐路徑和方法研究[J]. 城建檔案,2021, 34(12):44-45.
[7]馮國禮,李蓉,吳雙. 基于人工智能技術(shù)的電力信息系統運維數據整合方法[J]. 電力信息與通信技術(shù), 2022, 20(1): 68-73.
[8]賈君枝. LAM館藏資源的元數據整合方法比較分析[J]. 檔案學(xué)研究,2022, 21(1):79-84.
(本文來(lái)源于《電子產(chǎn)品世界》雜志2023年7月期)
評論