<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 工控自動(dòng)化 > 設計應用 > 基于網(wǎng)絡(luò )設備的網(wǎng)頁(yè)過(guò)濾的設計

基于網(wǎng)絡(luò )設備的網(wǎng)頁(yè)過(guò)濾的設計

作者：時(shí)間：2011-03-25 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

　　3.4 TF-IDF 權值計算

　　TF-IDF 計算公式：

　　其中TF（x,d）表示特征x在網(wǎng)頁(yè)d中出現的頻率，IDF（x）表示為，N是總共的訓練樣本數，df （x）為包含特征x 的樣本數。

　　3.5 改進(jìn)的權值計算公式

　　從TF-IDF 計算公式可以看出，TF-IDF 計算公式是將一個(gè)樣本簡(jiǎn)單的分解為若干特征，只是針對文本的內容，沒(méi)有從文本的結構組成上考慮各特征的權值。

　　實(shí)際上，在一個(gè)HTML 結構文檔中，在之間，,以及一些其他的標簽之間出現的特征，相對于其他普通的正文，具有更重要的意義，因此對這些標簽之間的特征要給予比較大的權值，而對于其他普通的正文給予權重比較小?？紤]到HTML 的這種結構化特性，對TF-IDF 權值計算進(jìn)行一些改進(jìn)。

　　以下是設計的一個(gè)簡(jiǎn)單的位置——權值等級對應表，權值的選擇可由實(shí)際情況具體而定。

表1 特征位置與權值對應表

特征位置與權值對應表

　　一個(gè)詞在一個(gè)網(wǎng)頁(yè)中出現的頻率越高，表示該詞在這個(gè)網(wǎng)頁(yè)中更重要。根據IDF，一個(gè)詞的重要與包含它的網(wǎng)頁(yè)數量成反比。一個(gè)特征x 在第i 個(gè)等級中的頻率如下表示：

　　其中Nxi 表示某個(gè)詞x 出現在等級i 中間的次數， Nx 表示詞x 出現在該網(wǎng)頁(yè)中總的次數。

　　權值的計算：

　　其中Wi 為特征等級為i 時(shí)，對應的加權系數。

　　3.6 KNN 算法

　　K-近鄰法的原理：在訓練樣本集中，找出與待分類(lèi)的網(wǎng)頁(yè)相鄰最近的K 個(gè)訓練樣本，找出K 個(gè)近鄰中樣本數最多的類(lèi)別c，就判斷待分類(lèi)樣本為c 類(lèi)。這里采用相似度作為計算距離的依據，相似的計算根據兩個(gè)樣本之間的夾角的余弦值來(lái)判斷。

　　根據此公式，計算出待測樣本x 與所有訓練樣本的距離，從而找出與x 距離最近的K 個(gè)訓練樣本，根據這K 個(gè)樣本的所屬類(lèi)別，確定待測樣本x 的所屬類(lèi)別。

　　3.7 內容過(guò)濾流程

　　為了不給用戶(hù)造成比較明顯的延遲，采用“第一次放過(guò)”的策略。先并不攔截該響應報文，只是復制一份應用層信息，在整個(gè)響應報文傳輸完成之后，對復制的一份完整報文進(jìn)行內容過(guò)濾操作；如果判斷報文內容是非法的，則將對應的請求報文的URL 信息添加到黑名單中，如果檢查認為是合法的，則允許該連接持續，并將URL 信息添加到白名單中。

　　4 結語(yǔ)

　　通過(guò)實(shí)驗分析，在過(guò)濾時(shí)間上，URL 過(guò)濾階段白名單匹配速度提高了53%,在黑名單的匹配中，速度提高了80%。在內容過(guò)濾階段，由于采用的“第一次放過(guò)”策略，不會(huì )給用戶(hù)帶來(lái)延遲。既能在一定程度滿(mǎn)足網(wǎng)絡(luò )延遲的要求，又能改善用戶(hù)的互聯(lián)網(wǎng)環(huán)境。但仍然存在一些需要改進(jìn)的地方：該過(guò)濾系統是部署在網(wǎng)絡(luò )設備之上，網(wǎng)絡(luò )設備作為網(wǎng)絡(luò )節點(diǎn)，擔負著(zhù)繁重的數據交換任務(wù)，考慮到這些，沒(méi)有對返回的報文進(jìn)行實(shí)時(shí)的分析，而是采用“第一次放過(guò)”的過(guò)濾策略；此外，采用向量空間模型來(lái)表示，其缺點(diǎn)在于特征項之間線(xiàn)性無(wú)關(guān)的假設，因此可以考慮特征項之間的關(guān)聯(lián)性等，對該文本表示模型進(jìn)行更加精確的表示。

上一頁(yè) 1 2 3 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 網(wǎng)絡(luò )設備

評論

相關(guān)推薦

嵌入式分布系統中網(wǎng)絡(luò )設備的時(shí)間同步

嵌入式系統嵌入式分布系統網(wǎng)絡(luò )設備 VxWorks | 2013-01-23

嵌入式分布系統中網(wǎng)絡(luò )設備的時(shí)間同步

設計方案嵌入式分布系統網(wǎng)絡(luò )設備 VxWorks | 2015-06-24

新型浪涌保護器在樓宇控制系統中的應用

電源與新能源浪涌電磁兼容性電涌保護器網(wǎng)絡(luò )設備 | 2011-12-18

TD-SCDMA與TD-LTE共享平臺

TD-SCDMA TD-LTE 共享平臺網(wǎng)絡(luò )設備 | 2011-09-09

歐盟指責華為中興傾銷(xiāo)

手機與無(wú)線(xiàn)通信華為網(wǎng)絡(luò )設備無(wú)線(xiàn) | 2012-12-09

一種WPAN網(wǎng)絡(luò )設備方案

嵌入式系統方案網(wǎng)絡(luò )設備 WPAN 一種 | 2011-08-28

求助：想自己做一個(gè)嵌入式網(wǎng)絡(luò )設備，請大家指點(diǎn)一下

jackwang | 2006-09-17

QNX操作系統及網(wǎng)絡(luò )設備驅動(dòng)模塊

資源下載網(wǎng)絡(luò )設備驅動(dòng)模塊 | 2009-11-09

Linux系統網(wǎng)絡(luò )設備驅動(dòng)程序

資源下載 Linux系統網(wǎng)絡(luò )設備設備驅動(dòng)程序 | 2007-02-28

Wickmann面向電信網(wǎng)絡(luò )設備推出PPTC自復位保險絲

zhangwde | 2006-01-05

“棱鏡門(mén)”致思科在華業(yè)務(wù)受沖擊華為受益

網(wǎng)絡(luò )與存儲華為網(wǎng)絡(luò )設備 | 2013-06-27

Marvell入選Wi-Fi聯(lián)盟的Wi-Fi認證TDLS試驗項目

手機與無(wú)線(xiàn)通信 Marvell Wi-Fi 網(wǎng)絡(luò )設備 | 2012-08-28

DeviceAndModule

資源下載設備管理模塊機制 Devfs注冊塊設備請求隊列網(wǎng)絡(luò )設備 | 2009-06-14

RF Code發(fā)布RFID網(wǎng)絡(luò )設備開(kāi)發(fā)者套件

sanhey | 2006-02-15

利用科來(lái)網(wǎng)絡(luò )回溯分析技術(shù)診斷網(wǎng)絡(luò )設備異常丟包故障

設計方案網(wǎng)絡(luò )回溯分析網(wǎng)絡(luò )設備 CRC 校驗碼錯誤 | 2015-08-06

中國電信否認將大規模購買(mǎi)IP網(wǎng)絡(luò )設備

hpnet | 2002-12-06

IP網(wǎng)絡(luò )測試技術(shù)提高高帶寬無(wú)線(xiàn)網(wǎng)絡(luò )設備開(kāi)發(fā)水平

手機與無(wú)線(xiàn)通信無(wú)線(xiàn) 網(wǎng)絡(luò )設備開(kāi)發(fā) 水平帶寬提高網(wǎng)絡(luò ) 測試技術(shù) IP | 2012-06-08

網(wǎng)絡(luò )設備采購方式悄然轉型：中國ODM廠(chǎng)商受寵

網(wǎng)絡(luò )與存儲思科 ODM 網(wǎng)絡(luò )設備 | 2012-04-04

[zz]風(fēng)河網(wǎng)絡(luò )設備平臺（PNE）提升網(wǎng)絡(luò )性能

唐朝 | 2003-10-17

飛思卡爾 -安全可靠，面向未來(lái)物聯(lián)網(wǎng)的嵌入式處理解決方案

視頻飛思卡爾嵌入式處理解決方案汽車(chē)電子消費電子工業(yè)電子網(wǎng)絡(luò )設備 MCU 單片機微處理器傳感器模擬IC 連接器件物聯(lián)網(wǎng) 半導體 | 2015-01-14

自動(dòng)化通信設備的故障分類(lèi)及檢修方法

電源與新能源通信設備網(wǎng)絡(luò )設備故障分析 | 2011-10-24

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>