<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 手機與無(wú)線(xiàn)通信 > 設計應用 > 基于改進(jìn)平衡Winnow算法的短信過(guò)濾系統

基于改進(jìn)平衡Winnow算法的短信過(guò)濾系統

作者：時(shí)間：2011-01-20 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

2 構造分類(lèi)器

訓練分類(lèi)器是研究的重點(diǎn)，采用Balanced Winnow 算法并對其進(jìn)行改進(jìn)。

2.1 Winnow 分類(lèi)算法

Winnow 算法是二值屬性數據集上的線(xiàn)性分類(lèi)算法。線(xiàn)性分類(lèi)問(wèn)題中表示分類(lèi)界限的超平面等式如下：

w0α0+w1α1+w2α2+…+wkαk=0 ，其中：α0，α1，…，αk分別是屬性的值；w0，w1， …，wk是超平面的權值。如果其值大于0 ，則預測為第一類(lèi)否則為第二類(lèi)。

Winnow 算法是錯誤驅動(dòng)型的分類(lèi)算法，即當出現錯分的實(shí)例時(shí)才更新權值向量。設定兩個(gè)學(xué)習系數α 和β(其中α＞1，β＜1) ，通過(guò)將權值乘以參數α( 或β) 來(lái)分別修改權值。

2.2 Balanced Winnow 分類(lèi)算法

標準的Winnow 算法不允許有負的權值，于是就有了另一個(gè)稱(chēng)為平衡的Winnow 版本，允許使用負的權值。

對Winnow 算法的基本形式，權重向量的每一維都是正數。Balanced Winnow 是用w+-w-代替w，當

則將實(shí)例歸為該類(lèi)。Balanced Winnow 的權重更新策略為：

(1) 如果

，但文本不屬于該類(lèi)，則要降低權重：　　對j=1，，…，d，如果xj≠0 ，則xj≠0 ， w+j =βw+j ，w-j =αw-j ，α＞1，0＜β＜1。

(2) 如果

但文本應屬于該類(lèi)，則要提高權重：　　對j=1，2，…，d，如果xj≠0，則w+j =αw+j ，w-j =βw-j ，α＞1，0＜β＜1。

在實(shí)驗中，采用文獻[7] 中統一α 和β 為一個(gè)參數的方法，令β=1/α，沒(méi)有影響分類(lèi)效果，但有效簡(jiǎn)化了參數的選擇?？梢詾椴煌念?lèi)別確定不同的θ 值，但實(shí)驗表明：對于不同的類(lèi)別選擇同樣的θ 值，結果幾乎是一樣的，所以在每次獨立的實(shí)驗中都取相同的θ 值，大小是訓練文本所含的平均特征數，而初始的w+和w-分別取全2 和全1 向量。

在平衡Winnow 算法中，一旦參數α、β 和閾值θ 確定下來(lái)后，將在訓練過(guò)程中不斷更新權重向量w+和w-至最適合這組參數。因此對參數的依賴(lài)較小，需要手工調整的參數不多。

2.3 去除野點(diǎn)

在短信過(guò)濾中，短信樣本是由手動(dòng)或自動(dòng)方式收集的，收集的過(guò)程中難免會(huì )出錯，因此短信樣本集中可能存在一些被人為錯分的樣本點(diǎn)，即野點(diǎn)。這些野點(diǎn)在訓練時(shí)，會(huì )使得分類(lèi)器產(chǎn)生嚴重的抖動(dòng)現象，降低分類(lèi)器的性能。因此，好的分類(lèi)器應具有識別野點(diǎn)的能力。

對于Winnow 算法，若樣本中存在野點(diǎn)，則野點(diǎn)在訓練時(shí)以較大的概率出現在兩分類(lèi)線(xiàn)之外，且分類(lèi)錯誤。

這些野點(diǎn)對分類(lèi)器的訓練過(guò)程產(chǎn)生很大的影響，可能會(huì )造成分類(lèi)器的“ 過(guò)度學(xué)習” 。因此引入損失函數，按照損失函數的定義，這些野點(diǎn)損失較大，因此可以通過(guò)給損失函數設置一個(gè)上界函數來(lái)處理線(xiàn)性分類(lèi)器中的野點(diǎn)問(wèn)題，如圖1 所示。

圖1 所示為兩類(lèi)線(xiàn)性可分情況，圖中實(shí)心點(diǎn)和空心點(diǎn)分別表示兩類(lèi)訓練樣本，H 為兩類(lèi)樣本沒(méi)有被錯誤地分開(kāi)的分類(lèi)線(xiàn)，H1 和H2 分別為平行于分類(lèi)線(xiàn)H 且與分類(lèi)線(xiàn)H 的距離為單位距離的兩條直線(xiàn)。直線(xiàn)G(t)為平衡Winnow 算法中第t 輪迭代后損失函數的上界線(xiàn)。該上界線(xiàn)是關(guān)于迭代次數t 的函數，因此可以將該上界線(xiàn)G(t)對應的上界函數記為g(t)。從圖1 可知，在直線(xiàn)G(t)左下側誤分樣本的損失較少，可以認為這些誤分樣本是由于當前分類(lèi)器的性能較低而誤分的；在直線(xiàn)G(t) 右上側誤分的樣本由于在第t 輪迭代后損失仍較大，則可以認為這些誤分的樣本是野點(diǎn)。根據線(xiàn)性分類(lèi)器和野點(diǎn)的性質(zhì)可知，上界函數g(t)具有以下性質(zhì)：

(1) 隨著(zhù)Winnow 算法中迭代次數t 的增加，上界函數g(t) 單調遞減，并且遞減的速率也隨著(zhù)t 的增加而遞減，即上界函數的導數g(t)為單調遞減函數；(2) 上界函數既不能太大，也不能太小。太大會(huì )降低判斷野點(diǎn)的能力，太小則會(huì )誤判正常樣本為野點(diǎn)。

根據上界函數的這些特性，可以考慮一個(gè)平行于分類(lèi)線(xiàn)H 的線(xiàn)性函數作為損失函數的上界函數。即g(t)=

其中：ε 為常數值；直線(xiàn)G(t) 平行于分類(lèi)線(xiàn)H；η 為損失因子，也稱(chēng)為學(xué)習率，可以在訓練分類(lèi)器的時(shí)候指定其值。

在每一輪訓練中，若該樣本的G(t) 值大于分類(lèi)線(xiàn)的值，并且超過(guò)一定的閾值，且不屬于該類(lèi)，則判定該樣本具有野點(diǎn)的性質(zhì)，應當在訓練集中將該樣本去除，以便提高下一輪訓練的準確性。這樣不僅有效削弱了分類(lèi)器的抖動(dòng)現象，而且提高了分類(lèi)器的性能。

上一頁(yè) 1 2 3 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 驅動(dòng)

評論

相關(guān)推薦

CWl840驅動(dòng)雙晶體管的單端正激變換式開(kāi)關(guān)穩壓電路

設計方案 CWl840 驅動(dòng) 晶體管單端正端正變換式開(kāi)關(guān) 穩壓 | 2009-07-06

消息稱(chēng)英偉達在最新的驅動(dòng)中取消了 RTX 30 顯卡挖礦限制

網(wǎng)絡(luò )與存儲英偉達 RTX 30 顯卡驅動(dòng) | 2022-10-14

試驗六：Flash驅動(dòng)

資源下載 CNASIC NOR Flash NAND FLASH GARFIELD 驅動(dòng) | 2007-02-09

Vxworks下驅動(dòng)程序編寫(xiě)(老站轉)

amine | 2002-05-28

電動(dòng)汽車(chē)逆變器用IGBT驅動(dòng)電源設計

電源與新能源開(kāi)關(guān)電源驅動(dòng) | 2018-08-20

[轉帖]Vxworks串口驅動(dòng)編寫(xiě)實(shí)例解讀

amine | 2002-05-26

電子科技大學(xué)--嵌入式系統應用開(kāi)發(fā)技術(shù)33

視頻嵌入式應用軟件 USB Mouse 驅動(dòng) | 2009-05-06

有負載驅動(dòng)能力的乘法器(MPY600)

設計方案有負載驅動(dòng) 能力乘法器 MPY600 | 2009-07-06

第0課第7節_剛接觸開(kāi)發(fā)板之制作根文件系統及初試驅動(dòng)

視頻 2440裸板 Linux 驅動(dòng) | 2013-10-14

電機控制應用不斷迭代，ST平臺化方案滿(mǎn)足碎片化需求

工控自動(dòng)化電機驅動(dòng) MCU | 2020-06-22

TFT LCD液晶顯示器的驅動(dòng)原理

資源下載液晶 TFT LCD顯示器驅動(dòng) | 2008-01-06

第12課第2.2節字符設備驅動(dòng)程序之LED驅動(dòng)程序_測試改進(jìn)

視頻 2440裸板 Linux LED 驅動(dòng) | 2013-10-21

超結高壓MOSFET驅動(dòng)電路及EMI設計

電源與新能源 202106 超結驅動(dòng) EMI 非線(xiàn)性 MOSFET | 2021-07-14

OPA502構成的橋氏驅動(dòng)電路

設計方案 OPA502 構成橋氏驅動(dòng) 電路 | 2009-07-06

聚積科技賦能幻映紀元推動(dòng)影視產(chǎn)業(yè)「文藝復興」

光電顯示 LED 驅動(dòng) | 2022-05-26

基于驅動(dòng)LED串的DCM升壓轉換器的詳細理論分析

光電顯示驅動(dòng) DCM 升壓轉換器 LED串 | 2018-08-28

大功率開(kāi)關(guān)電源中功率MOSFET的驅動(dòng)技術(shù)

資源下載開(kāi)關(guān)電源 MOSFET 驅動(dòng) | 2007-02-09

MPS做一體化電機驅動(dòng)方案有三絕招

工控自動(dòng)化電機驅動(dòng) | 2019-04-16

IGBT的驅動(dòng)與保護技術(shù)

資源下載 IGBT 驅動(dòng) 保護 | 2007-02-16

如何在嵌入式LINUX中增加自己的設備驅動(dòng)程序

jackwang | 2002-06-19

MOS管驅動(dòng)電路設計

MOS管驅動(dòng) 電路設計 | 2023-09-30

馬達驅動(dòng)電路

資源下載馬達驅動(dòng) 驅動(dòng)電路 | 2007-12-24

vxworks中編寫(xiě)串口驅動(dòng)？(老站轉)

amine | 2002-06-01

可控硅驅動(dòng)放大電路

設計方案可控硅驅動(dòng) 放大電路 | 2009-07-06

如何驅動(dòng)一個(gè)直流電機？直流電機驅動(dòng)電路大全

工控自動(dòng)化直流電機驅動(dòng) | 2019-09-18

驅動(dòng)50Ω負載的線(xiàn)性放大器

設計方案驅動(dòng) 負載線(xiàn)性放大器 | 2009-07-06

如何在嵌入式LINUX中增加自己的設備驅動(dòng)程序

jackwang | 2002-05-21

第12課第2.1節字符設備驅動(dòng)程序之LED驅動(dòng)程序_編寫(xiě)編譯

視頻 2440裸板 Linux LED 驅動(dòng) | 2013-10-21

第12課第1節字符設備驅動(dòng)程序之概念介紹

視頻 2440裸板 Linux 驅動(dòng) | 2013-10-21

干貨碼住丨深度剖析IGBT柵極驅動(dòng)注意事項

IGBT 柵極驅動(dòng) | 2023-07-27

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>