基于改進(jìn)遺傳算法的支持向量機特征選擇
在種群規模為30,交叉率為0.8,起始變異率為0.1的條件下使用支持向量機作為分類(lèi)器(懲罰參數為13.7,徑向基核函數參數為10.6)對所選數據進(jìn)行分類(lèi),表1中顯示了本文算法與文獻[11]中幾種算法在分類(lèi)效果上的對比,表2給出了三種數據的最終選擇結果。表1中共出現了四種方法:方法1:使用本文算法;方法2:使用NGA/PCA方法;方法3:使用PCA方法;方法4:使用簡(jiǎn)單遺傳算法。
本文引用地址:http://dyxdggzs.com/article/105942.htm由于本文算法旨在用最少的特征個(gè)數最大化分類(lèi)正確率,因此從表1中可以看出本文算法在特征選擇個(gè)數和分類(lèi)正確率上均比其他三種方法更具優(yōu)勢。由于NGA/PCA算法是針對簡(jiǎn)單遺傳算法和主成分分析法的不足而做的改進(jìn),其性能優(yōu)于簡(jiǎn)單遺傳算法和主成分分析法,所以本文算法的分類(lèi)效果優(yōu)于NGA/PCA算法這一事實(shí)更能說(shuō)明該算法可以較好地解決支持向量機的特征選擇問(wèn)題。
結語(yǔ)
通過(guò)與其他方法的比較,本文算法的分類(lèi)效果得到了充分的驗證,也說(shuō)明了該算法具有極好的泛化能力以及在敏感度信息量地指導下遺傳操作的有效性。
適應度函數的設計至關(guān)重要,它直接影響到最終結果的優(yōu)劣以及算法的收斂性,所以在適應度函數的設計應考慮所解決問(wèn)題的側重點(diǎn)。
分類(lèi)正確率的高低不僅取決于合理的特征選擇,而且與支持向量機的參數優(yōu)化有關(guān)。只有在合理的特征選擇和參數優(yōu)化的前提下,支持向量機分類(lèi)器才能發(fā)揮出最佳的分類(lèi)效果。
由于算法能夠較好地解決支持向量機的特征選擇問(wèn)題,因此已被應用在基于支持向量機的數字電路板故障診斷當中,并取得了良好的效果。
參考文獻:
[1] 張學(xué)工. 關(guān)于統計學(xué)習理論與支持向量機[J].自動(dòng)化學(xué)報,2000,26(1):33-41
[2] Seo K K. A GA-Based Feature Subset Selection and Parameter Optimization of Support Vector Machine for Content – Based Imag Retrieval[J].ADMA2007,2007:594-604
[3] Frohlich H, et al. Feature selection for support vector machines by means of genetic algorithm [C]. In 15th IEEE . Internati onal Conference on Tools with Artificial Intelligence, 2003: 142 - 148
[4] Suna Z, Bebisa G, Millerb R. Object detection using feature subset selection [ J ]. Pattern Recognition, 2004, 37 (1) : 2165 - 2176
[5] 史東鋒,屈梁生. 遺傳算法在故障特征選擇中的應用研究[J]. 振動(dòng)、測試與診斷, 2000,20(3):171-176
[6] 劉清坤, 闕沛文, 郭華偉等. 基于支持向量機和特征選擇的超聲缺陷識別方法研究[J]. 中國機械工程, 2006,17(1):9-11
[7] 張昊, 陶然, 李志勇等. 基于自適應模擬退火遺傳算法的特征選擇方法[J]. 兵工學(xué)報, 2009,30(1):81-85
[8] 劉素華, 侯惠芳, 李小霞. 基于遺傳算法和模擬退火算法的特征選擇方法. 計算機工程[J], 2005,31(16):157-159
[9] 楊淑瑩. 模式識別與智能計算——Matlab技術(shù)實(shí)現[M]. 北京:電子工業(yè)出版社, 2008
[10] 肖健華. 智能模式識別方法[M].廣州:南洋理工出版社, 2006
[11] 孫見(jiàn)青, 汪榮貴, 胡韋偉等. 一種新的基于NGA/PCA和SVM的特征提取方法[J]. 系統仿真學(xué)報, 2007,19(20):4823-4826
評論