七大統計模型詳解
四、判別分析
本文引用地址:http://dyxdggzs.com/article/201812/395418.htm1、概述
判別分析是基于已知類(lèi)別的訓練樣本,對未知類(lèi)別的樣本判別的一種統計方法,也是一種有監督的學(xué)習方法,是分類(lèi)的一個(gè)子方法!

具體是:在研究已經(jīng)過(guò)分類(lèi)的樣本基礎上,根據某些判別分析方法建立判別式,然后對未知分類(lèi)的樣本進(jìn)行分類(lèi)!
2、判別方法
根據判別分析方法的不同,可分為下面幾類(lèi):
(1) 距離判別法
(2) Fisher判別法
(3) Bayes判別法
(4) 逐步判別法
比較常用的是Bayes判別法和逐步判別法
3、 注意事項:
判別分析主要針對的是有監督學(xué)習的分類(lèi)問(wèn)題。這里重點(diǎn)注意其優(yōu)缺點(diǎn):
(1) 距離判別方法簡(jiǎn)單容易理解,但是它將總體等概率看待,沒(méi)有差異性;
(2) Bayes判別法有效地解決了距離判別法的不足,即:其考慮了先驗概率——所以通常這種方法在實(shí)際中應用比較多!
(3) 判別分析要求給定的樣本數據必須有明顯的差異,在進(jìn)行判別分析之前,應首先檢驗各類(lèi)均值是不是有差異,如果檢驗后某兩個(gè)總體的差異不明顯,應將這兩個(gè)總體合為一個(gè)總體,再由剩下的互不相同的總體重現建立判別分析模型。
(4)Fisher判別法和bayes判別法的使用要求:兩者對總體的數據的分布要求不同,Fisher要求對數據分布沒(méi)有特殊要求,而bayes則要求數據分布是多元正態(tài)分布,但實(shí)際中卻沒(méi)有這么嚴格!
五、主成分分析
1、概述
主成分分析是一種降維數的數學(xué)方法,具體就是,通過(guò)降維技術(shù)將多個(gè)變量化為少數幾個(gè)主成分的統計分析方法。
在建模中,主要用于降維,系統評估,回歸分析,加權分析等等。
2、分類(lèi)(無(wú))
3、注意事項
在應用主成分分析時(shí)候,應該注意:
(1) 綜合指標彼此獨立或者不相互干涉
(2) 每個(gè)綜合指標所反映的各個(gè)樣本的總信息量等于對應特征向量的特征值。通常要選取的綜合指標的特征值貢獻率之和應為80%以上
(3) 其在應用上側重于信息貢獻影響力的綜合評價(jià)
(4) 當主成分因子負荷的符號有正也有負的時(shí)候,綜合評價(jià)的函數意義就不明確!
六、因子分析
1、概述
因子分析是將變量總和為數量較少的幾個(gè)因子,是降維的一種數學(xué)技術(shù)!
它和主成分分析的最大區別是:其是一種探索性分析方法,即:通過(guò)用最少個(gè)數的幾個(gè)不可觀(guān)察的變量來(lái)說(shuō)明出現在可觀(guān)察變量中的相關(guān)模型,它提供了一種有效的利用數學(xué)模型來(lái)解釋事物之間的關(guān)系,體現出數據挖掘的一點(diǎn)精神!
2、分類(lèi)
R型因子分析,即對變量的研究,此為常用
Q型因子分析,即對樣本的研究
3、因子分析和主成分分析的區別和聯(lián)系
(1) 兩者都是降維數學(xué)技術(shù),前者是后者的推廣和發(fā)展
(2) 主成分分析只是一般的變量替換,其始終是基于原始變量研究數據的模型規律;而因子分析則是通過(guò)挖掘出新的少數變量,來(lái)研究的一種方法,有點(diǎn)像數據挖掘中的未知關(guān)聯(lián)關(guān)則發(fā)現!
七、時(shí)間序列
1、概述
時(shí)間序列預測法是一種定量分析方法,它是在時(shí)間序列變量分析的基礎上,運用一定的數學(xué)方法建立預測模型,使時(shí)間趨勢向外延伸,從而預測未來(lái)市場(chǎng)的發(fā)展變化趨勢,確定變量預測值。
基本特點(diǎn)是:假定事物的過(guò)去趨勢會(huì )延伸到未來(lái);預測所依據的數據具有不規則性;撇開(kāi)市場(chǎng)發(fā)展之間的因果關(guān)系。

2、分類(lèi)
時(shí)間序列的變動(dòng)形態(tài)一般分為四種:
長(cháng)期趨勢變動(dòng)
季節變動(dòng)
循環(huán)變動(dòng)
不規則變動(dòng)
方法分類(lèi):
(1) 平均數預測
(2) 移動(dòng)平均數預測
(3) 指數平滑法預測
(4) 趨勢法預測
(5) 季節變動(dòng)法
評論