七大統計模型詳解
一、多元回歸
本文引用地址:http://dyxdggzs.com/article/201812/395418.htm1、概述:
在研究變量之間的相互影響關(guān)系模型時(shí)候,用到這類(lèi)方法,具體地說(shuō):其可以定量地描述某一現象和某些因素之間的函數關(guān)系,將各變量的已知值帶入回歸方程可以求出因變量的估計值,從而可以進(jìn)行預測等相關(guān)研究。

2、分類(lèi)
分為兩類(lèi):多元線(xiàn)性回歸和非線(xiàn)性線(xiàn)性回歸;
其中非線(xiàn)性回歸可以通過(guò)一定的變化轉化為線(xiàn)性回歸,比如:y=lnx 可以轉化為y=u u=lnx來(lái)解決;
3、 注意事項
在做回歸的時(shí)候,一定要注意兩件事:
(1) 回歸方程的顯著(zhù)性檢驗
(2) 回歸系數的顯著(zhù)性檢驗
檢驗是很多學(xué)生在建模中不注意的地方,好的檢驗結果可以體現出你模型的優(yōu)劣,這點(diǎn)一定要注意。
1、概述:
聚類(lèi)分析指將物理或抽象對象的集合分組為由類(lèi)似的對象組成的多個(gè)類(lèi)的分析過(guò)程。

2、分類(lèi)
聚類(lèi)主要有三種:
(1) K均值聚類(lèi)
(2) 系統聚類(lèi)
(3)二階聚類(lèi)
類(lèi)的距離計算方法:
(1) 最短距離法
(2) 最長(cháng)距離法
(3) 中間距離法
(4) 重心法
(5) 類(lèi)平均法
(6) 可變類(lèi)平均法
(7) 可變法
(8) 利差平均和法
3、注意事項
在樣本量比較大時(shí),要得到聚類(lèi)結果就顯得不是很容易,這時(shí)需要根據背景知識和相關(guān)的其他方法輔助處理。
還需要注意的是:如果總體樣本的顯著(zhù)性差異不是特別大的時(shí)候,使用的時(shí)候也要注意!
三、分類(lèi)
1、概述
分類(lèi)是一種典型的有監督的機器學(xué)習方法,其目的是從一組已知類(lèi)別的數據中發(fā)現分類(lèi)模型,以預測新數據的未知類(lèi)別。

這里需要說(shuō)明的是:預測和分類(lèi)是有區別的,預測是對數據的預測,而分類(lèi)是類(lèi)別的預測。
2、常用分類(lèi)模型:
(1)神經(jīng)網(wǎng)絡(luò )
(2)決策樹(shù)
3、注意事項
A. 神經(jīng)網(wǎng)絡(luò )適用于下列情況的分類(lèi):
(1) 數據量比較小,缺少足夠的樣本建立數學(xué)模型
(2) 數據的結構難以用傳統的統計方法來(lái)描述
(3) 分類(lèi)模型難以表示為傳統的統計模型
B. 神經(jīng)網(wǎng)絡(luò )的優(yōu)點(diǎn):
分類(lèi)準確度高,并行分布處理能力強, 對噪聲數據有較強的魯棒性和容錯能力,能夠充分逼近復雜的非線(xiàn)性關(guān)系,具備聯(lián)想記憶的功能等。
C. 神經(jīng)網(wǎng)絡(luò )缺點(diǎn):
需要大量的參數,不能觀(guān)察中間學(xué)習過(guò)程,輸出結果較難解釋?zhuān)瑫?huì )影響到結果的可信度,需要較長(cháng)的學(xué)習時(shí)間,當數據量較大的時(shí)候,學(xué)習速度會(huì )制約其應用。
評論