<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>
"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 概述:機器學(xué)習和大數據技術(shù)在信貸風(fēng)控場(chǎng)景中的應用(2)

概述:機器學(xué)習和大數據技術(shù)在信貸風(fēng)控場(chǎng)景中的應用(2)

發(fā)布人:數據派THU 時(shí)間:2022-01-16 來(lái)源:工程師 發(fā)布文章

1.基于知識圖譜技術(shù)的復雜網(wǎng)絡(luò )

在影視節目當中,我們經(jīng)??吹骄燹k案時(shí)會(huì )把嫌疑人、證人、受害人及他們之間的關(guān)聯(lián)關(guān)系等信息畫(huà)在墻上,用以分析案情,這就是典型的關(guān)系圖譜應用。墻上的畫(huà)便是圖,圖中有用的信息便是知識,將其進(jìn)一步擴展到其他事物;人為實(shí)體,在圖中我們稱(chēng)之為點(diǎn),人之間代表著(zhù)關(guān)聯(lián)關(guān)系的連線(xiàn),在圖中我們稱(chēng)之為邊,就這樣點(diǎn)與邊共同組成了我們的關(guān)系圖譜。

10.jpg

構建關(guān)系圖譜的底層還是大數據的技術(shù):基于龐大的用戶(hù)數據,從不同的數據源抽取出來(lái)存入到圖數據庫里,所以數據是構建關(guān)系圖譜的基礎。一種是以關(guān)系型數據庫存儲的結構化數據,例如:IP地址,經(jīng)緯度,設備指紋等,另一種是爬蟲(chóng)采集的非機構化數據,例如行為記錄、網(wǎng)上的瀏覽記錄。實(shí)踐應用中我們利用機器學(xué)習、自然語(yǔ)言處理技術(shù)把這些數據變成結構化的數據也存入到圖譜里。

從用戶(hù)大數據和基于大數據的關(guān)系圖譜體系我們可以實(shí)現以下目的:

2.1 資料偽造識別

校驗用戶(hù)信息可以用來(lái)判斷借款人是否可能存在欺詐風(fēng)險,使用關(guān)系圖譜做交叉校驗,雖然不能保證百分之百的準確性,但是它在人工審核時(shí)便是一個(gè)有力的參考依據。欺詐用戶(hù)填寫(xiě)的個(gè)人信息通常都是虛假的。例如:比如借款人張三和借款人李四填寫(xiě)的是同一個(gè)公司電話(huà),但張三填寫(xiě)的公司和李四填寫(xiě)的公司完全不一樣,這就成了一個(gè)風(fēng)險點(diǎn)。我們將關(guān)系圖譜數據可視化,可以很直觀(guān)的發(fā)現兩者的矛盾,我們便可以判斷他們二人至少有一人存在欺詐風(fēng)險。

2.2 團伙欺詐分析

在信貸場(chǎng)景中,團伙欺詐造成的損失更加嚴重,不過(guò)從繁復的數據中發(fā)現團伙的難度也很大?;谥R圖譜我們通常直觀(guān)分析多層級的數據,一度關(guān)聯(lián)、二度關(guān)聯(lián)、三度關(guān)聯(lián),甚至是更多維度關(guān)聯(lián)。團伙雖然使用虛假信息進(jìn)行授信、支用,但通常都有共有的信息,例如同一個(gè)WIFI,同一片區域。LOUVAIN、LPA、SLPA等社區發(fā)現算法、標簽傳播算法可以有效快速的發(fā)現團伙。

11.jpg

2.3 失聯(lián)客戶(hù)管理

對于貸后管理來(lái)說(shuō),用戶(hù)本人及緊急聯(lián)系人失聯(lián)是催收失敗最大的原因,這時(shí)可以利用關(guān)系圖譜去發(fā)現失聯(lián)用戶(hù)的潛在聯(lián)系人,提高催收成功率。例如張三是失聯(lián)用戶(hù),李四和趙六是張三的聯(lián)系人也都失聯(lián)了,這時(shí)我們可以試圖通過(guò)李四的聯(lián)系人王五,或者與張三使用相同設備的用戶(hù)老王來(lái)達到失聯(lián)客戶(hù)管理的目的。

12.png

3.征信數據與信用評分卡

3.1征信與大數據

與國外相比,中國最大的差異在于征信體系的不完善。我們的人行征信系統覆蓋了8億人,但是可能只有4億左右是有信貸記錄的,剩下的無(wú)任何信貸記錄的,我們稱(chēng)之為白戶(hù)。所以國內****對于大部分非中高端用戶(hù)實(shí)際上是不愿意也沒(méi)有能力提供金融服務(wù)的。沒(méi)有征信數據,那套國外搬過(guò)來(lái)的基于征信數據的方式方法就不管用了。

不過(guò),我們很快發(fā)現,利用互聯(lián)網(wǎng)技術(shù)可以解決征信數據缺失的白戶(hù)問(wèn)題,而這些看似與信貸記錄不相關(guān)的數據在一定程度上卻能夠評估是否能夠給該用戶(hù)借款:

(1)All data is credit data:互聯(lián)網(wǎng)可以提供每個(gè)信貸申請用戶(hù)龐大的、碎片化的、種類(lèi)繁多的信息。這里面包括用戶(hù)提交的電子化信息(如身份證、營(yíng)業(yè)執照、房產(chǎn)證、學(xué)歷證、工資單、社保,****流水等),第三方權威機構的查詢(xún)信息(如公民身份證查詢(xún)中心、教育部學(xué)歷中心、法院訴訟信息查詢(xún)中心等可查詢(xún)信息),還包括了海量的互聯(lián)網(wǎng)碎片數據,如用戶(hù)的電商交易信息、微博等社交網(wǎng)絡(luò )數據,百度搜索引擎數據等。

(2)互聯(lián)網(wǎng)的高效性和便捷性使我們能以較低的成本、較短的時(shí)間,積累大量的用戶(hù)數據,為分析建模提供足夠的樣本量。

在信貸的業(yè)務(wù)實(shí)踐中,常用的行業(yè)大數據包括:

央行征信報告:一般持牌金融機構有央行征信介入權限,包括個(gè)人的執業(yè)資格記錄、行政獎勵和處罰記錄、法院訴訟和強制執行記錄、欠稅記錄等。

司法信息:最高法以及省市各級法院的最新公布名單,包括執行法院、立案時(shí)間、執行案號、執行標的、案件狀態(tài)、執行依據、執行機構、生效法律文書(shū)確定的義務(wù)、被執行人的履行情況、失信被執行人的行為等信息。

公安信息:覆蓋公安系統涉案、在逃和有案底人員信息,包括案發(fā)時(shí)間、案件詳情如詐騙案/生產(chǎn)、銷(xiāo)售假****案等信息。

****信息:****儲蓄卡/****支出、收入、逾期等信息。

航旅信息:包含過(guò)去一年中,每個(gè)季度的飛行城市、飛行次數、座位層次等數據。

社交信息:包含社交賬號匹配類(lèi)型、社交賬號性別、社交賬號粉絲數等。

運營(yíng)商信息:核查運營(yíng)商賬戶(hù)在網(wǎng)時(shí)長(cháng)、在網(wǎng)狀態(tài)、消費檔次、通話(huà)習慣等信息。

網(wǎng)貸黑名單:根據個(gè)人姓名和身份證號碼驗證是否有網(wǎng)貸逾期、黑名單信息。

駕駛證狀態(tài),租車(chē)黑名單,電商消費記錄等也是可以考量的因素

正是因為大數據技術(shù)的發(fā)展才形成了帶著(zhù)強烈中國特色的官方+民間結合的征信體系,支撐互聯(lián)網(wǎng)信貸脫離蠻荒可以實(shí)現高速發(fā)展,信貸從業(yè)者可以在合規的前提下獲取對提升效率有用的用戶(hù)信息完善風(fēng)控策略。

3.2 機器學(xué)習與評分卡

評分卡我們應該是最為熟悉的,芝麻信用分就是一個(gè)典型的信用評分,支付寶官方利用自身積累及外部征信渠道獲取的各種數據從五個(gè)維度對一個(gè)用戶(hù)進(jìn)行評分,而這個(gè)評分對于每個(gè)用戶(hù)來(lái)說(shuō)是透明的,這也非常好幫助用戶(hù)理解和改善自身的信用狀況。

從和信貸業(yè)內的小伙伴溝通來(lái)看,芝麻的信用評分還是比較有區分度的,這與阿里的大數據積累息息相關(guān),阿里體系內積累了大量用戶(hù)特有數據可以對用戶(hù)形象進(jìn)行更好的刻畫(huà)。

13.jpg

這套評分卡的背后其實(shí)是一套依賴(lài)在大數據基礎上的機器學(xué)習算法,因此在本身?yè)碛写罅繑祿幕A上如何挖掘出一套有效的客戶(hù)評分這就是機器學(xué)習需要做的事情。

機器學(xué)習中目前應用最廣泛的就是有監督學(xué)習:這類(lèi)模型最復雜的地方在于模型的訓練過(guò)程,算法人員根據這些歷史用戶(hù)的表現打上標簽(逾期/不逾期),基于這些用戶(hù)大量數據,使用不同的算法(一般來(lái)說(shuō)都會(huì )使用邏輯回歸算法)來(lái)對這些用戶(hù)進(jìn)行評分,得到一個(gè)在各維度評價(jià)指標來(lái)看都能過(guò)關(guān)的模型,并用這個(gè)模型來(lái)預測未來(lái)的數據表現。

14.png

目前********體系、網(wǎng)貸體系基本都是使用類(lèi)似的方法構建評分卡,當然不同的場(chǎng)景、不同的行業(yè)所用的評分卡也不盡相同?;谶@套評分卡我們基本上可以在用戶(hù)申請環(huán)節實(shí)現量化風(fēng)險的目的?;诖髷祿臋C器學(xué)習并不是完全改變傳統風(fēng)控,實(shí)際是豐富傳統風(fēng)控的數據緯度和量化風(fēng)險的方式。

結語(yǔ)

本文簡(jiǎn)單介紹了大數據和機器學(xué)習在信貸風(fēng)控領(lǐng)域的應用場(chǎng)景。機器學(xué)習聽(tīng)起來(lái)很高大上,在實(shí)際工作中也經(jīng)常會(huì )遇到一味炒作概念的人,過(guò)分夸大機器學(xué)習所能起到的作用,或者盲目的追求高深復雜的算法。不過(guò)無(wú)論是機器學(xué)習還是大數據其本質(zhì)還是為了服務(wù)業(yè)務(wù),提高業(yè)務(wù)的效率降低成本是其最根本的目的。

隨著(zhù)信貸行業(yè)的不斷發(fā)展,機器學(xué)習和大數據技術(shù)的越來(lái)越成熟,二者結合的應用場(chǎng)景相信也會(huì )愈加豐富,相信在這塊未來(lái)會(huì )有更多新穎的應用場(chǎng)景。

*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。



關(guān)鍵詞: 深度學(xué)習

相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>