個人信用評分組合模型研究與應用.pdf_第1頁
已閱讀1頁,還剩145頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、個人信用不僅是國家建設道德文化和市場倫理的基礎,還是一個推動國家經(jīng)濟發(fā)展的巨大資源。充分開發(fā)和利用個人信用資源,能夠有效地優(yōu)化資源配置、拉動消費并最終促進經(jīng)濟發(fā)展。一些西方國家早在一百多年前就建立了個人信用制度,為其市場經(jīng)濟的正常運行打下了堅實基礎。而在我國,個人信用制度的建立在2000年才開始起步,研究和應用水平遠遠落后與發(fā)達國家。個人信用評分是個人信用制度的核心,科學地對個人信用狀況進行評估有助于促進個人信貸業(yè)務的發(fā)展,降低個人信貸

2、風險。
   本文在分析國內(nèi)外個人信用評分發(fā)展歷史及其方法應用現(xiàn)狀的基礎上,指出目前個人信用評分是一個集缺失數(shù)據(jù)填補、異常值檢測和處理、連續(xù)數(shù)據(jù)離散化、樣本結構優(yōu)化、指標體系選擇、模型設計、評價和應用為一體的評估系統(tǒng)。針對缺失數(shù)據(jù)問題,將多種填補方法的應用效果進行了比較。得出在數(shù)據(jù)缺失率在10%以內(nèi)時采用刪除法是最佳選擇,在20%~40%之間時多重填補是最有效的處理方法。對異常值和異常實例的檢測及處理進行了分析,提出了異常實例檢

3、測的組合方法,結果表明異常值的處理有助于提高個人信用評分模型的分類精度。采用等距區(qū)間、等頻區(qū)間以及基于熵的方法對連續(xù)屬性進行了離散化,結果表明離散化能夠減小異常值對個人信用評分模型的影響、提高評分模型的預測精度,有利于個人隱私的保護。在數(shù)據(jù)層面和算法層面對信用數(shù)據(jù)中的結構不平衡問題進行了研究,實驗結果表明兩個層面上的處理方法都能有效地提高對壞客戶的識別正確率。其中基于最近鄰的SMOTE過抽樣方法簡單易行,在處理不平衡數(shù)據(jù)問題時有最好的應

4、用效果。在對各種指標重要程度排序方法進行比較的基礎上,提出采用組合方法能夠綜合考慮各種排序信息,獲得更為穩(wěn)健的指標重要性排序結果。測試了機器學習中的最優(yōu)特征子集選擇方法在個人信用評分指標體系構建中的應用效果,為構建個人信用評分指標體系提供了新的思路。
   對五種最常見的個人信用評分單一模型進行了應用和比較,實驗結果表明:Logistic回歸對數(shù)據(jù)沒有嚴格假設條件、穩(wěn)健性好、可解釋性強、建模過程簡單易操作,但分類精度略低于人工智

5、能模型。C4.5決策樹模型對數(shù)據(jù)沒有嚴格假設條件、模型分類精度較高、可解釋性較強,能輸出簡單直觀的評分規(guī)則,但缺點是模型穩(wěn)健性不夠,容易出現(xiàn)過擬合,且建模過程比較依賴專家知識和經(jīng)驗。貝葉斯網(wǎng)絡的穩(wěn)定性好、可解釋性較強,能輸出網(wǎng)絡圖,直觀地揭示屬性和違約概率之間的關系、建模過程簡單易行,但主要缺點是模型分類精度較低。BP神經(jīng)網(wǎng)絡對數(shù)據(jù)沒有假設條件、分類精度高,能模擬數(shù)據(jù)間復雜的非線性關系,但缺乏穩(wěn)健性和可解釋性,而且建模過程嚴重依賴專家知

6、識和經(jīng)驗。支持向量機對數(shù)據(jù)也沒有假設條件、分類精度高。但缺點是缺乏可解釋性和穩(wěn)定性,建模過程依賴專家知識和經(jīng)驗??傊壳按嬖诘亩喾N個人信用評分統(tǒng)計模型和非統(tǒng)計模型都各有特點,沒有一種能夠達到分類精度和穩(wěn)健性的統(tǒng)一。
   針對精確度與穩(wěn)健性無法兼顧問題,本文利用組合思想構建了多種結構的組合模型并進行了應用。實驗結果表明,把神經(jīng)網(wǎng)絡或支持向量機和Logistic回歸按照串行結構結合在一起構成組合模型有助于提高信用評分的分類精度和

7、穩(wěn)健性。但由于多重共線性的存在,使模型丟失了可解釋性。異態(tài)并行結構組合模型能顯著提高分類精度和穩(wěn)健性,但是模型構造復雜,依賴于專家知識和經(jīng)驗,不利于推廣應用。Bagging、boosting集成模型在分類精度和穩(wěn)健性上也都有很好的表現(xiàn),而且構造相對簡單,較少依賴專家知識和經(jīng)驗,有利于在個人信用評分領域的推廣。Rsm集成模型能在高維度的數(shù)據(jù)集上取得了和bagging、boosting集成模型相當?shù)姆诸愋阅埽贿m合處理特征變量過少的個人信

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論