基于套索的小微企業(yè)貸款審批_第1頁(yè)
已閱讀1頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p>  基于套索的小微企業(yè)貸款審批</p><p>  [提要] 小微企業(yè)是民生銀行三大核心客戶群體之一,根據(jù)民生銀行天津分行商貸通申請(qǐng)材料,整理出24個(gè)指標(biāo)。以授信額度為因變量,其他變量為自變量。采用最小角回歸、廣義線性模型彈性網(wǎng)和分組group lasso三種方法計(jì)算。結(jié)果發(fā)現(xiàn)lasso變量選擇功能最強(qiáng),彈性網(wǎng)次之,而分組group lasso較弱。綜合幾種方法結(jié)果,企業(yè)從事行業(yè)對(duì)于銀行貸款授信

2、額度影響最大,一般建筑、交通運(yùn)輸設(shè)備容易獲得貸款,而從事金屬、日用品的企業(yè)較難獲得更多貸款。 </p><p>  關(guān)鍵詞:小微金融;lasso;最小角回歸 </p><p>  中圖分類號(hào):F83 文獻(xiàn)標(biāo)識(shí)碼:A </p><p>  收錄日期:2013年4月20日 </p><p>  小微企業(yè)貸款是民生銀行的重要特色之一,截至2011年

3、末,中國(guó)民生銀行的小微企業(yè)貸款余額已經(jīng)超過(guò)2,300億元人民幣(約合360億美元),不良貸款率只有千分之一點(diǎn)五左右,民生銀行已經(jīng)成為全球最大的小微企業(yè)金融服務(wù)提供商。小微企業(yè)客戶具有戶數(shù)眾多、客戶分散等特征。在中國(guó)銀行業(yè),小微企業(yè)貸款一直被認(rèn)為是“高信用風(fēng)險(xiǎn)、高人工成本”的業(yè)務(wù),20世紀(jì)八十年代中國(guó)各大國(guó)有銀行都有過(guò)給小商戶貸款遭遇巨額不良貸款的慘痛經(jīng)歷。如何篩選優(yōu)質(zhì)可靠小微企業(yè),降低信用風(fēng)險(xiǎn)是進(jìn)軍小微企業(yè)貸款領(lǐng)域首先需要思考的問(wèn)題。本

4、文結(jié)合天津民生支行實(shí)際情況,從貸款小微企業(yè)申請(qǐng)表格中整理出一套指標(biāo)體系,利用lasso篩選出重要影響指標(biāo),方便操作,對(duì)于風(fēng)險(xiǎn)評(píng)估、確定授信額度等提供借鑒和幫助。 </p><p>  一、小微企業(yè)貸款分析指標(biāo) </p><p>  小微企業(yè)客戶具有戶數(shù)眾多,客戶分散等特征?!吧藤J通”目標(biāo)市場(chǎng)選擇的基本原則在于運(yùn)用“大數(shù)法則”測(cè)算出特定行業(yè)的風(fēng)險(xiǎn)概率,甄選“商貸通”業(yè)務(wù)進(jìn)入的行業(yè),迅速地找到

5、有效客戶群體,并對(duì)其進(jìn)行批量營(yíng)銷。 </p><p>  最后整理指標(biāo)體系包括24個(gè)指標(biāo),有姓名、性別、年齡、婚姻狀況、有無(wú)子女、最高學(xué)歷、已有額度、我行余額、資產(chǎn)合計(jì)、負(fù)債余額、月供支出、信用記錄、從事行業(yè)I、從事行業(yè)II、從業(yè)年限、經(jīng)營(yíng)模式、員工人數(shù)、年經(jīng)營(yíng)收入、半年流水、年利潤(rùn)、公司信用、行業(yè)利潤(rùn)額、擔(dān)保方式、授信額度。其中,一類行業(yè):批發(fā)和零售業(yè),制造業(yè),住宿和餐飲業(yè),交通運(yùn)輸、倉(cāng)儲(chǔ)郵政業(yè),信息傳輸、計(jì)算

6、機(jī)服務(wù)和軟件業(yè),租賃和商務(wù)服務(wù)業(yè),居民服務(wù)和其他服務(wù)業(yè),建筑業(yè),房地產(chǎn)業(yè),教育,文化、體育、娛樂(lè)業(yè),其他。二類行業(yè):食品,飲料,煙草,紡織,服裝,日用品,文化體育用品,器材,醫(yī)藥、醫(yī)療設(shè)備,家具,建材,工藝品,五金交電,機(jī)械設(shè)備,通信設(shè)備、計(jì)算機(jī)、電子,皮革毛皮,造紙,塑料,橡膠,非金屬,金屬,金屬制品,交通運(yùn)輸設(shè)備,化學(xué)制品,儀器儀表,專用設(shè)備,通用設(shè)備,廢棄資源和廢舊材料回收加工業(yè),代理。 </p><p>

7、  指標(biāo)體系中有數(shù)值型和分類指標(biāo),數(shù)值型指標(biāo)可以直接分析,而分類指標(biāo)需要編碼之后才能分析。該指標(biāo)體系按照申請(qǐng)人在民生貸款時(shí)所填表格整理得到,主要包括個(gè)人基本情況、家庭資產(chǎn)及負(fù)債狀況和公司情況三個(gè)方面。由于指標(biāo)太多,希望從中找出授信額度的最重要影響指標(biāo),方便以后貸款審批和分析。 </p><p>  二、lasso方法 </p><p>  所謂lasso,也有翻譯成套索,其全稱是least

8、 absolute shrinkage and selection operator。最早提出lasso的是Tibshirani在1996年Journal of the Royal Statistical Society:Series B 上的一篇文章Regression shrinkage and selection via lasso。對(duì)于線性回歸,在普通最小二乘的基礎(chǔ)上加入L1范數(shù)懲罰。其想法是在限制了系數(shù)總和的情況下,求使得殘差

9、平方和達(dá)到最小的回歸系數(shù)的估值。 </p><p>  min(y-xβ) </p><p><b>  s.t. </b></p><p><b>  β≤s </b></p><p>  其中,y是第i個(gè)樣本的輸出值,總共N個(gè)樣本。x是第i個(gè)樣本的第j個(gè)輸入變量,β是第j個(gè)輸入變量,總共p個(gè)輸入

10、變量。 </p><p>  但是,lasso提出之后沒(méi)有受到太多關(guān)注,直到2002年Efrn提出最小角回歸之后,才變成熱點(diǎn)。Tibshirani自己分析可能是如下原因: </p><p> ?。?)1996年提出的lasso算法相比于今天太慢; </p><p> ?。?)當(dāng)時(shí)lasso算法是個(gè)“黑箱子”,沒(méi)有顯著的解釋; </p><p>

11、;  (3)稀疏性(sparsity)的重要性并沒(méi)有被人們認(rèn)識(shí); </p><p> ?。?)海量數(shù)據(jù)問(wèn)題較少; </p><p>  (5)當(dāng)時(shí)R語(yǔ)言沒(méi)有流行,幾年之后R語(yǔ)言可以輕松分享最新算法軟件。 </p><p>  三、lasso分析結(jié)果 </p><p>  由于所選指標(biāo)中有數(shù)值類型和分類變量,數(shù)值變量可以直接處理,分類變量回歸之

12、前需要編碼。本文采用虛擬編碼,涉及到性別、婚姻狀況、有無(wú)子女、從事行業(yè)I、從事行業(yè)II、經(jīng)營(yíng)模式、公司信用、擔(dān)保方式8個(gè)分類變量,編碼之后總共38個(gè)變量,增加了15個(gè)變量。 </p><p>  R語(yǔ)言中有多個(gè)宏包附帶lasso算法,最有名的就是Efron的最小角回歸lars包,該包的lars函數(shù)提供了lasso四種算法:凸二次規(guī)劃的“l(fā)asso”,最小角回歸“l(fā)ar”、前向逐步回歸“forward.stagew

13、ise”和階梯式算法“stepwise”。擬合之前需要將每個(gè)自變量和因變量標(biāo)準(zhǔn)化,減去均值,除以標(biāo)準(zhǔn)差,使得每個(gè)變量均值為零,方差為1。將授信額度為因變量,其他所有變量為自變量。挑選出對(duì)授信額度影響最大的變量指標(biāo)。系數(shù)路徑如圖1所示,圖形橫坐標(biāo)表示不同取值下,38個(gè)變量系數(shù)向量的L1范數(shù)與最大向量L1范數(shù)比值??v坐標(biāo)表示不同情況下,38個(gè)系數(shù)取值。當(dāng)限制系數(shù)向量L1范數(shù)不同值時(shí),所估計(jì)系數(shù)不盡相同。到底限制多少時(shí),所得系數(shù)估計(jì)最優(yōu)。一般

14、采用十折交叉證實(shí)計(jì)算均方誤差,取最小均方誤差對(duì)應(yīng)的系數(shù)向量L1范數(shù)限制。(圖1) </p><p>  最后選擇結(jié)果表明,從事行業(yè)II對(duì)貸款授信額度影響最大,其次為婚姻狀況,最后為已有額度。按照銀行業(yè)務(wù)員的經(jīng)驗(yàn),行業(yè)對(duì)于授信額度審批至關(guān)重要。利潤(rùn)率高的行業(yè)獲批授信額度更多。系數(shù)最大的是從事行業(yè)II交通運(yùn)輸設(shè)備0.43,表明交通運(yùn)輸設(shè)備行業(yè)備受銀行青睞,從事建材的企業(yè)也容易獲批貸款。從事行業(yè)II金屬、從事行業(yè)II日

15、用品、從事行業(yè)II醫(yī)藥、醫(yī)療設(shè)備和從事行業(yè)II儀器儀表系數(shù)為負(fù),表明與基準(zhǔn)代理行業(yè)相比,這些行業(yè)獲批貸款更難一些。 </p><p>  已婚和離異的申請(qǐng)人對(duì)于授信額度的影響差別不大,但是相比于未婚申請(qǐng)人,已婚和離異申請(qǐng)人申請(qǐng)的授信額度要大得多。一般未婚申請(qǐng)人比較年輕,事業(yè)剛剛起步,獲得的授信額度較小。但是,已婚和離異的申請(qǐng)人年齡較大,都是事業(yè)有成的成功人士,獲批的額度較大。在民生銀行已有貸款額度系數(shù)很小,前兩位

16、小數(shù)為零。由于該指標(biāo)強(qiáng)調(diào)的是在民生銀行本行的貸款額度,沒(méi)有考慮申請(qǐng)人在其他銀行的貸款,不能完全反映申請(qǐng)人貸款情況,所以其系數(shù)較小,但是認(rèn)為已有貸款額度對(duì)于授信額度具有較大影響。 </p><p><b>  四、總結(jié) </b></p><p>  本文從民生銀行小微企業(yè)貸款申請(qǐng)表格中提取24個(gè)指標(biāo),以授信額度為因變量,其他變量為自變量。利用lasso的變量選擇功能,從

17、中挑選出對(duì)于貸款影響的一些變量,方便銀行人員審核和批復(fù)。結(jié)果表明:企業(yè)所在的行業(yè)對(duì)于貸款的影響最大,銀行可以根據(jù)不同行業(yè)進(jìn)行專業(yè)分析。 </p><p><b>  主要參考文獻(xiàn): </b></p><p>  [1]Tibshirani R.Regression shrinkage and selection via the lasso[J].Journal of

18、the Royal Statistical Society.Series B(Methodological),1996. </p><p>  [2]Efron B,Hastie T,Johnstone I,et al.Least angle regression[J].The Annals of statistics,2004.32.2. </p><p>  [3]王占鋒,吳耀華,趙林

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論