基于支持向量机的商业银行信用风险评估模型
本文将支持向量机(Support Vector Machine,SVM)用于建立商业银行的信用风险评估模型。通过与MDA以及神经网络模型的比较,证实了该方法用于信用风险评估的有效性及优越性。
_______________________________________________________________________________http://www.77cn.com.cn
基于支持向量机的商业银行信用风险评估模型
刘 闽,林成德
(厦门大学自动化系,福建 厦门 361005)
摘要:本文将支持向量机(Support Vector Machine,SVM)用于建立商业银行的信用风险评估模型。通过与MDA以及神经网络模型的比较,证实了该方法用于信用风险评估的有效性及优越性。
关键词:信用风险评估 神经网络 统计学习理论 支持向量机
A Model Based on Support Vector Machine for Credit Risk Assessment
in Commercial Banks
Liu Min,Lin Cheng De
(Dept. Of Automation,Xiamen Univ.,Xiamen 361005,China)
Abstract In this paper, a model, based on Support Vector Machine(SVM), is presented to assess the credit risk in commercial banks. Empirical results show that SVM model is effective and more advantageous than both MDA model and neural network model.
Keywords credit risk assessment; neural network; statistical learning theory; support vector
machine;
1 引言
信用风险评估是商业银行信贷风险管理中一项极其重要的基础性工作,其目的在于分析
银行在贷款业务中可能面临的信用风险——借款人如期履行特定债务或相关债务的信用能力和意愿,从而为贷款决策提供依据。
当前国际金融界和学术界建立评估模型的主流方法,是把信用风险评估看成是模式识别
中的一类分类问题,即将借款人分为履约(按期还本付息)和违约两类,利用数据挖掘方法,从已有的数据出发寻找规律,建立判别模型从而达到对未来的数据进行预测的目的。目前国际上广泛采用的模型包括统计模型和神经网络模型。
基于统计判别方法的预测模型都是在Fisher于1936年作出的启发性研究之后提出的[1]。
1966年Beaver采用单变量分析技术对企业的破产问题进行了预测;随后,Altman利用多元判别分析法(MDA)建立了著名的Z-score模型;70年代末期Logit和Probit方法被引入信用评估领域;此外,近邻法、主成分分析、聚类分析等统计方法也被大量运用。统计方法的引入克服了传统比例分析法综合分析能力差,定量分析不足等缺点,但也存在许多问题:1)统计方法研究的是样本趋于无穷大时的渐近理论,因此要求样本数据有一定的规模;2)方法的可用性与建立分类模型时所需的多个假设和条件紧密相关,如MDA就要求数据服从多元正态分布和等协方差,而现实中大量数据严重违背这些假定。因此统计方法在现实应用中作者简介:刘闽(1980—),男,硕士研究生
本文将支持向量机(Support Vector Machine,SVM)用于建立商业银行的信用风险评估模型。通过与MDA以及神经网络模型的比较,证实了该方法用于信用风险评估的有效性及优越性。
很难达到理想的效果。
进入80年代以来,专家系统、神经网络(Neural Network,NN)、遗传算法等人工智能
的技术被逐步应用到信用风险评估领域[2][3][4],尤其是NN,它是一种对数据分布无任何要求的非线性技术, 克服了统计方法对假设较强的要求,能有效解决非正态分布、非线性的信用评估问题。但NN有其自身难以克服的缺陷:1)缺乏充分的理论基础,模型不具有解释性;
2)网络结构难以确定;3)训练时易陷入局部极值,训练效率不高;4)存在过学习与欠学习的问题。
我国商业银行的信用风险评估目前还停留在传统的比例分析阶段,普遍采用“打分法”,
该方法存在许多局限性,对处于新兴市场和转轨经济时期的我国商业银行而言,亟需建立一套更为科学的评估模型。国内许多学者也对此展开了研究[5][6],但由于国内信用评估起步较晚,数据积累较少,应用传统的统计方法效果不好,神经网络也难以进行有效的学习。针对这一现状,本文引入了一种基于小样本学习理论的通用学习算法SVM[7],并将其用于建立商业银行的信用风险评估模型,取得了较好的效果。
2 SVM原理
2.1 统计学习理论(Statistical Learning Theory,SLT)[7]
SLT是V.N.Vapnik等人提出的一种专门研究小样本情况下机器学习规律的理论,是传
统统计学的重要发展和补充。该理论针对小样本统计问题建立了一套新的理论体系,在这种体系下的统计推理规则不仅考虑了对渐近性能的要求,而且追求在现有有限信息的条件下得到最优结果。在这一理论的基础上发展了一种新的通用的学习方法——SVM。
2.2 SVM的分类算法
SVM是从线性可分情况下的最优分类超平面发
展而来的,基本思想可用图1说明。图中,实心点
和空心点代表两类样本,H为分类超平面,H1、H2分
别为过各类中离H最近的样本且平行于H的超平面,
它们到H的距离相等,它们之间的距离叫做分类间
隔。所谓最优分类超平面就是以最大间隔将两类正
确分开的超平面。
分类超平面方程的一般形式可写为
x w+b=0,我们对它进行归一化,使得对线性
可分的样本集(xi,yi),xi∈R,yi∈{+1, 1},d图1 线形可分情况下的最优分类超平面
i=1,...,n,满足
yi[(w xi)+b] 1≥0,i=1,L,n (1)
221此时分类间隔等于2/||w||,因此使间隔最大等价于使||w||最小。满足条件(1)且使w最
小的超平面就叫做最优分类超平面,使(1)式中等号成立的训练样本点就称作支持向量。
利用Lagrange优化方法可以把上述最优分类面问题转化为其对偶问题[8],也即转化为一
个不等式约束下二次函数寻优的问题,从而存在唯一解。解上述问题后得到的最优分类函数是
n** f(x)=sgn{(w x)+b}=sgn ∑αiyi(xi x)+b (2) i=1
本文将支持向量机(Support Vector Machine,SVM)用于建立商业银行的信用风险评估模型。通过与MDA以及神经网络模型的比较,证实了该方法用于信用风险评估的有效性及优越性。
其中,αi*为每个样本对应的Lagrange乘子,可以证明,只有一部分(通常是很少部分)αi*不为零,对应的样本就是支持向量。b*是分类阈值,可以用任一个支持向量求得,或通过两类中任意一对支持向量取中值求得。
在样本集线性不可分的情况下,可以在条件(1)中增加一个松弛项ξi≥0成为
yi[(w xi)+b] 1+ξi≥0,i=1,L,n (3)
1w并将目标改为求 (w,ξ)=22+C[∑ξi] (4)
i=1n
最小,即构造一个软间隔,折衷考虑最少错分样本和最大分类间隔,就得到广义最优分类面,其中C>0是一个常数,它控制对错分样本惩罚的程度。
对非线性问题,可以通过非线性变换转化为某个高维空间中的线性问题,在变换空间求
最优分类面。只要采用适当的内积核函数K(xi,xj)代替原空间中的内积,就可以实现某一非线性变换后的线性分类[7],从而避开了非线性变换的具体形式,此时分类函数变为:
n*f(x)=sgn ∑αiyiK(xi,x)+b* (5) i=1
相关推荐:
- [行业资料]创设有效语境 改善英语教学
- [行业资料]微商推广引流的44种方法
- [行业资料]医疗机构输血科血库基本标准
- [行业资料]锂离子电池项目可行性研究报告(2015年
- [行业资料]申请执行人长沙市开福区人口和计划生育
- [行业资料]倾听草木的呼吸(初中阅读)
- [行业资料]长沙新环境厂房租赁合同书
- [行业资料]2022年经济师《金融专业知识与实务(中
- [行业资料]浦东新区2009学年度第二学期期末考试七
- [行业资料]企业劳动用工协议书
- [行业资料]最新苏科版七年级数学上册第二章有理数
- [行业资料]12星座与英语词汇学习
- [行业资料]2008年高考化学科经验
- [行业资料]镇政府2015年工作总结及2016年政府工作
- [行业资料]梧州市产业园区规划及招商引资报告
- [行业资料]大体积砼承台施工作业指导书
- [行业资料]学生干部在创建和谐校园中的作1
- [行业资料]小学语文教师实习个人总结
- [行业资料]2014完美最新奖金制度
- [行业资料]2016年一建建筑实务-重要知识点地质
- 【最新】人教版小学语文三年级上册:第
- 中国中小企业年鉴(地区数据)
- 动物与人类生活的关系 ppt
- 选修3 专题3 胚胎工程知识点
- 遥感技术基础复习题
- 公司员工职业生涯规划实施方案
- 辽宁省建筑施工企业安全生产许可证管理
- 15秋福师《中外幼儿教育史》在线作业二
- 2015-2020年中国网络视频行业深度调研
- 数学八年级下华东师大版21.1算术平均数
- 苏教版一年级语文下册《小松树和大松树
- 油画论文:摄影对当下油画艺术的影响
- 西方自由主义影响下的新闻自由——从17
- 基于支持向量机的商业银行信用风险评估
- 机械设计基础复习题答案(修改)(1)
- 语文:高考作文素材:材料引用及论点论
- 月份工程进度款结算单62+56
- 2018-2023年中国互联网基金行业现状研
- 人教版 PEP 五年级下册Unit1Lesson1 th
- 2014学年第二学期四年级数学期末教学质