方面主要有哪些用钱宝 风控模型的模型

搭建风控量化模型_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
搭建风控量化模型
&&详细介绍如何搭建风控量化模型
阅读已结束,下载本文需要
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,同时保存到云知识,更方便管理
还剩1页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢2,653被浏览126,562分享邀请回答215 条评论分享收藏感谢收起大数据风控模型的流程思什么
& & 因为大数据风控模型是各家平台的核心商业机密,我们不得而知。但我们可以从大数据风控模型的建立过程来窥知一二。大数据风控模型的基本流程来主要分为四个部分:数据收集、数据建模、构建数据画像和风险定价。具体考核数据如下图所示:
& & 数据收集
& & 大数据精准营销的蓝海领域,消费金融数据。这里简要归纳一下,互联网大数据包括:
& & 用户行为数据(精准广告投放、内容推荐、行为习惯和喜好分析、产品优化等)
& & 用户消费数据(精准营销、信用记录分析、活动促销、理财等)
& & 用户地理位置数据(O2O推广,商家推荐,交友推荐等)
& & 互联网金融数据(P2P,小额贷款,支付,信用,供应链金融等)
& & 用户社交等UGC数据(趋势分析、流行元素分析、受欢迎程度分析、舆论监控分析、社会问题分析等)
& & 数据建模
& & 模型包含四大方面的数据:
& & 一、个人/公司的基本信息,包括个人资历、个人/公司的信用信息、公司财务指标、家庭结构关系、家庭社会地位关系、个人社交关系、工商注册信息等;
& & 二、个人/公司商务信息,包括线上零售交易信息、专利信息、个人/公司资质、土地出让/转让信息、质押抵押信息等;
& & 三、个人/公司社会公众信息,包括涉诉信息、专利信息、被执行人信息等;
& & 四、个人/公司社会关联方信息,包括自媒体、证券社区、行政监管/许可、行业背景、商标、招中标、行政处罚、抵押担保等。
& & 常使用的模型:
& & 1.聚类:比如常见的相似文本聚类,大量用户发相似帖子是常见的灌水行为,需要处理。
& & 2.分类:比如我们根据已经识别的有风险和无风险的行为,去预测现在正在发生的行为,根据关键字动态去识别预测效果不错。
纯理财知识干货分享
关注我们的微信公众号
80后理财(licai80)
相关文章推荐
中国经济增长的不可能三角 目前中国经济仍处于下行阶段,面临去产能、去杠杆高税收、紧货币与保增长、增投资之间的不可能三角,中国近几年全社会固定资产完成额与GDP之比年年超过80%,说明我们的GDP增长主要还是靠投资拉动,故加杠杆严...
因为大数据风控模型是各家平台的核心商业机密,我们不得而知。但我们可以从大数据风控模型的建立过程来窥知一二。大数据风控模型的基本流程来主要分为四个部分:数据收集、数据建模、构建数据画像和风险定价。具体考核数据如下图所示:...
市场翘首等待的特朗普首秀未谈经济刺激计划的任何信息,令市场大失所望,美元指数创出去年11月以来表现最差的一周。下周将发生5件大事影响金融市场走势。 一、1月17日到20日,2017年冬季达沃斯论坛在瑞士小镇达沃斯举行。本届论坛的主题...
美国是个病不起的国家。 据《人民日报》此前报道,美国人均医疗费用8600美元,是其他发达国家的2倍左右。 作为世界第一大经济体,美国是发达国家中少数没有实现全民医保的国家。盖洛普公司一项调查数据显示,从2008年金融危机到2014年的...
希尔斯百货(Sears)是美国著名的百货公司,有长达123年的历史。 这家公司的总部在美国伊利诺伊州,公司销售范围从鞋子到吸尘器甚至包括房产。现任的首席执行官是艾迪莱姆伯特(EddieLampert)。 希尔斯公司的员工对这家百年公司的未来...
1月20日,特朗普在美国国会大厦宣誓就职,正式成为第45任美国总统。 随后美股涨幅一度从百点收窄至约40点。恐慌指数Vix一度跳涨。截至收盘,美股涨幅扩大,道指涨近百点,结束了此前的五连跌。 股市 特朗普今日在就职演讲中称:从今天开...
2017年最新银行存贷款利率表_最新银行基准利率表:自日起,下调金融机构人民币贷款和 存款基准利率,以进一步降低企业融资成本。 其中,金融机构一年期贷款基准利率下调0.25个百分点至4.35%;一年期存款基准利率下调0.25个百分点至1.5%。...
日,国家统计局公布了2016年4季度的经济数据。其中4季度GDP同比增长6.8%,1-12月固定资产投资同比增长8.1%,12月工业增加值同比实际增长6.0%。12月份社会消费品零售总额31757亿元,同比名义增长10.9%。 总体判断: 经济增长...
那这次新推出的特辣粉(临时流动性便利TLF)为什么最辣最奇葩?以前食客登门,不带钱,压块瑞士手表做抵押;这回吃特辣粉,看官们揣摩,没说要抵押东西,直接刷脸,一个月后再付钱即可。食客们喜不自胜,大呼辣得爽快! 其实,央妈这么...
央行昨日称,通过临时流动性便利操作为在现金投放中占比高的几家大型商业银行提供了临时流动性支持。受此影响,国债期货主力合约全线飘红。专家认为,此次操作并非真正意义上的降准,而据此也判断降准的可能性大大降低。 A股亦受到正面...
中国人民银行授权中国外汇交易中心公布,日银行间外汇市场人民币汇率中间价为:1美元对人民币6.8693元,1欧元对人民币7.3230元,100日元对人民币5.9805元,1港元对人民币0.88552元,1英镑对人民币8.4825元,1澳大利亚元对人...
中国人民银行授权中国外汇交易中心公布,日银行间外汇市场人民币汇率中间价为:1美元对人民币6.8693元,1欧元对人民币7.3230元,100日元对人民币5.9805元,1港元对人民币0.88552元,1英镑对人民币8.4825元,1澳大利亚元对人...
日(星期四,法定工作日) 被银行信息港(深圳市钱诚互联网金融研究院)纳入统计上海P2P网贷指数平台的上海P2P网贷借贷平均利率为7.01%,比中国P2P网贷利率指数的全国P2P网贷平均利率8.09%,低1.08个百分点;比前一法定工作日...
日(星期四,法定工作日) 被银行信息港(深圳市钱诚互联网金融研究院)纳入统计浙江P2P网贷指数平台的浙江P2P网贷借贷平均利率为8.66%,比中国P2P网贷利率指数的全国P2P网贷平均利率8.09%,高0.57个百分点;比前一法定工作日...
日(星期四,法定工作日) 被银行信息港(深圳市钱诚互联网金融研究院)纳入统计江苏P2P网贷指数平台的江苏P2P网贷借贷平均利率为9.41%,比中国P2P网贷利率指数的全国P2P网贷平均利率8.09%,高1.32个百分点;比前一法定工作日...
日(星期四,法定工作日) 被银行信息港(深圳市钱诚互联网金融研究院)纳入统计江西P2P网贷指数平台的江西P2P网贷借贷平均利率为11.17%,比中国P2P网贷利率指数的全国P2P网贷平均利率8.09%,高3.08个百分点;比前一法定工作...
日(星期四,法定工作日) 被银行信息港(深圳市钱诚互联网金融研究院)纳入统计山东P2P网贷指数平台的山东P2P网贷借贷平均利率为9.80%,比中国P2P网贷利率指数的全国P2P网贷平均利率8.09%,高1.71个百分点;比前一法定工作日...
日(星期四,法定工作日) 被银行信息港(深圳市钱诚互联网金融研究院)纳入统计山东P2P网贷指数平台的山东P2P网贷借贷平均利率为9.80%,比中国P2P网贷利率指数的全国P2P网贷平均利率8.09%,高1.71个百分点;比前一法定工作日...
2017支付宝集五福红包活动入口:1月21日支付宝敬业福在哪里扫? 2017支付宝集五福活动最新消息,今天2017支付宝集五福怎么玩?五福分别包括哪些?有哪些玩法?2017支付宝集五福敬业福哪里扫? 最新2017春节抢红包,实际能抢到多少钱?小...
最新2017支付宝集五福获福卡攻略汇总:2017支付宝敬业福获取新招曝! 2017支付宝集五福活动正在进行中,对于2017支付宝集五福中的敬业福还没有获得?那怎么获得?有哪些技巧? 2017春节临近,一年一度的红包大战又如约而至。支付宝和腾讯QQ相...
2017支付宝集五福敬业福如何获得?鸡年支付宝集五福两点最新攻略分享 2017支付宝集五福敬业福如何获得? 2017年支付宝集五福活动开始了,今天2017年支付宝集五福正式启动,而对于今年2017年春节支付宝集五福有哪些福字?怎么集够五张呢?今...
2017支付宝集五福敬业福如何获得?鸡年支付宝集五福两点最新攻略分享 2017支付宝集五福敬业福如何获得? 2017年支付宝集五福活动开始了,今天2017年支付宝集五福正式启动,而对于今年2017年春节支付宝集五福有哪些福字?怎么集够五张呢?今...
最新2017支付宝 福 字任意扫支付宝集齐 五福红包 大奖什么时候开? 2017年春节,支付宝再次推出了 五福红包 活动,支付宝福字要 把欠大家的敬业福都还给大家 。 今天该活动正式启动,和去年一样,需要收集 五福 : 富强福、和谐福、友善...
支付宝集五福的爱国福怎么获得?2017支付宝爱国福获得最新攻略 2017年AR集福和此前支付宝推出的AR实景红包的扫描界面有些类似,但是AR集福操作更为简单。 据此前官方介绍,只要是 福 字,不管这个字在哪,即便是手写的,都可以是集福的目...
去年转行进入互联网金融,行业大事几乎一个不落,此生无憾。 一位P2P网贷平台从业者这么跟我感慨。 2016年,互联网金融业内问题爆发,资本退烧,监管转向但是在震荡之后,刮骨去毒,新芽勃发,依然一路向前。 促进健康发展到规范发展,...
我觉得要做好商品,主要还是基本面分析。 商品市场波动为什么那么大?我觉得和市场的结构有很大的关系,市场的结构发生了变化,最大的变化是量化交易的比例变多。 (一天的成交量除以一天持仓量)我觉得应该把分母做大,把分子做小,才...
在经历了2016年最后一周暴涨之后,2017年新年首周国内信托理财市场出现了高位回落,成立规模与成立数量均不及2016年最后一周的三分之一。不过分析人士认为,新年首周信托市场迅速回落虽然存在一些偶然因素,并不能代表市场行情趋于恶化...
当着家人的面给红包 这样让孩子脸上显得有面子,如果是别人家的孩子,则一定要当着孩子家长的面给红包,这样,家长能看到,也不至于孩子偷偷把钱花了。 数额要适度,不要攀比 给孩子压岁钱,心意到了就行,切忌攀比。给孩子大数额的压岁...
过年期间,孩子们都会收到很多红包,这些是亲朋好友的美好祝福,同时也是培养孩子金钱观、建立孩子理财决策能力的机会!今天为大家推荐一下零用钱计划制定指南,指导家长帮助孩子使用包括压岁钱在内的零用钱,让孩子从小建立正确的金钱...
鸡年春节临近,网友期盼的红包盛宴也将掀起高潮。从小年夜开始到元宵节,微博将联手企业、明星、媒体、KOL重磅阵容给网友拜年发红包,同时安徽、北京、东方、江苏、陕西五大卫视官微将直播春晚,边看边聊边抢红包。除夕当晚,集齐让红包...
从日起至8月31日,工银信用卡持卡人每周末(含周五、周六、周日)入住香格里拉酒店,并使用工银信用卡进行客房刷卡消费(前台结账日期为周六、周日、周一),即可享受客房半价,优惠最高立减600元。每名客户每月只可享受一次...
春节已经进入倒计时阶段,小伙伴们已经开始陆陆续续踏上回家的路途了,不过难免会遇到晚点,延误,这个时候如果有贵宾休息室就好了,那哪些信用卡有这些权益呢?来看下下面的这篇文章吧 春节回家系列~~春运不用人挤人 春节回家系列~~春...
从18号开始,交行的支付宝和微信快捷支付开始算积分交易了,可以看得出来交行开始发力线上交易,这不刚到第二天,交行的京东支付满减活动就来了: 交行京东支付满减 日至日,在京东商城APP使用京东支付购买实物类...
2017网申光大银行信用卡 首刷送京东E卡 2017光大银行推出不少热门信用卡,有萌萌的小黄鸭主题卡、旅途必备的光大途家联名卡,权益什么的都非常不错,现在通过网络在线申请还有好礼相送噢,只要核卡成功并首刷88元就可以获得一张50元的京...
干货|2017春节期间,境外游信用卡有哪些优惠活动? 无论是境外游还是海淘 血拼 ,各家卡组织和信用卡中心都推出了一系列优惠活动。养 卡 千日,用 卡 一时,带着卡片去旅行,不仅能解决支付问题,还能享受各种折上折和返现优惠,自然是...
广发信用卡积分规则_广发银行信用卡积分如何使用? 广发银行信用卡积分如何使用?最近有非常多的网友都在咨询小编关于广发银行信用卡积分规则和广发银行信用卡积分如何使用的问题,小编这就来给大家一一解答。 一、广发银行信用卡积分规...
人人都说城里好,一个个从农村往城里跑。而在浙江,有这么些个村子,人口噌噌地增长,比城里的房价还难压。 2015年底,浙江在全国率先完成农村集体资产确权工作,全面完成村集体经济股份制改革。这意味着,全省29400多个村社的3500多万...
16日晚间,桃园市警方破获一个主打空姐的应召站,一共逮捕马夫、应召小姐等4人;其中有一对身材姣好、相貌美艳的双胞胎姐妹一同下海,因长相过于相似,2人太忙时还会互相支持,令警方傻眼。 据报道,昨天晚间7点多,桃园市中坜警分局于中...
在租用的小院内自制全聚德烤鸭,半年时间销售了一万七千余袋,获利八万余元。近日,白某因涉嫌假冒注册商标罪,在北京市丰台人民法院出庭受审。 白某以前经营着一家酒店用品公司,此外还销售果脯等北京特产。在销售过程中,一些导游询问...
《南京市人民政府关于深化出租汽车行业改革的实施意见》和《南京市网络预约出租汽车管理暂行办法》昨日正式发布:目前南京街头的35万辆网约车可能只有10%符合新政准入条件;一旦成为网约车,车辆将不能重新恢复非营运性质;南京的传统巡...
日前,《铁路旅客信用记录管理办法(试行)》实施,在动车组列车上吸烟或在其他列车禁烟区域吸烟等7种失信行为被纳入铁路旅客信用信息记录管理。铁路旅客信用信息记录保存期限为5年。(央视记者王溪)????...
中纪委昨天发布消息,天津市政府原党组成员、副市长尹海林因严重违纪受到开除党籍处分,同时还受到行政撤职处分,降为副处级非领导职务。 日前,经中共中央批准,中共中央纪委对天津市政府原党组成员、副市长尹海林严重违纪问题进行了立...
上海公积金自助机具查询服务又添新成员工商银行也加入了大家庭 为方便广大缴存职工了解个人住房公积金账户信息,市公积金中心在已与多家银行开展合作开通了建设银行、农商银行、浦发银行、上海银行、交通银行、农业银行携手推出自助机具...
住房公积金应尽量取出来 公积金存在账户上并不划算,因为当年缴纳的部分只能获得活期存款利率,而往年缴纳的则只能获得三个月的定期存款利率。可如果取出来投资医界贷理财产品,就能获得8%-10.5%的预期年化收益哦~比躺在银行收益高多啦...
12月12日,工商银行湖南省分行营业部与长沙住房公积金管理中心、湖南长银担保投资有限公司举行住房公积金组合贷款三方签约仪式。至此,长沙公积金组合贷款的支持银行已增至4家除工商银行外,长沙公积金组合贷款的支持银行还有建设银行、...
上海公积金提交的过程及所需材料: 昨天晚上从公积金网站(http://www.shgjj.com/)下载填写了两张表格(非常easy),复印了身份证,带了银行卡。早上去静安区这边的公积金办公室8点45分开始,8点50分完成,收到确认文件一份。 我申请了20...
公积金个贷率是什么 ?公积金个贷率如何计算?银行信息港小编为大家介绍详情。 个贷率即住房公积金个贷率,也就是住房公积金个人住房贷款余额与缴存余额之比。住房公积金个人住房贷款余额与缴存余额之比,就是个贷率。而个贷率更是体现...
目前的房子没有房产证,而且所在位置离新东站很近,都说10年内肯定会拆,心里很不踏实。所以想换个有证的房子。 昨晚心血来潮,想到个体工商户是不是可以缴纳住房公积金,然后满足条件后可以用公积金贷款,毕竟目前商贷利率4.9%,而公积...
大病保险 大病保险的保障对象都有谁? 城乡居民大病保险(简称大病保险)是指在城乡居民基本医疗保险的基础上,对大病患者发生的高额医疗费用给予进一步保障的一项制度性安排,是基本医疗保障制度的拓展和延伸。 大病保险保障对象为我省享...
按照方便快捷、运行顺畅、信息资源共享和精简高效的原则,甘肃省临泽县社保局将城乡居民养老保险信息系统延伸至各行政村,构建起覆盖县、镇、社区 的信息网络。通过进一步加强对各镇社会保险工作的指导督查,加大社会保险政策宣传力度,...
过年不慌办年货学好技能好致富 重庆市江津区2017年首期职业技能培训班圆满结束 为有效提高城乡劳动者的技能水平,促进其更高质量就业, 2017年新年伊始,重庆市江津区就业和人才服务局送训下乡,在吴滩镇文化站举办了江津区2017年首期职...
按照 保基本、广覆盖、有弹性、可持续 的基本原则,临泽县以政府代缴的形式将社会弱势群体纳入参保范围,为一、二级重度残疾人和五保户,每人每年代缴养老保险费100元;农村计划生育 两户 家庭(独生子女领证户和二女节育户)每人每年代缴...
大洋网讯 记者从广东省人社厅获悉,省直参保人只要在省社保局网站或者自助服务一体机登记个人信息,有关的养老保险信息就能通过短信定期发送到手机上。从2017年起,省社保局将在每年上半年,向参保人发送上一年度社保个人权益记录手机短...
新春伊始,正是不少外出务工人员回家过年的日子。在临泽县平川镇农业银行服务窗口前,83岁的高龄老人杨发奋正在领取半年来的养老金,准备上街置办年货,老人连声表示 现在国家政策好得很,养老金、高龄补贴样样有 。 村民段忠明激动的说...
大家都爱看
银行信息港部分文章搜集整理自互联网,若您对本网站信息有疑,请联系我们,我们将尽快整改。
银行利率信息港本站网址:http://www.yinhang123.net【风控知识】如何搭建信用风险量化模型
当前,大型金融机构已被监管机构批准使用内部模型来计量风险和监管资本;中小金融机构的积极性也很高,力求借鉴资本管理高级法,调整资产组合,提高资本使用效率,推进管理流程再造,由“干了再算”向“算了再干”转变。
以上趋势令人鼓舞。我们看到,强化风险量化管理的理念正在对中国金融业提高识别、计量和控制风险的能力产生重要的影响,中国金融业风险量化管理水平正在迅速提升。
如何更好地“算了再干”?为了回答这一问题,本文谈一谈金融机构的风险量化模型。为保证风险量化模型的开发质量和实施效果,金融机构所有的风险量化模型都应该参考模型建设和管理技术行业标准进行开发、评估和文档归档。下文总结了国内外信用风险量化模型建设和管理的先进经验,全面遵循这些要求有利于模型的建设、使用、监控、审批、上线。
模型的设计
模型的设计对模型最终是否能实现其目标起着举足轻重的作用。为了保证模型的设计可以满足模型的目标,审批人员应需要关注的是从哪些方面对模型的设计进行评估。总结来说,以下方面要特别留意。
要解决的业务问题
建模人员应该用简单易懂的语言对模型要解决的业务问题进行描述。这些描述应该包括一个或多个已达成共识的业务原则或核心价值,如客户的行为、银行员工的参与度、竞争对手的动作、经济形势的变动、合规的需要、公司战略的考虑等。例如,信用卡部门要设计一个申请评分模型来测算新客户出现不良贷款的风险。这个模型在新客户审批过程的应用中,需要审批人员和客户进行沟通,手动输入一些关键的模型变量数值,在很多情况下还需要对模型的评分结果进行覆盖。这种模型在业务中的应用方式就需要在模型设计开发的过程中,考虑如何解决验证客户提供信息的真实性、员工手动输入数据的可靠性、对模型评分结果覆盖的审批案例如何进行表现监控等问题。
目标变量的定义
建模人员应该对目标变量的定义进行如下描述:明确描述目标变量的定义,并说明为何这样的定义与要解决的任务问题是相关的;明确定义目标变量的表现时间窗(performance window)和观察时间窗:例如,目标变量可以定义为未来12个月贷款出现至少一次60天或60天以上逾期的概率。在这个定义里,“未来12个月”为表现时间窗,“贷款出现至少一次60天或60天以上逾期”为观察时间窗。如果模型需要满足监管部门的要求,此定义是否满足监管部门的要求;为何选择这样的定义而不是其他定义;对定义可能产生的误解进行澄清,如定义是在客户层面还是账号层面的,定义是在观察期之间的表现还是在观察期结束的时间点的表现等。
样本的选择
建模人员应该对建模样本的选择进行如下描述:样本选择的方法,如有随机抽样和非随机抽样(有目的抽样),其中随机抽样方法包括简单随机抽样、等距抽样、分层随机抽样、整群抽样几种常用类型;非随机抽样也称为有目的抽样,包括全面抽样、最大差异抽样、极端个案抽样、典型个案抽样几种常用类型;样本的大小,为了增强可测性和检验的准确性,应该尽量增大样本容量,但同时还应考虑可行性和经济成本;建模样本、保留样本、验证样本的划分;样本可能有的偏差,如必须通过审批的条件限制、经过客户自然流失后的样本、外部因素的变化对样本的影响如产品特征、竞争对手的策略、经济周期、季节性因素等。
分析的方法
分析方法的描述应该包括以下内容:数据获取渠道的描述,主要分为直接渠道和间接渠道:直接渠道主要指通过统计调查获得的第一手统计数据,如办理信用卡业务时客户填写的个人信息资料、当下十分流行的大数据方法等;间接渠道通常指通过查阅资料或者通过其他网站、平台获取的二手数据,如通过WIND或Bloomberg获得数据;模型的结构,根据所作的假设分析对象的因果关系,利用对象的内在规律和适当的数学工具,构建各个变量间的等式关系或其他的数学结构。同时,在建模过程中还应注意细节问题,如客户的分群、子模型的架构等;建模技术,在建模过程中常用到的数学方法和计算机技术,如logistic回归、决策树、普通线性回归、分层分析、聚类分析、时间序列等;变量的处理,如变量的剔除、转换、最大最小值的设置、缺失值的处理、变量相关性的处理等。
模型验证过程
验证模型是否有效的描述应包括:随机保留样本的描述,如选取记录集中的一部分(通常是2/3)作为训练集,保留剩余的部分用作测试集。选取随机保留样本的标准、比例、特征等方面的描述;Bootstrap验证,是非参数统计中的一种重要的统计方法,在执行上常需借助计算机技术得以实现。举例来说,当总体可用正态分布描述时,其sampling distribution服从正态分布或服从t分布;但当总体不服从正态分布或未知时,我们采用计算机模拟或用渐进分析的方法更加有效;交叉验证,基本思想是在某种意义下将原始数据进行分组,一部分作为训练集,另一部分作为验证集,首先用训练集进行测试,再利用验证集来测试得到的模型,以此作为评价模型的性能指标。常见方法有Hold-Out Method,K-fold Cross Validation,Leave-One-Out Cross Validation;外来样本的验证,通过外部获取的样本对已有的模型进行检验,判断模型的有效性。
模型的局限性
一般来说,模型的局限性可以分为客观的、不能加以修正的局限性和可以通过人为修正的局限性。验证客观局限性的描述主要包括:系统的局限性;模型的局限性等;验证主观局限性的描述主要包括:建模时间的规划;建模人员的配置、人员水平等;业务和数据的理解上的局限性;样本的局限性;外部因素对模型的影响,如竞争对手的压力、合规时限的压力等。
模型的进度
主要包括有限资源的有效配置,在可以利用的资源数量一定的条件下,通过调配进度使项目工期尽可能短;建模时间的规划,几个有效时间节点的把控,如是否有外部竞争或合规方面的压力而需要在短时间内完成建模等。
如何进行数据处理,是一个非常关键的环节。对于该环节,综观国内外经验,可以从以下八个方面给予关注。
建模原数据源的描述分析
建模数据的评估主要包括:数据的获取渠道,如内部数据集市、历史数据存档、第三方公司提供的数据等;数据的样本记录数及每一条记录所代表的含义;数据的变量的个数;数据的收集时间。
模型变量的描述
模型变量的描述应该包括对每一个变量定义的准确描述及变量的值所对应的含义。定义和使用变量时,通常要把变量名定义为容易使用阅读和能够描述所含数据用处的名称,而不要使用一些难懂的缩写如A或B2等。例如:编写一个销售苹果的软件时,我们需要两个变量来存储苹果的价格和销量。此时,可以定义两个名为Apple_Price和Apple_Sold的变量。每次运行程序时,用户就这两个变量提供具体值,这样看起来就非常直观。
建模样本的大小和目标变量的分布
对此部分的描述应该包括:建模样本的大小是如何决定的;如何获得各个细度的数据记录并有效的控制成本;目标变量的分布,包括异常值、多峰性分布、负值的处理等。
数据时间窗定义
对此部分的描述应该包括:目标变量表现的观察时间:采用滚动时间窗或固定时间窗的方法;模型独立变量的观察时间;模型目标变量和独立变量数据是否有时间不足的情况,如有些样本的目标变量表现观察期不足,模型变量的观察时间不足等。
数据源有效数据的频率和缺失值处理
对此部分的描述应该包括:样本变量数据的有效频率;样本记录中有效记录的频率;某些变量或记录数据缺失的原因,这些缺失原因是否会对模型产生影响或偏差;在建模过程中,如何对数据源的各种数据缺失原因进行考虑。
建模人员应该用简单易懂的语言对模型要解决的业务问题进行描述。这些描述应该包括一个或多个已达成共识的业务原则或核心价值,如客户的行为、银行员工的参与度、竞争对手的动作、经济形势的变动、合规的需要、公司战略的考虑等
每个模型独立变量的缺失值频率;模型独立变量的缺失值是否有具体的含义;缺失值出现的频率是否稳定;有缺失值的变量在模型中的重要性及表现的稳定性;每一个变量对缺失值的处理方法,包括采用中位数、平均数、最大或最小值、最好或最坏值替代,单变量处理,多变量处理,以变量减少、建模或评分、或拒绝原因算法为目标的处理等。
变量最大、最小值处理
对此部分的描述应该包括:每个变量的最大或最小值;对最大或最小值的处理方法;处理后对这些变量取值范围的影响以及数据记录表现的影响;以变量减少、建模或评分、或拒绝原因算法为目标的最大或最小值设置;这些设置是否能防止所有可能出现的取值错误。
对此部分的描述应该包括:单变量转换,如反正弦、对数、开方、Box-Cox等;多变量转换,如变量之间相除、相减、相加、相乘等;变量取值的划分或归成大类;变量转换的处理程序及编程方法;这些设置是否能防止所有可能出现的取值;采用Weight of Evidence(WoE)方法(该方法在生态风险评估ERA领域使用多年,能结合多方面数据给出总体风险评估)进行分栏并计算Information Value来验证。
数据的外部因素
可能影响目标变量表现的外部因素主要有:国家或区域的经济环境;宏观经济指标;产品特征;获客渠道;主要竞争对手的策略;天气因素;季节性周期因素等。
模型的选择
模型审批人员应该对建模的方法及模型的表现是否能够到达预期的目标进行诊断和评估,这是一个至关重要的步骤。从具体实施的角度而言,评估应该至少包含以下九个方面内容。
子模型分割方法
模型分割(子模型)的方法应该包括以下内容:分割优化的标准及目的:如对无数据记录的处理、模型表现的连续性考虑、变量相关性的区格、变量预测能力的区格等;选择分割的手段,如历史数据分析、CART分析、贝叶斯树等;采用分割后对模型的表现所带来的提升的数据支持,尤其要说明表现的提升足以覆盖由于分割所带来的模型复杂度增加的负担。
模型独立变量剔除或合并的考虑因素包括:变量缺失的频率;变量的波动性;变量组合;变量聚类,将集合分成由类似的对象组成的多个类;变量之间的相关性检验,如采用相关系数矩阵,Pearson 相关系数或者Spearman 相关系数方法;不同分割模型(子模型)变量的同质性检验,用卡方统计量验证不同子模型是否来自同一总体;变量选择的方式:如向前选择、向后选择、逐步选择等;变量的交叉验证。
模型优化的标准
对此部分的描述应该明确定义模型优化的标准,进而说明为何候选模型是最佳的选择。如果选择多个指标,应说明多个指标的选择标准,例如:KS值, 决策边际变现等。对于需要满足监管要求的模型,要将监管要求融入到选择模型优化的过程中。
模型参数的确定
对此部分的描述应该明确模型选择的方法,包括:如何确定模型的参数;如何从众多的候选模型中选择最终的模型;VIF(Variance Inflation Factor)检验,判断模型是否存在多重共线性问题,经验判断方法表明:当0&VIF&10,不存在多重共线性;当10≤VIF&100,存在较强的多重共线性;当VIF≥100,存在严重多重共线性,此时模型效率低;如何对模型的参数进行平滑处理;如何确定模型的变量及结构是简单适用的;如何防止拟合不足或拟合过度。
建模程序的结构
对此部分的描述应该说明建模使用的程序的结构,包括:处理原始数据的所有的程序,从开始到结束;程序是否具有恰当的标注和结构说明,如数据处理部分,变量选择部分,候选模型比较部分等;程序是否被妥善统一存档,存档是否可以被访问,程序是否可以被其他人运行这些具体备注说明。
建模程序细节
对此部分的描述应该选择一段建模程序进行评估,评估内容包括:程序的标注是否充分,程序的结构是否容易理解;变量的名称、标识是否简单易懂;容易误解或复杂的部分是否有特殊标注;程序引用的模块是否有相应的文档;程序格式是否恰当使用缩进和空格;程序的作者是否标注;在程序的开发、运行和程序的重复使用之间是否保持恰当的平衡。
模型的表现
对此部分的描述应该评价模型对目标行为预测的能力,主要包括:建模样本的表现;非建模样本的表现:如果和建模样本表现不同,要解释表现不同的原因;对未来样本表现的预期;对所有未来可能影响模型表现的不确定性因素是如何考虑的。
模型是否拟合不足或拟合过度
任何模型都可能会有拟合不足或拟合过度的问题,对拟合度的评估可以在几个不同的层面展开,如使用可决系数对模型进行拟合优度检验,使用模拟数据或其他历史数据对模型进行再次验证,是否有以往的经验或数据来验证模型等。
残差分析主要是:用残差证实模型的假定,如用残差图判断模型效果与样本数据的质量,检验模型是否满足基本假定,以便对模型作进一步的修改;用残差检测异常值和有影响的观测值,如果异常值是一个错误数据,如是由记录错误造成,应该修正数据,以便改善模型效果;如果是由于模型的假定不合理,使得标准化残差偏大,应该考虑修正模型;如果完全是由于随机因素造成的,则应该将该数据视为有效观测值,予以保留。同时应注意的问题有:残差是否是随机分布的;一个或几个记录的变化是否会对整个模型有较大的影响;不同的取样方法是否会产生不同的模型或不同的残差分布。
模型的最终审批
模型审批人员在最终批准模型之前,应对以下三个方面进行评估。
1、模型替换分析
任何模型都会有几个不同的版本,如原有模型,简单的业务逻辑替代的模型,和第三方公司的模型。模型审批人员应该就最终的模型版本和其他版本进行比较,进行优劣分析,包括:如果不用这个模型,业务模式会如何展开?对原来被否决,新模型会批准的样本进行分析并评估对业务的影响;待审批的模型和其他模型相比,有哪些优势?这些优势是如何获得的,它们是否符合基本的业务逻辑;模型在应用的目标客户群内的主要的独立变量的分布是否符合业务逻辑?和其他模型的版本相比,它们是否和上述的新版本的模型优势相吻合?应用测试技术对现有模型进行挑战,模型上线的版本策略如过度阶段和原模型或其他规则共用等。
2、监控策略
模型的监控策略应包括以下内容:监控的主要指标,频率;监控报告的审阅人员及存档流程;对于监控的指标来讲,稳定性指标和准确性指标通常只是最低标准;稳定性指标应该包括模型目标变量和独立变量的稳定性监控;模型指标的参考客群是如何定义的;模型的目标应用客群如果发生变化,如何能够识别目标客群的变化?如何对模型的表现进行有效的跟踪?监控程序是否经过调试和验证;如果数据导入出错,如何对错误信息进行识别和报警?如果模型运行失败,业务开展的备用方案是什么?识别模型失败的流程和重新启动模型运行的流程各是什么?在什么情况下,建模人员需要对模型进行重新评估或重新建模?明确定义这些情况下主要表现指标的临界值。
3、未来规划
模型的未来规划应描述模型如何进一步提高,具体包括:如何获得更客观全面的样本?客观全面的样本应该包括正常业务运营之外的样本,例如申请审批的样本应包括所有申请客户的表现而不仅仅是通过审批的客户的表现;对于审批模型的临界值附近的样本,业务是否需要加大样本收集的力度为未来的建模做准备;样本收集的经济成本和流程成本各有多大?投入是否值得?未来的业务规划的大方向是什么?模型的样本采集策略应如何配合业务发展的需要?是否有其他数据源或建模技术能够进一步提升模型的表现?
与自动决策
神州融充分借鉴和引入Experian(益博睿)全球零售及小微金融信贷风控和流程管理的最佳实践,结合其在本土个人及小微金融信贷业务的丰富经验,依据“信贷工厂”的运作理念、以量化风控与自动决策为核心,构建了专门针对小微金融机构的大数据风控平台,并安全稳定运营在阿里金融云上,通过构建量化评分模型与策略决策体系,满足精准风险评估和未来批量化、规模化业务发展的要求,实现审批作业的集中管理,降低业务的信用风险和操作风险。“神州融希望将量化的风控决策能力和IT技术开放给小微机构,让他们能够像银行一样健壮。”神州融联合创始人黄海珈介绍。
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
整合了国内权威的第三方征信数据资源和电商平台信贷应用场景,为P2
整合了国内权威的第三方征信数据资源和电商平台信贷应用场景,为P2
今日搜狐热点

我要回帖

更多关于 信贷风控模型 的文章

 

随机推荐