当前位置:首页 » 贷款类型 » 企业贷款风控模型训练数据
扩展阅读

企业贷款风控模型训练数据

发布时间: 2022-04-30 14:39:43

1. 大数据风控是什么

大数据风控指的就是大数据风险控制,是指通过运用大数据构建模型的方法进行风险控制和风险提示。通过采集大量企业或个人的各项指标进行数据建模的大数据风控更为科学有效。

大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据风控主要是通过建立数据风险模型,筛选海量数据,提取出对企业有用的数据,再进行分析判断风险性。

(1)企业贷款风控模型训练数据扩展阅读

大数据风控能解决的问题:

1、有效提高审核的效率和有效性:

引入大数据风控技术手段分析,通过多维度的信息分析、过滤、交叉验证、汇总,可以形成一张全面的申请人数据画像,辅助审核决策,可以提高审核的效率和有效性。 

2、有效降低信息的不对称:

引入大数据风控技术手段分析,通过多维度的信息分析、过滤、交叉验证、汇总,可以形成一张全面的申请人数据画像,辅助审核决策,可以提高审核的效率和有效性。 

3、有效进行贷后检测:

通过大数据技术手段对贷款人进行多维度动态事件(如保险出险、频繁多头借贷、同类型平台新增逾期等)分析,做到及时预警。

参考资料来源:网络-大数据风控

2. 信贷系统中是如何做风控的

信贷系统的风控主要依赖于大数据。各维度的数据经过分析整合,形成风控系统或者风控模型,为审核提供智能参考依据。要说做的算不错的,像阿尔法象、同盾、长亮,这些都是市面上卖的比较好的。

3. 大数据如何助力金融机构搭建风控模型

"Mo‌b‌Te‌ch是一家大数据智能科技公司,为金融机构提供不同场景下的解决方案。拿小额贷款的案例来看,他们的一站式风控建模大数据平台,提供数据匹配,特征筛选,模型迭代,自定义模型开发功能,模型管理部署,自动化模型上线API输出等产品服务;提供针对小额借贷,消费金融、车贷等场景的成熟特征,可定制化各类场景衍生特征;覆盖90%android设备。
可在云端轻松构建出独属于自己的数据智能解决方案,也可通过私有化部署,加强数据的安全性。

4. 如何利用大数据做金融风控

大数据能够进行数据变现的商业模式目前就是两个,一个是精准营销,典型的场景是商品推荐和精准广告投放,另外一个是大数据风控,典型的场景是互联网金融的大数据风控。

金融的本质是风险管理,风控是所有金融业务的核心。典型的金融借贷业务例如抵押贷款、消费贷款、P2P、供应链金融、以及票据融资都需要数据风控识别欺诈用户及评估用户信用等级。

传统金融的风控主要利用了信用属性强大的金融数据,一般采用20个纬度左右的数据,利用评分来识别客户的还款能力和还款意愿。信用相关程度强的数据 纬度为十个左右,包含年龄、职业、收入、学历、工作单位、借贷情况、房产,汽车、单位、还贷记录等,金融企业参考用户提交的数据进行打分,最后得到申请人 的信用评分,依据评分来决定是否贷款以及贷款额度。其他同信用相关的数据还有区域、产品、理财方式、行业、缴款方式、缴款记录、金额、时间、频率等。普惠在线

互联网金融的大数据风控并不是完全改变传统风控,实际是丰富传统风控的数据纬度。互联网风控中,首先还是利用信用属性强的金融数据,判断借款人的还 款能力和还款意愿,然后在利用信用属性较弱的行为数据进行补充,一般是利用数据的关联分析来判断借款人的信用情况,借助数据模型来揭示某些行为特征和信用 风险之间的关系。

互联网金融公司利用大数据进行风控时,都是利用多维度数据来识别借款人风险。同信用相关的数据越多地被用于借款人风险评估,借款人的信用风险就被揭示的更充分,信用评分就会更加客观,接近借款人实际风险。

常用的互联网金融大数据风控方式有以下几种:

验证借款人身份
验证借款人身份的五因素认证是姓名、手机号、身份证号、银行卡号、家庭地址。企业可以借助国政通的数据来验证姓名、身份证号,借助银联数据来验证银行卡号和姓名,利用运营商数据来验证手机号、姓名、身份证号、家庭住址。

如果借款人是欺诈用户,这五个信息都可以买到。这个时候就需要进行人脸识别了,人脸识别等原理是调用国政通/公安局 API接口,将申请人实时拍摄的照片/视频同客户预留在公安的身份证进行识别,通过人脸识别技术验证申请人是否是借款人本人。

其他的验证客户的方式包括让客户出示其他银行的信用卡及刷卡记录,或者验证客户的学历证书和身份认证。
分析提交的信息来识别欺诈

大部分的贷款申请都从线下移到了线上,特别是在互联网金融领域,消费贷和学生贷都是以线上申请为主的。
线上申请时,申请人会按照贷款公司的要求填写多维度信息例如户籍地址,居住地址,工作单位,单位电话,单位名称等。如果是欺诈用户,其填写的信息往 往会出现一些规律,企业可根据异常填写记录来识别欺诈。例如填写不同城市居住小区名字相同、填写的不同城市,不同单位的电话相同、不同单位的地址街道相 同、单位名称相同、甚至居住的楼层和号码都相同。还有一些填写假的小区、地址和单位名称以及电话等。

如果企业发现一些重复的信息和电话号码,申请人欺诈的可能性就会很高。

分析客户线上申请行为来识别欺诈

欺诈用户往往事先准备好用户基本信息,在申请过程中,快速进行填写,批量作业,在多家网站进行申请,通过提高申请量来获得更多的贷款。

企业可以借助于SDK或JS来采集申请人在各个环节的行为,计算客户阅读条款的时间,填写信息的时间,申请贷款的时间等,如果这些申请时间大大小于 正常客户申请时间,例如填写地址信息小于2秒,阅读条款少于3秒钟,申请贷款低于20秒等。用户申请的时间也很关键,一般晚上11点以后申请贷款的申请 人,欺诈比例和违约比例较高。

这些异常申请行为可能揭示申请人具有欺诈倾向,企业可以结合其他的信息来判断客户是否为欺诈用户。
利用黑名单和灰名单识别风险

互联网金融公司面临的主要风险为恶意欺诈,70%左右的信贷损失来源于申请人的恶意欺诈。客户逾期或者违约贷款中至少有30%左右可以收回,另外的一些可以通过催收公司进行催收,M2逾期的回收率在20%左右。

市场上有近百家的公司从事个人征信相关工作,其主要的商业模式是反欺诈识别,灰名单识别,以及客户征信评分。反欺诈识别中,重要的一个参考就是黑名单,市场上领先的大数据风控公司拥有将近1000万左右的黑名单,大部分黑名单是过去十多年积累下来的老赖名单,真正有价值的黑名单在两百万左右。

黑名单来源于民间借贷、线上P2P、信用卡公司、小额借贷等公司的历史违约用户,其中很大一部分不再有借贷行为,参考价值有限。另外一个主要来源是催收公司,催收的成功率一般小于于30%(M3以上的),会产生很多黑名单。

灰名单是逾期但是还没有达到违约的客户(逾期少于3个月的客户),灰名单也还意味着多头借贷,申请人在多个贷款平台进行借贷。总借款数目远远超过其还款能力。

黑名单和灰名单是很好的风控方式,但是各个征信公司所拥有的名单仅仅是市场总量的一部分,很多互联网金融公司不得不接入多个风控公司,来获得更多的 黑名单来提高查得率。央行和上海经信委正在联合多家互联网金融公司建立统一的黑名单平台,但是很多互联网金融公司都不太愿意贡献自家的黑名单,这些黑名单 是用真金白银换来的教训。另外如果让外界知道了自家平台黑名单的数量,会影响其公司声誉,降低公司估值,并令投资者质疑其平台的风控水平。

利用移动设备数据识别欺诈
行为数据中一个比较特殊的就是移动设备数据反欺诈,公司可以利用移动设备的位置信息来验证客户提交的工作地和生活地是否真实,另外来可以根据设备安装的应用活跃来识别多头借贷风险。

欺诈用户一般会使用模拟器进行贷款申请,移动大数据可以识别出贷款人是否使用模拟器。欺诈用户也有一些典型特征,例如很多设备聚集在一个区域,一起 申请贷款。欺诈设备不安装生活和工具用App,仅仅安装和贷款有关的App,可能还安装了一些密码破译软件或者其他的恶意软件。

欺诈用户还有可能不停更换SIM卡和手机,利用SIM卡和手机绑定时间和频次可以识别出部分欺诈用户。另外欺诈用户也会购买一些已经淘汰的手机,其机器上面的操作系统已经过时很久,所安装的App版本都很旧。这些特征可以识别出一些欺诈用户。

利用消费记录来进行评分

大会数据风控除了可以识别出坏人,还可以评估贷款人的还款能力。过去传统金融依据借款人的收入来判断其还款能力,但是有些客户拥有工资以外的收入,例如投资收入、顾问咨询收入等。另外一些客户可能从父母、伴侣、朋友那里获得其他的财政支持,拥有较高的支付能力。

按照传统金融的做法,在家不工作照顾家庭的主妇可能还款能力较弱。无法给其提供贷款,但是其丈夫收入很高,家庭日常支出由其太太做主。这种情况,就需要消费数据来证明其还款能力了。

常用的消费记录由银行卡消费、电商购物、公共事业费记录、大宗商品消费等。还可以参考航空记录、手机话费、特殊会员消费等方式。例如头等舱乘坐次数,物业费高低、高尔夫球俱乐部消费,游艇俱乐部会员费用,奢侈品会员,豪车4S店消费记录等消费数据可以作为其信用评分重要参考。

互联网金融的主要客户是屌丝,其电商消费记录、旅游消费记录、以及加油消费记录都可以作为评估其信用的依据。有的互联金融公司专门从事个人电商消费数据分析,只要客户授权其登陆电商网站,其可以借助于工具将客户历史消费数据全部抓取并进行汇总和评分。

参考社会关系来评估信用情况

物以类聚,人与群分。一般情况下,信用好的人,他的朋友信用也很好。信用不好的人,他的朋友的信用分也很低,

参考借款人常联系的朋友信用评分可以评价借款人的信用情况,一般会采用经常打电话的朋友作为样本,评估经常联系的几个人(不超过6六个人)的信用评分,去掉一个最高分,去掉一个最低分,取其中的平均值来判断借款人的信用。这种方式挑战很大,只是依靠手机号码来判断个人信用可信度不高。一般仅仅用于反欺诈识别,利用其经常通话的手机号在黑名单库里面进行匹配,如果命中,则此申请人的风险较高,需要进一步进行调查。

参考借款人社会属性和行为来评估信用

参考过去互联网金融风控的经验发现,拥有伴侣和子女的借款人,其贷款违约率较低;年龄大的人比年龄低的人贷款违约率要高,其中50岁左右的贷款人违 约率最高,30岁左右的人违约率最低。贷款用于家庭消费和教育的贷款人,其贷款违约率低;声明月收入超过3万的人比声明月收入低于1万5千的人贷款违约率 高;贷款次数多的人,其贷款违约率低于第一次贷款的人。

经常不交公共事业费和物业费的人,其贷款违约率较高。经常换工作,收入不稳定的人贷款违约率较高。经常参加社会公益活动的人,成为各种组织会员的人,其贷款违约率低。经常更换手机号码的人贷款违约率比一直使用一个电话号码的人高很多。

午夜经常上网,很晚发微博,生活不规律,经常在各个城市跑的申请人,其带贷款违约率比其他人高30%。刻意隐瞒自己过去经历和联系方式,填写简单信 息的人,比信息填写丰富的人违约概率高20%。借款时间长的人比借款时间短短人,逾期和违约概率高20%左右。拥有汽车的贷款人比没有汽车的贷款人,贷款 违约率低10%左右。

利用司法信息评估风险

涉毒涉赌以及涉嫌治安处罚的人,其信用情况不是太好,特别是涉赌和涉毒人员,这些人是高风险人群,一旦获得贷款,其贷款用途不可控,贷款有可能不会得到偿还。

寻找这些涉毒涉赌的嫌疑人,可以利用当地的公安数据,但是难度较大。也可以采用移动设备的位置信息来进行一定程度的识别。如果设备经常在半夜出现在 赌博场所或赌博区域例如澳门,其申请人涉赌的风险就较高。另外中国有些特定的地区,当地的有一部分人群从事涉赌或涉赌行业,一旦申请人填写的居住地址或者 移动设备位置信息涉及这些区域,也要引起重视。涉赌和涉毒的人员工作一般也不太稳定或者没有固定工作收入,如果申请人经常换工作或者经常在某一个阶段没有 收入,这种情况需要引起重视。涉赌和涉毒的人活动规律比较特殊,经常半夜在外面活动,另外也经常住本地宾馆,这些信息都可以参考移动大数据进行识别。

总之,互联网金融的大数据风控采用了用户社会行为和社会属性数据,在一定程度上补充了传统风控数据维度不足的缺点,能够更加全面识别出欺诈客户,评价客户的风险水平。互联网金融企业通过分析申请人的社会行为数据来控制信用风险,将资金借给合格贷款人,保证资金的安全。

5. 现金贷风控模式,你看的懂么

近段时间,对于现金贷的监管已经箭在弦上。一方面,许多中小型现金贷平台的实际借款利率过高;另一方面,部分平台对于现金贷业务的风控更像是“皇帝的新衣”,以至于整个行业的坏账率居高不下。

从监管层面看,现金贷业务为了继续经营,将不得不大幅削减贷款利率,减少各类手续费。因此,通过提高风控水平,减少坏账损失,成了保证现金贷业务经营利润的唯一出路。

一、浅析现金贷风控体系:点——面——点的过程

第一个“点”是指起点。现金贷风控体系的设计需要以产品本身作为起点。现金贷产品无外乎四个要素:利率(包括各种费率)、期限、额度、目标人群。对于每一类目标人群而言,他们在流动性需求、未来可预期现金流、消费观念、收入水平以及信用状况等维度上都具有一定的规律和共性,进而影响其申请额度、贷款利息的接受水平、还款能力和还款意愿等。因此,合理地设计产品,能在有效降低风控难度的同时,将收入最大化。例如,对于白领人群,其按月发薪的特点更适合一个月及以内的借款期限。

另外,除了现金贷产品本身的特性之外,其推广渠道也颇为重要。如果通过某一推广渠道引入了大量非目标人群,那么这不仅仅降低了推广成本的使用效率和后期风控流程的判断精度,还会产生大量有偏数据,不利于风控模型的迭代升级和产品的再设计。

“面”是指具体的风控流程。从时间段区分:风控流程包括贷前、贷中、贷后三个阶段。其中贷前阶段是整个风控流程的核心阶段。这一阶段包括申请、审核和授信三个步骤。形象地说,贷前阶段是一个过滤杂质的阶段。而第三方的征信数据、黑名单、反欺诈规则、风控模型则是一层层孔径不一的滤网。贷中阶段主要是对借款人个人信息的跟踪和监控。一旦有异常信息的产生,风控人员可以及时地发现、联系该借款人,尽可能保证这笔借款的安全。贷后阶段的工作集中在催收上。此外,如果借款人申请展期或者续贷,则需要在这一阶段结合历史数据,使用行为评分卡等重新进行审核,并作相应的额度调整和风险分池管理。而在整个风控流程中,需要对借款的集中度作妥善管理,防止因为集中借款和集中逾期带来的资金流动性不足的问题。

2.差异化定价

差异化定价,也可以理解为精确定价。现金贷的差异化定价的实质是对各个贷款申请人的信用及欺诈风险作精确定价。目前各个现金贷平台的定价标准都过于单一,基本采用利率加杂费的方式。部分平台对于续贷用户会做费率调整。也有少数平台会参考贷款人申请时提供的个人信息维度。不过总体而言,当前的定价标准并不适合未来现金贷行业“低费率”的特征。平台之间所谓的价格优势将微乎其微。而精确定价下的定制化小额贷款需求可能会成为平台的亮点。

而大数据风控模型的构建为差异化定价的实现提供了技术保证。以大量的网络行为数据、用户交易数据、第三方数据、合作方数据等为基础,通过自然语言处理、机器学习、聚类算法等,模型能够为每一位贷款申请者创建包括个人基本信息、行为特征、心理特征、经济状况、兴趣爱好等在内的多维度数据画像。凭借着这些维度特征和大量历史贷款记录,针对不同贷款人、不同额度、不同期限的差异化定价策略将成为现实。

总结

在行业洗牌的背后,是现金贷平台为了生存下去的努力。如何保证合规性,如何获取低成本的资金,如何以技术替代人力,如何在风控成本和坏账率之间找到平衡点,是平台未来需要思考和解决的问题。网贷交流借款无忧相信在行业政策的探照灯之下,是金子最后总是会发光的。

6. 金融风险管理的体系

互联网大浪潮如今早已席卷全球,中国互联网模式不断进行着变革,数据资产化、金融平台化日益成型,互联网金融创新模式百花齐放。众所周知,金融的本质是风险管理,依托于大数据,新型的风控理念很快吸引了互联网巨头、信贷机构、金融科技安全服务商、银行机构等纷纷发力参与这场技术变革。

一时间,大数据风控成为互联网背景下金融发展的“宠儿”,也成为资本关注的焦点。例如常见的金融借贷业务场景,供应链金融、消费贷款、企业信贷等都需要利用大数据构建智能数据库和模型来识别欺诈用户以及评估用户信用等级,从而提升欺诈交易识别率。

风控一直被视为互联网金融发展的命脉,大数据风控的发展无疑是行业必然趋势,风险控制能力会直接决定平台的生死。安全做得好,金融创新的前景是一片坦途;安全做得差,平台可能被引向穷途末路。

大数据风控-互联网金融的命脉

盛林集团深耕网络安全及大数据领域多年,铸就了企业强有力的核心竞争力,其完善的精准风控体系正是这些金融机构所需要的,从账号风险防护到应用风险防护,再到信用与欺诈风险防护,纵深金融业务的整个生命周期,让交易变得更安全、更可靠。

事实上,风控离不开大数据的支撑,当前市场上流通的数据来源十分混乱,不乏掺杂着来自黑产倒卖的各种有效或者无效数据,因此数据的合规性也成为实现精准风控的前提,没有用户授权的数据业务是不持久的。不仅仅是合规性,数据的感知和预测、数据的修复和再生、数据交易信任评估能力更是数据服务的核心。

所谓道高一尺,魔高一丈,紧随信贷市场和企业的发展,总有一部分群体对反欺诈模型进行研究,寻找漏洞来破解风控命门,这就需要大数据风控模型在业务运行中不断丰富和优化,加入更多复杂特征和更多维度的特征,在贷前、贷中、贷后环节制定全面的服务监控体系,帮助信贷企业降低业务风险。

风险防控一定要从多维度、合法权威的数据源切入,基于深度学习、关系分析、智能决策、态势感知等特性,在海量数据分析的基础上,构建专业有效的规则、模型,结合时空维度立体探查风险规律,智能分析业务风险,实现行业风险实时预警,及时掌控风险态势,阻断欺诈操作。

不可否认,大数据的引入,给金融领域带来了一股暖流。互联网金融领域的风控挑战依旧严峻,不断地在数据开发及应用的道路上践行,努力实现从量变到质变的过程是我们首当其冲要做的。

CFRM(Certified Financial Risk Manager),注册金融风险管理师,由注册金融风险管理师协会(ICFRM)主考并颁发,并同时被纳入中国市场学会金融服务工作委员会(简称“金融委”)建立的全国财经金融专业人才培养工程(简称PFT),是代表风险管理行业的专业水平认证。

7. 互金风控进化史:人工、实地到智能大数据走过哪些曲折

今天大家都已经习惯了线上秒批、数字信用等基于人工智能和大数据的风控体系。但是追溯到十几年前,数字风控却付出过惨重的代价。十几年一路走来,随着大数据以及人工智能等技术的不断完善,互联网金融才真正让大数据风控走向完美。

日前,在玖富集团开放日上,玖富首席数据科学家、首席风险官谷颖讲解了人工智能的应用要素和发展阶段,揭示了智能风控的进化史。

根据她的说法,人工智能应用在金融领域有三个阶段。第一个阶段是机器学习(ML)阶段,即互联网金融为代表的金融机构全面渗透到所有模型建设中;第二个阶段是自然语言处理(NLP)阶段,即国内大量互联网贷款和征信公司都在大量使用自然语言处理技术;第三个阶段是知识图谱(KG)阶段,即大量使用知识图谱进行反欺诈分析。“火眼”风控系统恰恰覆盖了这三个阶段的所有应用,也是目前比较完善的风控系统。

机器学习(ML)阶段解决的核心问题在于,让风控模型自动学习、自动匹配各项数据,在模型内发现异常,揪出信用黑户。尤其是机器学习算法能够根据数百万消费者案例,如:资产、履约、身份、偏好、社会关系及借贷情况等进行开发和训练,利用算法评估预测用户是否会违约、是否会按时归还贷款等。

自然语言处理(NLP)阶段解决的问题则是可以在个人及企业主页、社交媒体中发现蕴含着与违约风险深度关联的深层含义,通过复杂的词向量模型将文本转化为计算机能够识别和计算的词向量表征,并基于深度学习技术对其进行特征提取,最终运用成熟的分类器网络将文本数据与违约风险实现高度的风险挂钩,而通过传统方式很难充分挖掘其风险价值。

知识图谱反欺诈(KG)分析恰恰是最重要的一个环节,因为知识图谱反欺诈需要把所有技术融合在一起,构建图谱,从中发现欺诈行为。这也是很多互联网金融公司目前在主攻的方向。

因为在过去,反欺诈人员需要根据借款人提供的信息,查找多方面资料,进行不同属性的比对,从而发现不良征信人。这种工作复杂而枯燥,为了识别团伙欺诈,往往需要收集、整理、分析各种维度的数据,工作量更是成倍增加。而知识图谱反欺诈能够把把每个客户的信息、以及网络上公开的信息织成一张巨大的关系网,并通过可视化的图形将这种关系展示出来。结合反欺诈部门的经验,找存在欺诈的客户。

写在最后:

虽然如今大部分平台都在采用“大数据技术”来做风控,但审核结果严重趋同,现状不容乐观。真正大数据风控技术需要多云数据源(平台积累、征信机构、同业共享)来支持风控审核模型决策,这恰恰是中国互联网金融企业最需要发展的方向,也是必然需要走过的曲折道路。

8. 小贷系统风控模型是什么

风控模型,计算最高能够承受什么样的高风险客户,同时该如何把这些资产证券化并分散点风险给投行对自己是最有利的。强大的高频交易和程序化交易要求更快速的交易通道和更高效的策略模型;另一方面,快速交易导致投资面临的风险呈指数级增长,从而市场和投资者需要更全面的策略组合和更精准的风控模型进行风险对冲。

风控模型,是风险控制模型的简称。
常见于信贷担保公司,用来对业务进行风险控制。
风控模型当下国内主要有:工商银行开发的风控模型。

在高度精细化的风险控制模型中,很重要的一个环节就是用先进的统计计量模型来更加准确的描述多种金融资产价格波动的关联性。在现实的金融交易中,我们将面对成百上千的金融资产,所以我们需要一个理论上十分灵活、现实中应用有效的统计模型能够同时对大量的风险因子的相关性进行描述、估测和模拟。在科研中,在不断探索,力图在现有的模型基础上,找到更加灵活的模型准确高效描述各高维的金融风险因子之间的相依性。当然,高度量化的数量风险模型,还要在业界实际应用中能够运算相对迅速,这样才能对各种金融组合进行实时的风险预测和监控。
这种高度量化的风控模型,将无时无刻不为交易所、清算所和各大券商经纪公司,实时计算未来各种资产组合的风险度,从而始终将各种金融交易的市场风险控制在合理的范围内,使衍生品市场交易能够稳定运行,最大可能的减少巨大价格波动给市场带来的危机。

9. 什么是大数据风控跟贷款怎么结合

所谓大数据风控,就是用大数据的技术对风险因素进行管控,比如“险查查”,这个就是用很多风险数据来展现风险值,其中有多头借贷、社保公积金、运营商、学信网、人脸识别等技术,有了多个维度,不同数据,这样就可以尽可能减少信贷风险。

10. 互联网金融风控模型,需要多大的数据

1、基于某类特定目标人群、特定行业、商圈等做风控

由于针对特定人员、行业、商圈等垂直目标做深耕,较为容易建立对应的风险点及风控策略。
例如:
针对大学生的消费贷,主要针对大学生人群的特征
针对农业机具行业的融资担保。
针对批发市场商圈的信贷。

2、基于自有平台身份数据、历史交易数据、支付数据、信用数据、行为数据、黑名单/白名单等数据做风控

身份数据:实名认证信息(姓名、身份证号、手机号、银行卡、单位、职位)、行业、家庭住址、单位地址、关系圈等等。
交易数据/支付数据:例如B2C/B2B/C2C电商平台的交易数据,P2P平台的借款、投资的交易数据等。
信用数据:例如P2P平台借款、还款等行为累积形成的信用数据,电商平台根据交易行为形成的信用数据及信用分(京东白条、支付宝花呗),SNS平台的信用数据。
行为数据:例如电商的购买行为、互动行为、实名认证行为(例如类似新浪微博单位认证及好友认证)、修改资料(例如修改家庭及单位住址,通过更换频率来确认职业稳定性)。
黑名单/白名单:信用卡黑名单、账户白名单等。

3、基于第三方平台服务及数据做风控

互联网征信平台(非人行征信)、行业联盟共享数据(例如小贷联盟、P2P联盟) FICO服务
Retail Decisions(ReD)、Maxmind服务
IP地址库、代理服务器、盗卡/伪卡数据库、恶意网址库等
舆情监控及趋势、口碑服务。诸如宏观政策、行业趋势及个体案例的分析等等

4、基于传统行业数据做风控

人行征信、工商、税务、房管、法院、公安、金融机构、车管所、电信、公共事业(水电煤)等传统行业数据。

5、线下实地尽职调查数据

包括自建风控团队做线下尽职调查模式以及与小贷公司、典当、第三方信用管理公司等传统线下企业合作做风控的模式。
虽然貌似与大数据无关,但线下风控数据也是大数据风控的重要数据来源和手段。