oracle布尔类型数据默认值数据风控系统适合信贷行业吗

 普惠金融的发展遇到移动化的浪潮使得消费信贷迎来了高速攀升期,同时也给风控带来了巨大的挑战即在额度区间广、借贷频次高、客群下沉情况下,如    何实现风险鈳控、差异化定价、快速审批幸而大数据和AI技术使得这一切变为可能,拍拍信一直在做这方面的探索旨在整合数据资源、充分发掘数據潜在  价值,帮助金融机构伙伴搭建和优化风控系统本次陈磊将分享相关的实践经验和落地案例。

当前消费金融规模持续增长风险控淛的挑战也与日俱增。

请参见一个风控系统的雏形框架涵盖了用户贷前和贷后的流程。

信息是为决策提供主要支撑在信贷业务中,信息四要素是姓名、身份证、手机号、银行卡号

比如在信息采集上,我们会用AI的技术来提取相关信息比如OCR,用拍照的方式来提供身份证、银行卡号的信息这样做的优点显而易见——提高用户体验,效率快避免伪造的情况。

整个闭环模式中我们会根据不同的客户发起鈈同的策略,对于优质客户会提高额度同时我们也会避免不良资产导致坏账而采取措施。

风险流程就是一个数据的流程包含数据的采集,消化、回收、落地

离开数据,风控就是无水之源

传统的风控数据就是征信类的数据,很显然这是远远不够的。那么新型时代的發展也让我们有新的思考有哪些数据可以为我们的风控作补充。

理想化的数据就是覆盖率高又和风险高度相关的。

这里我们借用金字塔模式来介绍的可用数据:

我们在数据大爆炸的年代什么样的数据都可以使用。

但是怎么使用确实一个挑战。

这些挑战来源于以下几個维度:

在传统银行的风控体系中无论是采用机器学习,还是人工标记都需要专家来看怎么去做,如何做才能发挥作用

鉴于特征提取都是以人为主,这就难免会有局限性很多高维度、宽广度的数据衍生出来新的特征就很难用经验进行捕捉。 

下图是google在使用的一个专家+機器的特征工程模型框架:

  • 左边是比较明显的广度特征专家可以凭经验直接提取

  • 中间广度加深度模型,一些不易解读的数据需要加工重構才能得以解读

  • 右面是需要深层挖掘、层层解析后才会出来的特征

下面是一份团案信息图谱的案例:

信息图谱在业务上的所反映的问题茬于最原始的出发点是什么, 什么形式关联在关联上有什么途径。一层关联比较简单怎样能够发现多层关联才更为关键。

从聚合数据嘚输出与查询可以看出一步关联与二次关联的数据联系。

而更深层次的特征查询能对关系网络形态位置,把非结构化的关系网络转化為一般模型可以能吸收并消化的特征向量从而检测到异常客户。

以上讲了很多特征提取下面是阐述如何落地,从图中模型可以看出主要流程是对不同的数据源做不同的数据提取,抽象到几个风险因子进而提炼出综合风险指数,化繁为简


在风控体系中,我们追求准確性同时也强调健壮性。

准确性是指特征的抽象与提取那么健壮性就是指时间维度上的有效性、场景迁移的可扩展性。

本文来自云栖社区合作伙伴“”了解相关信息可以关注“”微信公众号

而传统的信用测算主要是利用历史借贷数据和财务数据对借款人的违约风险进行分析和判断这种方法尽管在很长一段时间内被广泛的金融机构所使用,但此方法的评价標准单一评估结果不够全面,同时存在一定的滞后性更为严重的是,这种基于历史数据的评估方法无法对缺乏历史借贷数据的借款人進行信用风险评估近年来,金融机构纷纷寻找新的手段借助新的技术,尝试构建新的信用风险评估模型

大数据风控技术正是随着大數据处理技术、计算机科技和互联网技术的出现和升级而产生的一种基于数据挖掘、机器学习等大数据建模方法的信用评估体系,目前被金融机构广泛运用到贷前信审、反欺诈、贷后管理和追偿清收等环节中

一、银行可利用的大数据有哪些?

大数据是指“无法在一定时间范围内用常规工具进行捕捉、管理和处理的巨量数据集合”与传统数据集合相比,大数据不仅仅体现在规模大和复杂性更为重要的是,大数据往往包含了大量的非结构化数据包括图片、视频、语音、地理位置等,具有维度广、时时更新等优势金融业,特别是银行业近年来由于业务积累和渠道搭建,聚集了大量数据成为大数据应用的重要领域。

以银行为例目前银行能够利用的大数据主要包括以丅几个方面:

▲ 表1 目前银行大数据来源及分类

二、银行大数据管理方面存在哪些问题?

1)数据使用效率低:数据的加工和使用超强依赖IT人員不能提供自助式数据服务。

2)外部数据杂乱:外部数据源越来越多如微博、新闻媒体、淘宝、电商数据等,如何将这些外部数据整悝、加工成可供行内正常使用的真实、准确的数据需进一步探索

3)数据类型复杂:数据资源非结构化数据占有很大比重,且数据类型越來越复杂如视频文件、音频文件、图片文件、邮件等,传统的OracleSQL Server等数据库不能满足该类数据的存储、搜索和分析。

4)存在大量的数据孤島:银行等金融机构存在不同类型的应用系统数据被分散在各个应用系统的数据库和文件系统中,导致数据不能有效的共享;跨系统的、综合性的数据搜索、分析困难等

显然,上述数据管理方面存在的问题难以单纯靠人工解决那么如何有效地整合和利用银行积累起来嘚大数据资源,让大数据资源更高地为银行的信用评估服务这就需要搭建综合型的大数据风控平台。

三、大数据风控平台应该是怎样的

大数据风控平台是一款集大数据处理、OLAP分析、在线分析、离线分析、数据挖掘、数据模型、数据可视化展现于一体的综合性大数据分析岼台,它提供了基于hadoop存储、数据立方体预计算的OLAP可视化分析功能使用户通过托拉拽的简单操作即可在亚秒级的时间内完成多维度、全方位的数据分析,并以多种可视化方式展示分析结果集成了主流的数据挖掘算法和工具,帮助用户快速建立数据挖掘模型

大数据风控平囼的基本特征主要有三个:

1)大数据风控平台能够处理的数据种类多,维度更广大数据风控平台不仅重视传统的信贷变量,还可以分析借款主体的社交网络信息等信息能够为信贷缺失的群体提供基本金融服务。

2)大数据风控平台不仅仅关注历史财务数据还更加关注借款主体的行为数据,能够在充分考察借款人借款行为背后的线索和线索之间的关联性基础上进行数据分析降低贷款违约率。

3)大数据风控平台对模型可以不断迭代和动态调整机器学习技术使得大数据风控平台的风控模型可以将原始数据转化成指标需要进行不断的迭代,鈈同模型的权重值可以根据样本进行动态调整反过来也能不断改进模型的评测效果。

四、大数据平台的数据治理方案

搭建一款集数据采集、存储、搜索、加工、分析为一体的大数据平台融合结构化数据、非结构化数据,实现了统一数据架构对海量异构数据的存储归档、信息组织、搜索访问、安全控制、分析可视化,以及数据挖掘、数据治理等如图1所示。

▲ 图1 银行大数据平台数据治理方案

数据是分层佽的不同的数据其属性、处理方式、价值都是不同的,如图2所示:

1)源数据:源数据是各个业务系统中生成的大量的业务生产数据应加强备份和归档工作,防止数据的不完整和损坏

2)归档数据:归档数据又称为细节数据,平台需要抓取所有的源数据进行归档形成完整的数据库。

3)整合数据:对细节数据进行整合形成按照主题存放的汇总数据集市。

4)指标数据:针对客户、员工、管理者计算生成內容丰富的指标数据源,为进一步做数据挖掘准备丰富的数据源

5)决策支持数据:用于决策分析系统、智能化分析系统数据,如客户产品推荐、客户细分、销售预测、精准营销等等

▲ 图2 不同数据层次的处理方案

对于历史数据来源于行内数据平台或其他来自于数据库的数據,行内数据可直接用ETL系统工具直接抽取数据其他数据库数据则可用Sqoop工具抽取,放入HBase通道中从而满足实时历史数据的查询需求,如图3所示

1)文件格式数据:直接使用行内ETL工具直接导入到大数据平台中。

2)实时变更数据:建立专用通道支持数据实时装载到大数据平台Φ。

▲ 图3 行内数据和行外数据整理

对现有各种数据库的各类数据进行清洗、转换、并加载到大数据平台根据代码标准,整合数据类别形成数据覆盖全面、标准化、规范化的数据集市。

大数据平台对结构化数据采用分布式技术的开源数据仓库支持各种报表软件的访问和苐三方软件集成,同时满足结构化数据的计算和存储

大数据平台定义对数据的各种加工任务,主要表现在以下几个方面:

  • 数据集成:根據原有的数据生成新的数据;如根据关联表格设置其他维度生成新的汇总表格等;

  • 文件处理:将视音频文件、图片、邮件等转换成识别文芓;

  • 掘数据:对平台数据进行各类数据挖掘处理如关联分析,分类聚类,回归预测等;

  • 计算指标:实时计算各类指标数据如计算愙户的活跃度,价值忠诚度等。

大数据平台以可视化方式呈现数据查询、数据视图、报表等

五、银行大数据风控平台的建设方案

常见嘚大数据分析平台架构有Hadoop、Spark、Storm、Samza等,而基于Hadoop构建大数据风控平台具有分布式云存储和云计算能力提供了核心分布式数据仓库、分布式列數据库解决方案,还具有良好的扩展性常用在银行大数据风控平台建设中。本文基于Hadoop搭建大数据硬件系统结合JAVA开发,实现海量数据的汾布式存储和处理

1、系统总体硬件框架图

银行大数据风控平台是基于PC服务器部署,无需购买数据库的软件及硬件实现小时级别的安装蔀署。甚至实现数据并行传输、实时数据更新服务、查询数据秒出结果等等系统整体硬件框架如图4所示。

1)分布式计算和存储根据数據量增大快速水平扩展。

2)面向多应用系统多数据类型和多数据源,实现统一数据架构融合结构化、半结构化、非结构化的数据,实現数据的安全控制和统一建模

3)为其他应用系统提供API接口,实现第三方系统数据集成并提供各种数据服务

4)以数据归档为核心,全面實现数据的全生命周期管理和全数据搜索、实时数据分析可视化以及交互式数据发现等

5)支持传统SQL结构化数据访问和传统BI软件的集成。

▲ 图4 大数据风控系统硬件框架图

大数据风控平台的软件设计理念和技术能够解决海量数据容纳问题、多业务数据源整合问题、多数据格式转换问题等,如图5所示

1)整个系统软件部分可基于JAVA开发,运行在Windows和Linux操作系统上节点同时运行在物理机、虚拟机、Linux、Windows上。

2)所有后台數据服务程序可直接运行在JVM上实现灵活、高效的分布式运算。

3)用户使用管理功能可基于J2EE开发WEB用JSF2.0实现,可扩展性强便于二次开发。

4)采用分布式存储和搜索技术数据集中平台最根本的要求是处理海量的数据,高效融合结构化、半结构化、非结构化数据的管理

▲ 图5 夶数据风控系统软件架构

六、银行大数据平台产品应用

通过大数据平台内置现成的客户统一画像,根据获取实时数据实现客户精准画像,通过迁移学习、机器深度学习理论对客户360度画像,分析客户行为习惯甚至实现客户精准营销应用,智能推送优质客户资源严格控淛风险。如图6所示

▲ 图6 银行大数据平台产品应用

银行建立大数据风控平台可用于信贷客户的反欺诈分析、信用等级评估、贷后风险监测預警与催收等环节,严格进行风险防范;重点关注个人客户或企业客户在银行体系内外的负面信息

银行体系内的负面信息包括:信用卡逾期、贷款逾期、黑名单信息等;银行体系外的负面信息包括:P2P/小贷公司等黑名单信息、公检法的诉讼案件信息、国家行政机关处罚信息(笁商、税务、一行三会、协会等)以及网上负面舆情(虚假宣传、误导消费者)等。从这些数据出发全面评估个人客户在银行的风险等级,为銀行的风险防范提供决策支持如图7所示:

▲ 图7 大数据平台产品之风险控制

2、客户画像及用户行为分析

通过大数据风控平台将结构化数据、非结构化数据、半结构化数据统一存放在数据模型之中,并将外部数据与内部数据尽可能的匹配实现对现有客户更加全面、充分、详盡分析,如图8所示

▲ 图8 客户全面行为特征分析和指标运算

为了满足线上营销和线下营销相结合的场景,数据的进入根据营销方式分为实時数据、批量数据、画像指标数据、建立复杂网络体系和客户智能信用分模型

1)实时数据:将客户线上行为日志数据信息实时推送到大數据平台,存入数据模型之中实现数据标准化、统一化工作,并且对实时数据进行线上行为实时分析

2)批量:每日定时将数据汇总到夶数据平台,存入数据模型库中实现数据标准化、统一化的工作,并对数据进行加工

3)画像、指标数据运算:根据预设的场景,进行愙户信息全面画像和各项指标运算从而获得客户的全面特征,以及产品特征

4)构建复杂关系网络体系,实现线上各业务通道场景互通主要实现基金理财平台、三方支付平台、电商/O2O平台、游戏平台、银行网申平台的互通。

5)创建客户智能信用分模型:以全网大数据为基礎结合大数据风控平台,以诸多业务驱动为导向创建客户智能信用分。输入:身份证号手机号;输出:信用评分。

根据客户的负债信息、稳定性、负面信息、行为偏好、还款能力、还款意愿等六个维度结合客户旅游、社交、支付、保险、基金、理财、电商、非银信貸、O2O、银行信息等全网各类数据信息,依据不同加权比重建立客户智能信用分。

3、大数据产品应用之精准营销分析

通过深度学习理论和遷移学习理论对客户进行精准分析获取客户源,并进行理财产品的精准推荐

使用数学模型算法,根据客户或客户群线上连续行为自動校正客户画像或产品画像之间的关联情况分析,从而形成线上产品的推荐服务产品推荐可按照客户可能关心的内容放在醒目位置自动排序,从而有效提升客户体验

将不同产品或业务交叉推荐,根据客户的交易记录分析识别小微企业客户,然后用远程银行来实施交叉營销

根据客户的理财偏好、资产规模、年龄、工作等维度,分析其潜在的金融服务需求进行有针对性的营销推广。

除了内部交叉营销銷售、客户忠诚度分析、向上销售等传统的分析性内容外还需要利用大数据平台,将行内数据与外部数据整合建立精准营销数学模型,寻找更多的营销机会

  • 寻找理财客户:利用大数据平台筛选客户资金在5万及以上的储蓄存款客户,不定时的推送理财产品信息;对于行外客户借助于P2P平台或第三方平台推送的白名单客户,可以为其提供理财服务将资金留在本行。

  • 寻找贷款客户:结合行内数据、第三方房产网数据以及移动设备位置信息通过数据平台寻找可能购房或购车客户群体,为其提供金融服务

通过对特定数据分析和提取、产品核算,对比各类客户的产品使用率、收益率结合互联网舆情信息,对不同客户群设计差异化的创新产品

根据产品评价指标建设评价模型,实现对产品的系统评分获取每个产品指标数据,可采用登记评分法对数据进行处理反应每个产品的每项指标在组内产品的排序。

  • 阔 针对零售行业,提供商品管悝在线支付、订单管理等服务,一站式在线交易的方式更加灵活快捷支付、订单管理及发货全部流程都可以在小程序完成,直观快捷 另外还有婚庆、教育、酒店、汽车、房产等,迅响可根据行业类型及特点细分为不同客户制定最优方案,赋能行业构建务,达到營销推广、转化的目的

  • 维登录入口,基于协议正向代技术和远程访问隔离技术实现对服务器、云主机、数据库、应用系统等云上资源的集中管理和运维审计。 华为云堡垒机已被广泛应用于互联网、金融、民生政务等行业适用于有严审计合规要求、高效稳定的运维诉求,以及有大量资产和众多人员管理需求的场景

  • 无需专线接入,多终端协同第三方平台集成,高效协作 金融行业 典型应用场景 基金/期货/证券公司新品讨论会、新务全员培训、远程金融专家顾问咨询、偏远中小企及个人放贷咨询。 华为会议云服务可以实现跨企交鋶、跨国交流无需账号登录即可快速入会。领先的音视频处技术仅需1~2M普通互联网带宽即可

  • 量数据的处,该领域需要硬件加速来解決生物计算量的性能瓶颈FPGA云服务器提供的强大的可编程的硬件计算能力可以很好满足海量生物数据快速计算的需求。 金融险分析:金融行业对计算能力、基于超低时延和高吞吐能力的及时响应有很高的要求比如基于定价树模型的金融计算、高频金融交易、基金

  • 和可透視的管理后台,让管理者实时掌握员工学习动态和成果汇报 5.微信营销:百家云自主研发的社群运营管理系统,能够协助企客户将社群運营、管理效率提升数倍让社群客户管理规范化、专化、系统化,打造专属私域流量主要功能包括微信群机器人、微信群裂变工具、微信公众号管理、知识库、海

  • Store打通了智能安防产链上下游原本的蔽塞关系,实际上是在对传统安防的产链进一次声势浩大的重构 而从整个安防行业来看,行业的价值从硬件向软件转移产链中的各个环节也需要使自己更加靠近智能化“口”。比如:安防分销商多年来已经被逐渐边缘化为压货商生存堪忧,但新的产分工或许会使他们成为“智能军事”、“AI管家”

  • 区智能务应用多年。对荇业内的智能应用有着深刻的解在华为发布好望系列产品之后,峰杰被华为好望AI念吸引申请成为华为好望的合作伙伴。 油气行业罙度玩法 玩法一 基于视频图像的智慧工地综合管理平台 峰杰针对管道建设、储油罐大修开发了一套基于视频图像的智慧工地综合管理平囼。该

  • 应用价值:通过该系统功能可以帮助企制定生产计划实施掌握生产进 度,高效管理生产过程提高生产效率,降低人工成本 產品功能:VISION可视化看板管理 包括生产计划制定,工单分解和派发 质量反馈,数据分析等功能 应用价值:通过对生产过程中管理数据设備运过程中工数据的收集,从效 率、

  • 通过模块化的检测服务针对不同位置摄像头视频进个性化分析 实时分析 拥有高并发低延时实時视频分析能力,提供及时、可靠的安全保障 高性价比 支持边缘接入与处大幅降低务接入成本 2.园区人分析 实时对园区内活动人進分析,通过配置人黑名单识别跟踪高险人员并告警;统计关键路口的人流量,支撑园区制定管理策略

  • 关联分析; 数据存储在鈈同库不易进统一管理和维护。 解决方案: 以数据仓库服务DWS为核心构建统一免运维、高可靠的数据存储和分析平台; 利用DWS汇聚各类數据(务数据、用户为数据、招投标数据等),实现一站式数据存储、加工、分析支撑务数据查询、BI报表、精准推荐等场景。

  • NoSQL兼嫆Cassandra接口拥有超强写入性能,专为密集写入而设计它适用于各种不同的行业,例如制造、物流、医疗保健、房地产、能源生产、农等等无论传感器类型如何,都可以很好地处传入数据并为进一步的数据分析提供了可能。 优势: 超强写入:相比于其他NoSQL服務拥有超强的写入性能。

  • 操作简单:华为云CDN接入方式简单快速提供自助化域名管理,并且支持多种可定制配置项方便客户进统计汾析、日志管理、自定义缓存策略。 稳定可靠:拥有全务加速的技术能力包括网站加速、下载加速、视频加速,针对您的多种务提供一站式的加速解决方案提升整体用户体验。

  • 对于金融、安全等行业用户务数据的敏感性要求将数据务保留在本地的IDC中而将一般务部署在云上,并需要进统一管理 开发与部署分离 出于IP安全的考虑,用户希望将生产环境部署在公有云上而将开发环境部署在本哋的IDC。 价值: 云容器引擎利用容器环境无关的特性将私有云和公

  • 移动互联解决方案包含电商、网站、移动APP、金融场景,提供弹性云端环境、资源全生命周期管理、数据安全及移动互联云生态支持亿级并发连接,百万级交易处和大数据分析能力保障系统可靠与性能。 务挑战 快速响应并发高峰 网站、移动APP、电商等务场景有时瞬间访问量达亿级,交易处量达百万级导致服务器

  • 建议搭配使用 专属BMS DESS 金融保险类数据合规上云 提供专属隔离的硬件设备结合全流程、全方位、全态势的安全网络架构,保证了互联网金融、传统金融核心不同咹全等级的建设要求以及多个平台的安全互通,确保金融务合规上云 支持务:互联网信贷、金融控、金融核心交易、保单交易、保险大数据分析等场景

我要回帖

更多关于 oracle布尔类型数据默认值 的文章

 

随机推荐