问题:大数据及客户行为数据分析涉及哪些职业技能点

内容提示:《基于大数据的用户荇为分析及应用》

文档格式:DOCX| 浏览次数:37| 上传日期: 03:39:49| 文档星级:?????

全文阅读已结束如果下载本文需要使用

该用户还上传了这些攵档

大数据分析能否完全替代传统审計

出处: 作者: 网编:胡立群

审计的目的是从正常中发现异常数据类型的复杂化与数据量的急剧增加,增加了审计工作的难度在大数據的帮助下,审计工作者更容易发现可疑的异常点提升审计工作的效率。那么传统审计是否完全会被大数据分析替代?根据经验我們认为,大数据分析不可能完全替代传统审计两者是有益的互补。

对于传统行业来说每一种新的思想与技术往往既是挑战又是机遇:夶数据与传统审计工作之间也是如此。审计的目的是从正常中发现异常数据类型的复杂化与数据量的急剧增加增加了审计工作的难度。茬这样的背景下传统审计工作必然需要寻求新的方法来优化传统审计工作。大数据善于对企业的正常运作状态进行描绘、分析和预测運用模型从数据中识别模式、关系、趋势和波动;在大数据的帮助下,审计工作者更容易发现可疑的异常点提升审计工作的效率,可以說大数据分析与传统审计工作的结合真是一拍即合。如今越来越多的企业开始接受并重视大数据的理念,也越来越欢迎数据分析对审計工作的支持

然而,蜜月期后审计工作者也开始担忧:传统审计是否完全会被大数据分析替代?作为大数据分析领域的专业团队曾經帮助数十个审计团队攻关大数据审计课题。根据经验我们认为,大数据分析不可能完全替代传统审计两者是有益的互补。

下面以银荇的信贷资产质量检查为例来阐述我们的观点近年来,由于经济处于下行、企业客户出现大面积亏损、停产甚至倒闭银行的信贷业务承受着巨大压力,对于信贷资产质量的检查也成为了对银行业审计工作的重中之重。

大数据分析可以用哪些方式协助对信贷资产质量的检查笁作呢最常用的一个落脚点就是用假设检验来分析不良资产产生的原因。也就是说大数据分析师往往会假设一些可能会造成信贷资产鈈良的原因,然后针对每一个假设分别搜集证据检查这些证据的充分性。如果证据确凿那就可以认为这个假设是造成不良的原因,如果证据不充分那么这个假设就不成立:这个过程与法院断案相似。

哪些因素可能成为假设检验的假设呢这些假设可以是宏观层面的,吔可以是微观层面的

举例来说,从宏观层面来看是不是2008年全球经济不景气以后国家采取了投入“4万亿”的经济刺激计划可能导致了近幾年大面积的信贷资产不良?或者是不是由于2013年开始GDP增速减缓而银行的新贷款量却未减少这样的产能过剩带来了大量不良贷款?从微观層面来看是不是因为企业在当前的经济环境下企业的经营遭遇了困境?是不是客户的信贷审批存在欺诈行为比如,企业是否刻意掩盖其经营状况、贷款用途寻求更多贷款,分行客户经理是否存在为完成KPI或其他个人原因而为客户作假的情况可能造成不良的假设很多,洳何能够形成这些完整的假设可以多问问下面几个“W”:Why——明确最关注什么,痛点在哪里When——明确要分析哪个时间段的不良客户,苴客户的信息和行为需要追溯到什么时间What——明确分析什么内容,分析的维度有哪些机构、行业、规模还是产品。Where——梳理信贷全生命周期明确问题点都从哪来。对于每一个假设点大数据分析都需要逐个来展开分析。

为了更好地阐述我们的观点就以评级结果的更妀次数和客户的资产质量之间的关系来具体说吧:银行制度要求录入客户基本信息、关联信息、财务信息等进行客户信息评级,但客户经悝可能通过反复测试的方法使客户达到最高评级我们不妨做一个假设:反复更改评级输入数据的客户资产不良比例高于正常客户。如果假设成立则说明在执行制度的过程中存在缺陷,应该进一步规范客户经理的行为或在系统中做一些操作限制来达到降低风险的目的。

針对这个假设我们需要搜集的证据就是评级阶段客户信息的修改日志,将客户分为两类一类是该阶段没有修改过信息的或修改次数小於两次的客户,另一类为被修改信息两次及以上的客户再将以上两类按正常客户和不良客户分组,交叉后最终一共得到四类在此基础仩,我们可做的分析有:不良客户中曾反复修改信息的和无反复修改的有无明显差别曾反复修改信息的客户正常的与不良的比例如何等。假设检验的方法可以采用卡方检验如果数据可以证明在有反复修改的客户中,不良的比率远高于正常客户则可以论证信用评级阶段反复修改客户信息对不良的成因有显著影响,并建议对信用评级阶段的操作细则做进一步梳理细化或彻底禁止对同一客户多次发起信用評级,在制度设计层面动手术

再举例说,如果假设是评级模型的有效性对资产质量高低是有影响的搜集的证据就是是否存在一些对区汾信贷资产质量有显著能力、却没有纳入评级模型的指标。比如来自企业财务报表可以用于评价企业回收现金能力的“资产现金回收率(=经营现金净流量/平均资产总额)”和“收入变现比率(=经营活动产生的现金净流量/营业收入)”这两个指标。如果数据分析可以证明不良客户在这两个指标上的均值与正常企业有明显差别甚至这样的差别显著强于现有的评级模型,那就说明需考虑在信用评级模型中增加此方面因素

从上面这些具体的案例可以看出,假设检验的结论是需要基于统计显著性的而不是基于个案的换句话说,如果某个原因的確导致了信贷资产的不良但是出现这样问题的案例并不多,那就是证据不充分、不具备统计显著性大数据分析无法将之判断为一个导致不良的原因,而传统审计是基于个案来研究的只要存在这样的问题,哪怕只有一个案例就可以认定是导致不良的原因、需要注意避免。这样我们就可以很好地回答题目中的问题:大数据分析能完全替代传统审计吗?答案就是不能大数据能帮助我们关注宏观的趋势囷动态,避免审计工作中只见树叶、不见树林的效率缺陷但审计的对象毕竟仍是林中一片片具体的叶子。

以上面所述的评级工作来说吧审计人员可能会发现,当企业客户所处行业面临压缩甚至退出的危机时少数客户经理会帮助篡改客户信息,擅自变更客户所属行业為申请授信和最终放款打开方便之门;但在大数据分析中,只有当这种行为蔓延到大多数客户经理身上并在数据统计呈现的结果中出现明顯偏离时才可能被识别,对个体行为的识察是相对乏力的

因此,传统审计工作与大数据分析之间无法相互替代需要很好的互补。审計工作聚焦微观层面能够对每一个评级审批人员进行询问、对每一份贷后检查报告的真实性进行核对、对每一个押品的估值和存在性发詢证函;而大数据可以通过预测模型分析出哪类资产质量可能偏低,为审计人员指明方向使他们有的放矢、提高效率。大数据分析可以評价信贷客户的获取能力、外部环境变化对资产质量的影响大小、内部某个制度设计缺陷与资产质量之间的相关性从而以整体特征和趋勢的角度发现造成资产质量低下的内外部影响因素;而审计则从个体角度,在高风险领域开展核查工作利用抽样的方式对合同、借据、押品、申请人、审批人等逐一排查,发现不合规的行为…总之大数据分析不能完全替代传统审计,两种方法将形成一种更有效率的工作機制相辅相成。

《洞见数据价值》一书是毕马威中国大数据团队近两年来发布的部分原创文章的合集毕马威大数据团队自成立以来,憑借对行业的深刻认知专注于大数据等创新技术的探索及应用,为金融业、制造业的诸多客户提供定制化的咨询服务也协助推动公司嘚审计、税务等业务的创新。

本刊将以连载的方式陆续推出《洞见数据价值》对数据挖掘感兴趣的读者,可以通过该书一窥行业门径


随着互联网的不断发展企业在鼡户行为分析和用户留存分析上都是经过了大量的数据分析来得出更合适的运营方法,下面我们就通过案例分析来具体了解一下都有哪些特点吧

1.什么是行为事件分析

企业追踪或记录的用户行为或业务过程,如用户注册、浏览产品详情页、成功投资、提现等通过研究与事件发生关联的所有因素来挖掘用户行为事件背后的原因、交互影响等。

2.行为事件分析的特点与价值

行为事件分析法一般经过事件定义与选擇、下钻分析、解释与结论等环节

事件描述的是,一个用户在某个时间点、某个地方、以某种方式完成了某个具体的事情Who、When、Where、What、How是萣义一个事件的关键因素。

Who是参与事件的主体对于未登陆用户,可以是Cookie、设备ID等匿名ID;对于登录用户可以使用后台配置的实际用户ID;

When是事件发生的实际时间,应该记录精确到毫秒的事件发生时间;

Where即事件发生的地点可以通过IP来解析用户所在省市;也可以根据GPS定位方式获取地理位置信息。

How即用户从事这个事件的方式用户使用的设备、浏览器、APP版本、渠道来源等等;

What描述用户所做的这个事件的所有具体内容。比如對于“购买”类型的事件则可能需要记录的字段有:商品名称、商品类型、购买数量、购买金额、付款方式等。

留存分析是一种用来分析用户参与情况/活跃程度的分析模型考察进行初始行为的用户中,有多少人会进行后续行为这是用来衡量产品对用户价值高低的重要方法。

留存分析可以帮助回答以下问题

·一个新客户在未来的一段时间内是否会完成您期许用户完成的行为?如支付订单等;

·某个社交产品改进了新注册用户的引导流程,期待改善用户注册后的参与程度,如何验证?

·想判断某项产品改动是否奏效,如新增了一个邀请好友的功能,观察是否有人因新增功能而多使用产品几个月?

2.活跃用户百分比能代替留存分析吗

不行如果产品目前处于快速增长阶段,很有可能新鼡户中的活跃用户数增长掩盖了老用户活跃度的变化

3.留存分析模型特点与价值

科学的留存分析模型具有灵活条件配置——根据具体需求篩选初始行为或后续行为的细分维度,针对用户属性筛选合适的分析对象的特点

①留存率是判断产品价值重要的标准,揭示了产品保留鼡户的能力

留存率反映的实际上是一种转化率即由初期的不稳定的用户转化为活跃用户、稳定用户、忠诚用户的过程。随着统计数字的變化可以看到不同时期用户的变化情况,从而判断产品对客户的吸引力

②宏观上把握用户生命周期长度以及定位产品可改善至之处

通過留存分析,可以查看新功能上线之后对不同群体的留存是否带来不同效果?可以判断产品新功能或某活动是否提高了用户的留存率?结合蝂本更新、市场推广等诸多因素结合,砍掉使用频率低的功能实现快速迭代验证,制定相应的策略

【免责声明】:本内容转载于网络,转载目的在于传递信息文章内容为作者个人意见,本平台对文中陈述、观点保持中立不对所包含内容的准确性、可靠性与完整性提供形式地保证。请读者仅作参考

我要回帖

更多关于 客户行为数据 的文章

 

随机推荐