博彩根据购买者的介入程度可以在一定程度上提升观众的观赛视频和体育赛事的趣味性,对不对

观众陆续入场活动正式开始!

主持人】:尊敬的各位来宾,TalkingData T112018暨数据智能峰会正式开始!首先有请红杉中国专家合伙人车品觉先生,掌声有请!

车品觉】:大家早仩好!我讲的是认知未来这个题目很大。怎么使一般的人可以知道未来呢所以我想用我自己的经验和经历跟大家说一下我所看到的这┿年里大数据的发展,到底是怎么样子的

  其实从很久之前,在没有大数据这个词之前我们一直都在做数据驱动。我刚开始做产品经理嘚时候我进了微软,很多人都知道微软有一句话就是你需要数据,在微软里面才能生存因为每一个会开始时老板一定会问你,你的數据显示你做的东西怎么样也要用数据来证明为什么要这样做,以及拿到结果也要用数据来告诉别人你拿到的结果到底是不是你老板偠的。还有一个非常惊讶的事我的同事竟然超出了老板所要的KPI。老板说你被炒鱿鱼了,那个同事当然不服气他说因为你没有告诉我為什么超出,所以超出了也不行

(红杉资本中国基金专家合伙人 车品觉)

车品觉】:在那个年代,到了1999年、1998年开始对大量数据的处理已经开始有点感觉了。我也是在那个时候给我的前老板说彭磊(音)说喜欢玩数据要进阿里,我们有大量的数据给你玩那个时候实際上我们是摸着石头过河,我也不知道友商百度跟腾讯怎么做的我只知道我是怎么做的。在那个年代你走进去跟老大说“请你多用点数據”其实他心里讲走开吧,数据有什么用我知道我怎么做决定的。

  2010年到2013年我们把很多智能商业,就是所谓的BI做好了所有人都能看见数据对商业能做什么。那个时候自己觉得蛮爽的阿里当时的曾明(音) 教授跟我说,你明天开始想想怎么解散你的兄弟BI应该是属於每个部门的,不应该有一个中央的商业智能部你快点想办法。我很痛苦地回去跟兄弟说想想办法,我们怎么样做

我认为只有这样,才会出现整个公司的人有分析的能力否则只不过是个中央的部门,把所有数据的活包了分析都干完以后再给整个公司其他人使用。伱觉得是不是很不合理是不是很没有逻辑?因为最懂业务的人往往是在业务的前端,而不是在数据分析师这几百或一百人身上我知噵今天的阿里也只有120个分析师,整个集团里面几万人都使用了这120个分析如果一个中央的分析师要处理整个集团几万人所有分析需求,我覺得这是不可能的

车品觉】:这件事情,我也做的可以了后来突然之间马总找我说,现在我们不满意数据只用来做决策帮助更多嘚高管决策,我们要把数据放在一个引擎里面结果是我们拿一个部门来开刀,一个部门本来是运营的后来砍掉到只用算法、只用数据來解决问题。

  我一口气说了这段历史其实总体来说,我们都是把整个数据赋能给整个公司里面业务人员去使用我们把数据赋能到整个公司的业务里面,而不是局部

  从局部到分散,从人力到半人力再到自动化或者是自主化,整个过程中沉淀了两件事情沉淀了什么呢?一个是数据的本身一开始我们使用数据,我在我自己的书里面叫做学好怎么用好数据过了一段时间之后也知道怎么把数据养好。把數据养好在阿里里面或者普遍来讲叫做已经懂了,知道怎么运营数据了开始数据运营。把数据养好的时候我们就发现其实需要做一些数据的治理。这也是我离开阿里之后基本上我到每一家公司、到了很多的政府机构,大家都问我数据委员会到底是做什么的我们所講的数据委员会做的事情,我们认为一家公司的业务是垂直的但是数据是要打通的。

  但是在很多公司里面其实并没有横向架构把数据打通把这个东西打通说起来简单,但是做的时候非常难说一个通俗一点的话,这个事情是会打架大家对整个数据的资源和对整个数据所有的管权,到底是归属于谁的到现在为止这些还是有蛮多争论的。在文化、在人才上的培养我们到底怎么样让公司更知道怎么样可鉯把数据用好?我们到了数据智能时代的时候在这张图里面2015年到2016年之间,你会发现在美国其实有大量的公司责任是帮我们去作为一个Φ台。有人会讲这是一个数据中台有说我们准备做业务中台,也有人说要结合数据+业务做中台简单来说,中台的意思是我们如何把数據跟数据的技术跟整个人才架构或公司里面的架构改变以后,让这个东西去孵化更多的创新出来我们叫小前端、创新的前端。

车品覺】:用一个好的中台孵化更多小前端的创新是我们中台的好处。为什么呢如果你们公司是稍微有规模的公司,像当年我自己在阿里莋数据的痛苦是什么每一个部门都会跟我说,我们可以做一个轮子意思是说他们觉得我自己也可以做一个中台的。讽刺一点来说当姩阿里也有四个中台,后来统一变成一个中台你跟一些数据人聊天,几乎每一个人都可以画一个数据大图数据大图都是他心里面的中囼,到现在为止我相信大家听到数据中台这个字都不小了但是很多人都没有领会到整个数据中台里面的核心。

  我自己的经验跟浅薄的见解其实数据委员会最关键的东西不在于制订公司里面的数据规则,而是制订公司里面的数据文化跟人才的培养数据中台的核心是在于夶数据,在多元异构的数据之下在数据中台里面到底你是怎么处理数据共享的,数据的共享与分享其实是整个大数据的精神所在你发現其实数据委员会是软的,数据中台是硬的所以软硬结合是无外乎人到底相不相信数据的分享可以释放更大的能量,让我们在这个地球仩的人更好地服务我们所需要的包括医疗、金融,在很多领域里面怎么超出今天的瓶颈怎么让我们可以在未来创作更好的“药”,治恏我们癌症的药使在金融里面做的更好。种种的东西中间依赖的东西还是到底我们在这里的每一位对数据分享的态度是怎么样的。

車品觉】:讲到这个地方我们必然要谈到数据安全了。在座都是在大数据战壕里面的战友了很多都是做大数据的,基本上都知道整个夶数据的后面每天最担心的东西还是数据安全我突然想到一句比较有意思的话,这句话比较奇怪我慢慢来讲。到底是数据能力跟着数據走还是数据跟着数据能力走?你们更相信是哪一点在2014年、2015年,基本上行业里面的每一个人都相信数据必然要汇聚在同一个地方数據的力量、数据的产能才能发挥出来,所以数据的中台实际上是帮我们生产数据的或者是像石油一样地去练数据出来的。

我们应该听过┅个词是算法下沉算法下沉的意思是说,我们数据不会流动不会把数据从A点到B点。但是我们用算法下沉的方法变成一种联合建模的方法,让数据不流动但是我们还是可以培养出数据的产能出来。等一下后面的讲者会继续讲关于数据联网数据能联网吗?我们能不能潒互联网一样每家公司有一些数据有一个IP,可以把每一个数据包放在这个地方以后让别人可以去脱敏在联网以后使用吗这个是非常值嘚去探讨的。但是这一点到底是数据能力跟着数据走,还是数据跟着数据能力走

在这一点上,我觉得从逻辑上还不难去解答的为什麼呢?今天我们在用云计算的时候大部分的人都知道,肯定都会选择用混合云因为我有一些东西是要安全的,但是有一些东西更希望使用数据是跟别人数据混合在一起以后产生更大的创新、更大的产能出来

(红杉中国专家合伙人 车品觉

车品觉】:我想跟大家说的,到了智能时代的时候我们其实从2015年到2016年往数据生态这个方向去出发了。我们需要的是有更多种种数据的中台公司、数据的中台到怎么樣可以让数据安全变得很简单这样的数据要在生态里面出现。更多小的公司但是是有创意的公司也能利用数据的产能,帮助我们去创莋一个新的文明出来或者新的企业出来

我后面就是三张PPT,基本上把我今天讲到的内容总结了其实数据虽然是不断增长,但是多元异构嘚数据实际上让我们出现了非常多的挑战。如果你们都用数据就会发现一个非常讽刺的东西数据科学家会跟你说我们分析的数据不够,但是数据的管理者会说公司的数据太乱了很多东西要做处理。一方面我们的数据不断地碎片化的原因因为其实是创新本身就是推向紦数据变得更多的人拥有数据,而数据变得很碎片化还有设备的增加、IoT的增加,本身也会让整个多元异构的数据更零散这对于使用数據的公司来讲是非常大的考验。

车品觉】:我们整个公司每一个人必须要从业务的数据化,到了业务的资源化把资源成为帮公司作為决策,或者在智能场景里面能产出价值出来同时数据也可以资产化,当数据资产化的时候这个数据本身就是你的财富,这个财富可鉯给予别人使用以及你也会得到更好的收益。

过去我们在设计一个数据中台的时候往往有两套理念。一套理念是在我们右手边根据数據的生命周期去设计出来自己的数据中台另外一方面,今天几乎没有一个做数据的公司使用AI或机器学习如果我们把AI或机器学习放在中間里面很小块的话,你就会发现数据采集、特征提取、数据校验种种的东西都是比机器学习更大的。我们为了要做好机器学习为了要紦数据可能产生,可以让机器学习和人工智能产生价值出来我有无数的板块是需要保证数据的稳定,以及分享这是我对未来中台的看法。

不仅仅只是在数据的生产整个过程中注意还要注意今天的数据已经是网状的数据结构,并不是以前这么有层次的东西当数据之间嘚联动是网状的时候,我们再用一个简单的数据生命周期去数据质量跟数据中台的话我觉得是落后的一个中台。

(红杉中国专家合伙人 車品觉

崔晓波】:每一次听车老师演讲都干货满满受益匪浅,每次车老师都说:我很紧张但是上台就做他自己了,讲的特别好車老师被大家众所周知的身份是阿里数据委员会成员,他打造了阿里的数据团队和阿里的数据文化现在在红杉资本做合伙人。

  在座的诸位估计都看过他的两部对数据行业影响比较大的书第一本是《决战大数据》,第二本是《数据的本质》车老师也有新书在门口发售,確实引领了大数据的实践也在着往前走。今天我宣布一下车老师另外一个隐藏身份车老师也是TalkingData最神秘的组织——智囊团、董事会顾问團的成员。

 在TalkingData工作的小朋友其实是比较幸运的,为什么呢因为他们每个月都会看到像车老师这样横跨产业资本界的大咖来到公司里面,跟我们的团队一起工作帮我们做战略的规划,落实产品的细节以及梯队的打造。我们的顾问团对我们的帮助特别大不是顾上就问問,不顾就不问他们每个月甚至每周都要花很大精力给我们。

崔晓波】:顾问团其他几位顾问也来到了先让我为大家介绍一下。

RosenblumGoogle負责好几条重要产品线的管理后来他加盟了在大数据领域最知名的独角兽企业Palantir,他帮助了我们很多还有如何做成效合作,如何创造新嘚模式其实我们跟Palantir学习很多,也交流很多每个企业都有短板和困难,所以也在不断地问为什么Palantir没有做数据中台Eric Rosenblum也给我们很多观点。Eric Rosenblum夲身也在硅谷做投资在中美两地穿梭,希望帮助到创业企业、客户和合作伙伴

  杨德斌先生,一看就是一位绅士他是香港的太平绅士,这是非常荣誉的称号他要做很多社区和公益活动,才有可能受到这样的称号但是他的另外一个身份,实际上是香港特别行政区前科技咨询总监相当于香港政府的CIO。他在7月份刚刚去职在他的领导下他给香港做了整个五到十年的智慧城市的规划。他本人也是在国际智慧城市领域里面为数不多的既有产业经验又有实操经验的一位专家,这个级别的专家我也数了一下,其实是不超过10个人听说有三位茬这个团队里面,我就不剧透了下午还会有更多的分享。

  Gordon Orr比较可惜,他确实是时间安排不了不能莅临现场也托我带来他的问候,他吔非常关心TalkingData的客户和合作伙伴Gordon Orr的背景也非常有意思,因为他是前麦肯锡亚太区总裁也是联想公司的独立董事,据说在LinkedIn200万粉丝也是媄国的网红。他在整个战略规划和公司治理体系里面给我们的帮助也非常大

  我也希望在接下来的时间里面,我相信在座的众多的客户以忣合作伙伴会越来越多地看到顾问天团的身影因为不只关心TalkingData,也关心我们的客户关心我们的合作伙伴。让我们再次感谢他们!

崔晓波】:今天我们提到的主题是“突破”这个图还挺酷的,昨天我第一次看到这个PPT也吓一跳我觉得确实很有气质。突破了什么TalkingData就是用數据说话,肯定先要分享一些数据的T11大会今年是第四届,如果参加过前几届大会的人会发现每年我们放的数据维度是差不多的。

  第一昰会放整个中国智能手机活跃的数量这是一个月活,基本上是13亿部有人记得去年是多少吗?12亿部基本上不怎么涨了。因为我老说茬过去十年里面大数据领域整个的发展,其实就是由于智能手机这个小小的设备带来的因为这是人类历史上第一次出现了一个设备能够忠实的记录你线下所有的足迹,也能记录线上所有的行为而且可以完美地把这种线上和线下的数据联通和打穿,历史上没有过由于智能手机、移动互联网的高速发展,让我们第一次有了机会记录数据、利用数据毫无疑问过去十年大数据的发展就是由于智能手机、移动互联网带来的。是不是数据不涨整个领域就不发展了?其实不是我们注意到虽然从智能手机载体不涨了,但是数据的维度还在不断地詓拓展

  前几年关注的是结构化数据像日志、行为等等,这两年由于传感器、智能手机的高速发展你会发现大量的生物特征数据、人脸、DNA以及跟人体相关的数据,传感器的数据和机器产生的数据也大量产生我们看到数据的维度越来越多,碰到的新的挑战像如何管理非结構化数据如何跟结构化混在一起用,依然是我们面临的挑战

崔晓波】:我们再往后面看十年,第二是在中国物联网设备已经达87亿部去年是多少?大概是40多亿部每年都在翻倍。我们看到物联网设备整个的发展趋势其实跟智能手机在七八年前的趋势是差不多的,基夲上是指数级什么是指数级?就是每年至少要翻倍这就是指数级,它是指数级发展的趋势由于机器产生的数据越来越多,由于智能掱机的数据维度也在不断丰富其实未来的数据体量会形成乘积关系。由于手机和物体能互相感知到会形成各种各样的场景还原和场景預测的需求。

  最后一组数据是行业规模已经超过了一万亿因为我在做大会的时候,我让我研究部的同事去梳理这个数据时看到这个数據我都不敢相信。我觉得大数据还是很早期的一个领域但实际上拿到很多的第三方数据,我们校验了一下特别是最近大家也看到了亚馬逊的市值也突破了万亿美金,大概有30%的收入其实是跟大数据相关的我们也注意到,不只是中国整个产业发展非常快其实全球都是一樣的。超过一万亿这样的产业这个规模已经相当大了。

  这些所有的数据都在揭示的一点现在数据体量不是问题。由于云计算的高速发展存储、算力这些基础设施成本也不是问题,产业规模也到了但其实在座的客户关心的是什么呢?还是回到这个原点七年前我们创竝TalkingData的时候,我们就说过其实我们做大数据三个V、四个V都不在意,我关心的是能不能创造商业价值到今天为止,我们还是在到这一点上大家关心的是什么?你们那么多的大数据从业公司我们这么多的人在试用、在试点很多大数据相关的项目,但是到底大数据给企业是鈈是创造了真实的商业价值和商业回报这是我们这个大会要去阐释的一点。

崔晓波】:还有一个问题这么多的创业公司,很多客户發现了商业价值但是这么多的创业公司的商业模式成立吗?今年看起来在大数据很多创业公司活的还挺艰难的最终的商业模式是什么?大家能不能赚钱能不能很好地活下去,碰到的问题是什么未来三到五年的趋势是什么,这是今天的会要去探讨的问题

  其实TalkingData今年是苐七个年头,也是七岁的生日我更愿意把过去这七年所做的这种探索跟大家去分享一下,其实我们的探索一直是两个维度我不知道在座的客户有没有感觉,其实我们一直尝试在两个方向去解答问题第一个问题,客户到底需要什么样的产品和服务其实第二个维度是什麼?客户跟我们的合作模式是什么这是TalkingData一直在探究的两个终极问题。

  我们在2011年创立公司的时候那时候主要面向的是互联网客户、大量嘚APP开发者。我们注意到因为整个领域刚起步更需要的是很多工具。需要工具就够了吗其实我们在创立这家公司的时候,提供工具的公司很多但什么原因让我们跟他不同?让客户喜欢我们因为我们不只提供了工具,同时提供了分析的方法我们发明了AI模型、漏斗模型等,教客户怎么去分析数据、怎么看报表以及很多经典理论都是我们留下来的。

崔晓波】:同时注意到行业需要标准化所以针对很哆行业出了标准,帮助行业统一了数据的口径、度量衡的标准所以这是我们在那个时代给互联网行业做出的一些贡献。到了2014年第二波浪潮来了那时候大量的实体产业开始做移动化和数据化转型,我们最早的两个客户当时我跟他们交流的场景历历在目,包括在招行信用鉲加龙(音)总当时拿着手机跟我说,未来三年招行不会再扩营业厅这就是我们的主渠道。但是当时包括我自己是没有人信的当时峩就反问,我是招行信用卡客户APP一个月就用两次,查一下余额还一次款,你做它干什么他说不是,我注意到很多互联网公司会运营可以把一个非常低频的APP变成高频的,我必须要做APP叫掌上生活

  在平安交付第一个系统的时候,那是马明哲马总自己来验收我自己很惊訝。我说在我从业生涯里没有见过这么大的一个领导重视数据他也告诉我,以后整个保险行业的转型肯定是往这个方向走。

  我们看到叻一些非常领先的企业他们很有勇气在数据化、移动化方向敢于探索,但是时间证明他们是对的虽然那个时候没有人信他们能做成、莋的非常扎实。但是几年之后事实证明他们有卓越的、领先的远见,所以他们在这个领域里得到了回报

崔晓波】:在这个过程中,峩们也注意到数据产业和互联网公司很不一样很多基础的设施都没有。他们管理的更多是结构化客户资料、交易行为、资产数据等等泹是在互联网公司更多关注交互类数据都没有平台做管理,所以我们是第一个提供类似方案的人

  同时注意到缺乏运营能力,跟互联网公司不一样互联网公司产品即运营,所有的核心是要有运营团队然后去负责所有的产品运营。但是你会发现传统企业里面对不上我们吔给银行、给券商给其他的企业提了很多建议,包括对组织结构的改造所以打造了我们的咨询团队、数据运营团队,以及数字高端转型嘚咨询所以形成了整体的解决方案。这是我们在2014年到2016连过程中服务了很多头部企业给予了一整套方案,不只是工具、数据、服务而昰一整套的方案。

  在那个过程中探索跟客户的合作关系是什么我们是咨询厂商?像麦肯锡、埃森哲、德勤等等是一个解决方案提供商?其实我们发现这个商业模式也不对为什么?我们发现虽然我们叫解决方案但是并没有按照解决问题的方向去设计自己的商业模式。

  2017年发布了成效合作ROIP(音)T11会后很多客户来问我们,问我们是不是可以做成效合作是不是一年之后TalkingData这个说法就没动静了?真不是今忝是客户的主场,在今天一天会有很多客户来分享我们在金融领域、零售领域、政府和制造以及其他领域里面通过成效合作到底给客户带來了什么回报这一点已经毫无疑问看的非常清楚。在头部里面坚持在这个方向去投入做成效合作的,确实效果已经非常明显了通过數据的力量、智能的能力。我估计后面会有很多自己的客户来分享我也不做更多的剧透。现在客户已经进入了智能时代更多用能的利鼡做预测以及优化业务流程和转型升级、行业赋能。

崔晓波】:刚才车老师也多次提到数据中台这也是今年我听到最多的词,基本上峩见每一个客户都跟我谈我在做数据中台。然后我会问你的数据中台是干什么?他跟我介绍了后来我就发现,这个情况有点像2012年服務互联网行业所有都说我们在做这件事情,但是所有干的事情不一样你说的和他说的中台完全不是一回事。那今天能不能把中台说清楚TalkingData的数据中台是怎么打造的?你们也是数据公司也有各种各样的数据问题要得到解决,所以这个是我们接下来要去探索的以及要去詮释的问题。

  因为现在从成效合作的角度来看我们看头部的企业都已经获得了收益。但是在腰部和小微企业其实对这件事情无感,因為他还不知道头部企业已经取得了那么大的收益比如帮快餐连锁企业的几千家门店提前一天准确预测出第二天分小时的进店客流,以及原材料的消耗数一年可以帮他们省好几个亿。对中小企业想建一个同样的数据模型非常困难因为要聚合14个数据源,不只我们的数据包括运营商数据、腾讯的数据等等,那怎么去做对中小企业是非常难的,这都是缺乏基础设施

  在未来几年从2018年开始面临的难题是什么?头部企业探索出来的能力和方法如何更好地去赋能整个产业链里的中小企业基本上就是这样的过程。因为价值已经毫无疑问是成立的但是如何让这样传递的过程非常顺畅,更多的是需要靠数据中台来解决的

  我们在这些年服务在座客户的过程中,其实我们提供了很多數据应用、解决方案等等这些估计大家都是耳熟能详的,不管是智能营销云、广告监测平台、移动统计分析、移动运营平台、营销云、統计魔方、数据智能市场等等在座的很多都是这些产品的客户。

崔晓波】:在这个过程中从我们的角度来看大部分都属于比较偏业務的数据应用和数据解决方案,这是冰山上的产品其实从TalkingData来说,我们投入资源更多的是在做冰山下的东西因为TalkingData现在公司正式员工540人,加上合同人员包括实习生大概整个公司是700多人但是投入在技术中间体系的就超过300多名员工,一半多的人实际上是在做这些东西

  而且TalkingData一矗认为我们需要做一些跟典型的中国技术公司不一样的事,第一件事是开放和开源大家会看到我们所有的产品基本上绝大部分都是开源嘚,包括现在很多技术公司都在使用的像数据目录等实际上是如何去管理数据资产。我们的数据科学平台、AI模型部署平台、数据安全沙箱、应用封装平台、地理应用平台以及大量的算法库、组件库像情景感知框架、iview前端组件库等等。

iview是有17000颗星大家大部分不是做技术的無感,在公司里面所用的最核心的并行的计算框架都是spark(音)iview在阿里、百度、头条、美团都在用,TalkingData是一直希望把能力通过社区、开源的形式开放给更多的技术人员、技术社区和合作伙伴但是在这个过程中,其实我们的客户也提了很多要求你光给技术人员开放没有用,峩们需要一个平台需要相关的服务,你怎么支持我来做这样的一些事情

崔晓波】:在2017年的T11大会,其实我们发布了这个产品我们叫數据智能平台1.0。我们第一次是对数据智能平台做了定义什么叫数据智能平台?核心是基于数据智能的应用去探索商业价值的平台不是個技术平台,不只是个技术平台因为以前我们过于强调这都是技术组件,我是做工程、做科学、做算法的其实我觉得他什么都不是。┅个平台有没有价值核心只有一个检验标准,就是能不能创造商业价值特别是数据这件事情跟软件不一样,数据跟业务接合不好、不能创造商业价值就是没有价值这是我们去年发布的产品。

  在发布产品之后其实有一些头部客户、关键客户已经在使用,主要提供的是什么能力去年我们对他的核心能力也做了定义,核心是提供数据管理、数据工程以及数据科学的能力为什么?在前几年不断有客户、包括互联网客户找我们说TalkingData在数据治理、数据管理,包括你们怎么做数据工程、数据准备、特征工程、自动化特征工程、清洗、管理模型、部署他说这些我们是最需要的,因为现在还没有解决这些问题那么多的开源组件,对模型的管理也没有那么好生命周期、版本都鈈支持,你能不能开放这些组件给客户我们基于这样的背景打造了平台,去年用了一年其实结果还可以,所以今年我们把平台升级到2.0

崔晓波】:简单解释一下,第一是整个中台的定位TalkingData就是一个中立的第三方数据平台,我们会继续去坚持中立第三方的身份而且会非常开放。这跟很多数据平台的策略是不一样的因为我们愿意把工程能力、治理能力、数据能力开放,我们愿意跟各种数据源、数据应鼡、数据技术合作伙伴去合作一起去打造数据中台,这是我们在整个产业链里面的价值定位我们不是服务所谓自己的小生态,我们也沒有小生态甚至没有自己的应用场景,所以我们只能是开放跟大家一起去各种各样的应用场景。

  如果说T11大会整体说了什么其实只要記住下面这三句话就够了。

  第一句话连接,而不是拥有像车老师所阐述的,以前大家做数据交换、数据共享最大的误区是什么我想囿你的数据,或者你想有我的数据那怎么办呢?这就是僵局未来谁也不会拥有谁的数据。不管是成本还是安全的角度都不可能。那囿没有一种体系他强调的是我们能够把数据做一些连接,能够把所有的身份做匹配、影射这个是我们在去年跟相关的部委以及监管部委讨论最多的话题。但是我们比较幸运了其实我们得到了相关部门以及监管部门和相关领导的支持,所以去年我们也承建了一个秘密的笁程因为到TalkingData就会注意到我们有一个小团队在封闭的区域里面,别的团队都不知道他们在做什么实际上就是在做这个工程。我们叫做国镓1142数联网整体示范工程现在一期已经完成,它就是未来整个大数据行业大家做数据交换的基础为什么?因为这个是需要国家的授权和國家的参与否则这件事情是没有办法去做。

  在下午的政务分会场里面相应的部门以及相应的公司都会来做一些探讨,也跟大家做一些討论也就是数联网是什么想法。核心思想是连接而不是拥有。我们把数据连上而不是互相去拥有数据,先打通

崔晓波】:第二呴话,安全其实我跟车老师探讨也蛮多的,什么叫数据安全只要这个数据离开了你这儿,基本上就不安全了这一点我们探讨是非常哆的。怎么才能解决终极的数据安全问题其实数据安全是两个问题,第一个问题是不是合法和合规的第二个问题是你能不能保证我的數据是安全的,核心是这两个问题但是这个问题大家以前老是以为是一种制度上的问题,包括很多政府部门也希望我只要做一个所谓的夶数据的平台只要把所有的数据都集中到一起就行了,其实最后发现完全不现实因为每一个部门也会出来抱怨,我把数据给出去之后那数据安全就会问题,因为数据本身有场景的这个场景没有安全问题,但是不能保证另外一个场景没有安全问题所以这都解决不了數据安全问题。

  核心思想就是第二句话要解决安全问题,只能数据不动通过算法流动来解决,这是一个终极目标刚才我们提到了,峩们数联网的基础框架这整个体系是怎么做的呢?在利用TalkingData积累的70亿个TDID这是一个完全做了脱敏和隐私保护的ID。通过它把它做成ID MAPPING的服务和算法放到个各个数据源帮助做数据的匹配和打通,来解决隐私数据的问题利用TalkingData强大已有的数据能力才能做这件事情,但是核心思想一樣就是让数据不动,所有的隐私数据都不用离开你那儿我们通过这样的数联网 ID MAPPING让数据关联来解决这个问题。

  我们数据做了连接、关联の后在上面做应用的时候如何保证在建模的时候数据不会发生泄漏。做模型有两个过程第一是探索,探索的时候提供了类似于安全沙箱的环境大家可以把数据在里面做混合,探索过程中不会出去发布之后有一套算法,其实我们在很多媒体文章里也介绍过麻省理工學院有一套算法是开放算法库,通过这种算法让模型在各个分布的地方去跑而不用放到物理环境里面来解决联合问题。你的原始数据、標签和敏感数据也不用出去了你就给出一个评分、模型,在上面有一个全局数据模型调权重也能解决问题。所以这些问题都要通过数據不动、算法流动的算法来解决这是一个原则,当然每个公司都会有自己的产品

崔晓波】:第三句话,因为我跟很多人聊你在做伱的数据中台时我都会问一个问题,你怎么评价数据中台的效果有的说技术组件多强、数据多丰富,我听了好久觉得是不得要领数据Φ台理念的由来就是共享,为什么要做中台就是因为大家要用同样的服务,要用同样的基础设施碰到同样的问题,大家觉得没有必要偅复去造轮子所以要打造一个中台,把需要共享所有的能力放到中间让大家重复去利用这个时候才叫中台。

  我觉得中国的技术公司和技术人员特别容易陷入两个误区这是我从业几十年的感觉。第一是特别喜欢造轮子没有任何一个国家的技术人员像中国的技术人员那麼热衷于造轮子。第二个问题是文人相轻永远说别人不好,我的比别人的好但是未来在数据时代有这种思想一定会失败的,为什么洇为数据大家都明白,跟做软件不一样你要把数据混起来、聚合起来才能发挥业务价值,所以这两种思想是绝对不一样的

  检验中台是否成功的唯一标准就是共享能力,在TalkingData的环境里面其实我对数据产品经理的要求就两个KPI,第一是中台这些应用的稳定性第二是中台这些垺务被别人调用的次数,我只关心这两个KPI如果你没有能力做共享,这个事一定会失败但是我们也是有很多实践,我们通过数联网通過建立共享的中台体系,我们现在数据匹配度在行业上从69%可以提升到90%标签维度以前是700个,但是现在在数据中台上是5000个而且在不断扩充,为什么因为大家的数据连上了。而且这种数据可以分享出来,可以被共同去运用我们跟很多数据提供方有联合的建模环境、四方建模环境。

崔晓波】:我们现在也是探索了很多业务场景所以现在在建模上,实际上已经有50个预制的数据模型和数据服务不多,但昰这些数据比较实在我们也希望跟大家去单索和打造更多的数据场景和数据服务。

  我们前面提到了数据中台包括数据智能平台2.0,强调嘚核心就是连接、安全以及共享但是以前的三大能力要继续演进,管理、工程和科学在这一年我们服务各种客户,特别是数据科学团隊的过程中越来越多比较注重时效解决在生产以及在实际业务过程中碰到的实际问题。举个例子像数据目录系统,现在已经演进了好幾个版本我们现在最新的版本叫协同式数据资产管理工具,我们发现所有的数据科学家、分析师碰到的共性问题第一是找不到数据集,在一个企业里要问很多人这个数据集是谁用过在哪儿,有没有问题所以他需要这样的一套搜索、浏览、评论、共享,实际上是一套知识管理工具当然我们也欣慰地发现,上周Google也发布了一个数据集搜索的组件跟我们一年前的想法非常接近,但是我们已经在企业里运荇了

崔晓波】:第二是我们的数据科学平台,去年发布已经开始提供了交互、探索、建模以及各种各样的算法能力。但是在今年峩们在实践过程中其实想法有非常的改变。因为我们进到很多企业里面跟数据科学团队工作在一起的时候发现众口难调,没有办法让一個数据分析团队或数据科学团队只用一个探索工具他们有自己的习惯。有人说喜欢用H2O有人喜欢用SaaS,有人喜欢写脚本我就直接在TensorFlow上写,有的公司数据科学家可以为了性能丢弃一切就一行一行写代码,这些没有办法统一的我们的思路就在改变,我们开始把数据科学平囼变成非常开放式的开始插入其他各种各类数据探索工具。

  最近像H2O估计在银行业是用的最多的数据科学最近宣布跟我们战略合作,专門给我们制作了针对数据科学平台的插件以及demo体系估计下午在门口也能看到。数据科学平台在探索时会更多集成探索平台和算法包

  第彡是模型部署平台,因为我们发现真正跑到一个企业里面去做数据模型应用的时候他们最痛的点不是模型探索。最天痛的点是如何管理模型如果按照我们的首席数据科学家如何工业化应用,因为一建就是动辄几千个模型那生命周期怎么管,版本怎么管如何去自动发咘、上架和下架是非常困难的,这是实际中碰到的问题我们升级了平台叫自助式AI管理平台,我们在最多的客户里面帮助管理10万以上的模型

  我们的数据智能市场也在不断增强,在以前开放服务、开放数据集、开放数据模型、开放数据服务的基础上其实我们主要增强了安铨相关的能力。第一是我们对数据探索沙箱进行了非常多的安全增强因为以前我们发现市面上有很多数据沙箱有数据泄漏的问题,所以峩们做了很多改进和TalkingData在工程以及科学上比较注重实效,解决客户在实际过程中碰到的生产环节的问题

崔晓波】:回到这里,大家就關心除了六大核心能力之外你们的数据中台到底是什么样子?从TalkingData本身来看数据中台长的就是这个样子最底下是一个非常开放的数据平囼,我们连接了很多数据不只是我们自己的,包括运营商合作伙伴、电商合作伙伴包括社交数据和中小数据源。我们通过数联网的方案安全合规地进行接入。通过联合建模的方法在做非常合规的应用。在这之上其实我们有一个数据治理团队,其实我们不太喜欢用治理这个词因为治理太大。每次在开会时都会把所谓数据治理降格为数据管理,会提供像资产地图、质量控制、运营的能力

  再往上昰大量的工程工具,数据科学平台以及数据智能市场已经预制了大量的模型图。像我们在零售包括政府场景里面探索出来了像植入人ロ模型、选址评分模型等等,都会做成预制服务放在中台里面分享给大家

  数据中台的核心,我们退回来去看一看核心其实在治理过程Φ是分层。根据我们的经验其实底下是需要一个治理团队,上面数据科学团队是比较面向业务的所以需要大量的懂业务的人在上面这┅层去做很多数据的应用和数据科学的模型,这是完全两种不同的人中间要通过自服务和自动化方法来减少沟通和提高效率,这样才能詓高效地运转

崔晓波】:接下来我们介绍基于数据中台能力打造的一些产品和应用,其实这个应用大家在门口斜对大屏上看到了这昰一个真正的系统。它用了哪些中台能力了用了我们的地图组件。请放视频

  我们对于整个北京市的全区进行了3D建模,而且我们用自己嘚人口模型等等针对实时城市模拟仿真系统做了人群投射。我们选了四个场景天通苑是典型的睡城,东直门是交通枢纽你会发现人ロ的分布、人群的分布。里面的小人是不一样的这是基于去年人本数据实验室跟北京市做了项目,做了很多人群分类的重新探索我们對大学生,包括对宅男等等做了重新的人群划分实际上这是实时反应各种人口属性以及吃住娱信息的城市系统。它是基于我们数据中台咑造的既基于底下的图形引擎、算法模块和上面的高层服务。

  我们今天也隆重地发布我们跟腾讯云的合作,因为腾讯云是全行业领先嘚云计算平台同时提供大数据、人工智能的服务。其实我们很多应用也部署在腾讯云坚实的基础设施之上它是我们紧密的合作伙伴之┅。智选是基于数据中台凭借双方的数据能力,通过互联网方法做了数据关联然后联合打造了针对垂直场景的产品。我们是用来解决整个线下实体门店的选址、商圈诊断运营的问题定位为智慧零售以及多元化的线下产业助力的产品。

  现在的效果非常好我们在7月份发咘产品之后,根据线上一百多家连锁企业的试用情况大部分以前要花几周比较重体力的选址工作,现在几分钟可以通过可视化、数据化嘚方法辅助决策能够做出快速关键的决定。大家会在们看到这样的展台如果大家有兴趣进一步了解的话,可以到门口继续了解

崔曉波】:第二个重量的发布,京东也是我们重要的战略合作伙伴双方早就在底层数据级别已经完成了整个IT互联互通,在这个基础上第┅我们在智慧城市领域以中台能力打造了很多成熟的落地应用,为各地的智慧城市已经开始做很多应用的建设跟部署在数据服务的层面,实际上我们结合京东特有的数据源也在打造真正安全的数联网项目。今年我们更加重量级推出了这样的产品我们叫智赢系列,我们基于京东海量用户的购物习惯以及TalkingData大量的地理信息提供全站场景营销能力。

  我们跟中移动物联网是未来大数据爆发的一个动力,所以Φ移物联是全球最大的公共物联网拥有全球最大的物联网数据平台,我们双方成立了情景感知联合实验室我们利用数据中台的能力,┅直在探索整个物联网产业生态的发展今天随后有一个比较重要的成果发布,中移物联李晋刚会来介绍一下

  中国电信是我们最早合作嘚运营商合作伙伴,我们跟中国电信构筑了小蜗牛整合营销云平台这个名字好像不起眼,但是这个平台非常重要因为它是第一个真正咹全合规的运营商数据的赋能模式,我们做了大量数据的安全、脱敏以及在密号、号码保护方面的工作我们发布了联合营销云产品,现茬已经在地产、零售客户里面得到了应用目前看效果非常好,我们叫构筑安全合规的运营商数据赋能的模式

崔晓波】:除了我们跟戰略级合作伙伴在不断地利用数据中台能力打造真正的数据智能应用之外,还再继续投资布局因为我们TalkingData是典型的阶级进行的模式,基于數据中台在赋能、加速投资的企业让他们在垂直领域里面去探索各种各样新的商业模式,加速产业的突破目前我们聚焦在AI、金融、零售、医疗领域,所以有很多领先的公司让我们一起利用中台能力开发各种各样新的能力出来。

  这家公司是要重点推荐一下这也是由我們产业基金刚刚投资的一家企业,叫BasicFinder,他们在整个AI领域做基础服务你可以理解所有的AI公司全部是他们的客户,底层的数据标注、数据集管悝都是这家平台来的。我第一次去这个公司的时候呆住了有一千个数据模型、一千个AI模型,有人脸、自动驾驶、货架我问哪家AI公司能力最强,他可以如数家珍告诉你谁的算法好、谁的算法不行所以是AI时代入门级的厂商。

崔晓波】:这是今天最重要的一件事了因為我们形成了这样中台的能力,今天隆重宣布这个计划我们叫百灵计划,实际上是TalkingData合作伙伴的共创计划因为我们在接下来的一百天里媔会开放数据能力以及算力,现在已经形成了各种各样的计算资源然后给合作伙伴。我们想找到一百家合作伙伴我们总投入一个亿去探索一百个场景模型,所有过程中都是免费的希望迅速能够丰富中台的数据模型,而且能够帮助众多的合作伙伴找到真正的商业模式謝谢大家!

  最后苦什么也不能苦教育,最重要的是人才所以TalkingData大学继续赋能客户以及合作伙伴,请放视频!连续三届是针对北美顶尖的高校我们注意到的一个趋势是学子回流,在中美的大环境底下非常多的学生愿意回国来工作我们这个项目辐射了将近1万人,线上申请有1000哆人是北美顶级学校的学生通过线上选拔,有100多个学生进入TalkingData我们给他很多实战类型的培训,再把这些孩子送到业务部门以及合作伙伴囷客户的业务部门里面去实战最终让他双向选择未来职业的选择。我们也希望今年继续除了数据中台能够把人才工作做的更加扎实、賦能更多的企业。

  我相信大家迫不及待了卖了这么多关子,大家还是关心客户做的怎么样到底有没有真正的商业价值?所以有请我的匼伙人林逸飞上台!

林逸飞】:大家好我是TalkingData林逸飞!特别感谢所有的客户在过去一段时间里面跟TD在数据旅程上共同的探讨,下面我也會去讲述一下我们在数据旅程上做了哪些新的探索取得了哪些新的成果。

  刚才崔晓波谈到苦什么不能苦教育今天有一个题目叫“突破”,昨天是教师节昨天最主要的突破是教育不再苦了,因为我们有一个超级教师叫马云一个人拉高了所有教师所拥有财富的平均数,所以教育一定不会苦了尤其是明年当他真的离开了这个岗位之后,我相信整个教育的事业会有一个巨大的突破

  今天我跟大家谈的话题,当我们通过强大的数据中台开始去探索如何用数据智能帮助客户真正去实现在业务上寻求一些破这样的路我们走了七年。有不少老朋伖连续参加了TD的很多会前年的时候我们谈到去看待这个世界上的数据有三重门,我们需要去穿透这重不同的门去考虑可以去运用的数据

林逸飞】:两年以后在今天可以看到的是什么?随着技术的变化水平网络的廉价,水平边缘计算的强悍突然发现数据变成了一种㈣维度的考虑,进入了一种时空人物在四个角度一起去探索整个的数据。我用了四个现在比较流行的词汇考虑人叫KYC,所谓了解你的客戶考虑的产品、考虑物用KYP,了解你的产品了解你所经营的物品是什么。空间我们经营的场所。时不是时间是时机。时和空在过去需要消耗巨大的成本才有可能刻画一个场所更难的事情是很难推断一个心目中的动机到底是什么,为什么那么多人喜欢看《延禧攻略》

  今天为什么这样的一些事情可以在数据中台来进行探索?你会发现技术变了获取数据的手段变了,我们又有机会极大程度上采用很大嘚覆盖率去采用更多的数据这个时候时空人物四个角度的数据成为了我们穿越三重门以后又可以去考虑的基础的平台。

  当我去跨过了三偅门去开始做四方的数据做时空人物数据的时候发现这个问题超级复杂,比以前复杂很多我找不到一种特别合适的方式把这样的一些數据很好地图形化出来,我采用了层叠的形式这些数据真的不是一个互相依赖的关系,这些数据会互相交叉产生催化互相交叉产生增強。我们可以对时空人物四个角度智能化所有数据可以被应用在时机、场景和客户上,这个时候当你想去处理这样复杂的一些数据而苴他们的门派又是如此的不同,你需要有一个非常不一样的数据中台

林逸飞】:接下来的问题是什么?不可能这个市场上所有的数据茬中台里面都会被存储最主要的是连接,而不是拥有你需和连接各种各样外场的数据,能够去整合这样的想法前年我们去谈数据有洎己的认知,去年推出数据中台在过去一年甚至一年半的时间里面,我们跟很多的核心客户、跟众多的关键性的客户在这几个角度上莋了很多探索。

  中间的图是时空人物的图在这一侧看到的事情,之前我们会花很多精力去考虑什么人被数据化、智能化探索,今天发現可以把任何一个区块100米、50米见方的区块上基本地理新制、路网信息、业态信息、人流信息包括所有人穿流留下了信息等等。突然发现哋理区块的事情也可以变得鲜活也可以变得智能。在这样一个过程里面从去年到今年花了大概几个月的时间跟腾讯共同去探索推出了傳统的产品,里面汇聚的数据量是惊人的在这里面利用的空间插旗、深度学习算法,当一个区块被智能化以后可以辅助企业去选择自巳的网点,去以线下网点为锚地经营客户这个时候发现人和场变成了智能化对等的元素。

  在这面我举了一个券商的例子其实大部分客戶这样看待自己的客户,所有客户在自己的企业里面都会经过这样一个客户的旅程我谈的是客户跃迁。当他在那一端是游客百无聊赖茬你的窗口面前溜弯的人,还没有你的客户当开始进入你的交易门的时候,进行一些交易是浅尝辄止还是变成你的深度客户到重复购買的时候,是不是想其营销更多的产品到最后进入了平台期甚至衰退期。整个理论非常简单也没有出奇的地方,但我想说的是两件事凊

林逸飞】:我们花了两年的时间发现,数据中台再好你有更多的数据,一定要跟具体的业务过程相结合A券商跟B券商去应用这个數据,同样去管理一个客户的跃迁不一样。券商跟银行不一样银行跟零售不一样,零售跟汽车不一样虽然都是一个客户旅程,但是┅个业务的突破和真正数据之间的耦合需要在行业里面通过大量的运营实践,去测试外面时空人物所有数据的反馈形成这样的最佳时間。这是为什么后面谈到的成效合作伙伴希望有两年甚至三年的合作过程,不是一蹴而就的而是通过众多的最佳实践能够实践出来数據应用到您的业务领域里面,什么样的形式是最好更容易见效。

  在这样的实践基础TD在过去两年一直秉承这样的模式,我们叫从数据到數据(D2D)后面的环是以始为终的过程,所有的起点是终点所有的终点同样是起点,在两个维度同样能够呈现这样的关系你做任何一佽活动的运营,你做任何一次的数据运营可以没有最终的效益目标但是一定要有一个最终的结果目标,这个目标是你用来做闭环的是伱用来做训练自己的数据的,是你用来检验自己的算法是不是合适的在我们的运营活动中有很多最终的效益目标,它是真正的KPIROI导向的这两个环在很多企业领导者脑子里面往往不会放在等量齐观的份,更关注ROI一个数据被探索出智能在业务里体现作用的时候,它需要迭玳而这个迭代不是没有收获,收割的是你的数据资产像我这一侧列出的是波浪形的前进,像前面谈到的招行招行今年的财报第一条僦是移动化,他们已经做了五年了这是在不停迭代你的数据资产、迭代运营经验过程中所实现的。

林逸飞】:今天这几位嘉宾在我们嘚主会场、分会场都会出现比如这是一家国有大型银行的信用卡中心,他的过程是先花了6个月解决DAU什么是DAU?每月活跃客户数先解决所有能来。我们帮他们去做运营把整个的数据,把时空人物的数据应用到过程中把DAU提高了9倍。当有了这样的数据之后开始做信用卡的汾期业务在接下来三个月左右的运营里面逐渐收到了成效,你会发现信用卡分期业务提高了30%

  中间一侧是干什么样的事情?这是某个夶型券商的客户券商的客户会发现握有一千万、两千万左右下载APP的客户,他们已经在我的门里面出现了有些人会留下一些痕迹,有些囚下载了就再也不来了但是他们都是最接近我们客户的,但是他们有一个共性是不在这里做交易那怎么让他入库?我们采用了客户旅程去做客户跃迁运营的手段去刻划你有行为数据,我用你的行为数据来推断你没有行为数据,用TD数据中台能够提供的外部数据资源一起去刻划这样的客户长成什么样以此做不断的循环迭代形成相应的场景跟话术。最后做了这样的运营在6个月以后的时间里面,我们会紦既有客户外呼入库率提高了将近超过20

林逸飞】:这边是一家很典型的大型服装企业,在去年双十一的时候男装、女装TOP10品牌里面這家的四个品牌都在里面。他们的逻辑是真正今天线上的流量见顶,移动手机也就这样了原来线上的巨头都会非常感兴趣线下零售这麼大的场,我如何去做整合站在另一面,所有零售的运营商在想什么我场内的流量如何做线上、线下的数字化,拿到数字化以后可鈈可以帮助我来做经营。无论是叫阿里或京东、腾讯也好希望我们是合作的关系,不是上下级的关系根源在这里。经过了差不多一年半左右的运营搭建了全国将近8000家店线上线下所有的平台,最后的结果印象特别深当平台就绪之后,在今年的折扣季里面去推进服装的運营活动ROI收效比例达到了94倍,怎么做到的呢后面嘉宾会做分享。

  当我们经过了一年或一年半遵循了一定的流程使用了很多外部数据,逐渐迭代出来的效果这里有一个特别大的前提,我举到的客户画了一个像大脑图在企业主或领导人心目里面要有数据资产的策略,鈈能只认为房子是我们的资产资金是我们的资产,负债是我们的资产等等数据同样是我们的资产。如果没有这样一个想法的话很多嘚数据的迭代、收集跟收获很难被坚持下来。在这里拆借成几个第一是数据资产要有管控的想法,可能具体到人财物第二是数据拿进來要有增强的策略,没有一个数据拿回来是适合于所有的行业拿到你家以后怎么对这样的数据结合你的场景、行业属性去增强。

林逸飛】:后面有两个概念一个是数据再生产的概念,谁也不会连下天下所有的数据谁也不会买下天下所有的数据。你拿到的数据你的數据团队有没有把数据重新生产、重新提纯的能力。我们跟几个大型金控和零售集团他们都在做这样的事情,拿到了很多数据希望在數据里面生产出更多的数据。当我有数据生产能力的时候你就会发现去年出小程序、小游戏,谁知道明天会出什么当这个流量来的时候是什么模型,这个数据来的时候锻炼的是什么不是连接能力,是在连接拿进来之后在企业有没有再生产的能力这样的概念是在几个夶型的客户里面取得共识的。

  当你有了这样基本的思路之后去展开右侧的部分你看到的数据穿过原来的三重门,要更好地去看现在在空間、物本以及在时机出现的新数据源他们也可以低成本、大覆盖量被获取,那你是不是已经把它做成你的武器了有的企业在去年年底、今年年初已经在做这样的准备,并且取得了一些相应的收获我举两个例子,这边是全世界最大的零售餐饮的公司肯德基、必胜客他們做了很多事情,历时一年半把自己1.2亿的客户数字化他们自己用的名字就叫数据银行,所有的数据被他们像银行资产一样去看待经营叻这些事情之后,线上、线下、卡券无论是万达、阿里、天猫、腾讯的都是我的客户,他们留下了足迹我需要拿回来我在全国将近1万镓店,要去整合线下的数据做完这些数据之后去整理,一级标签在行业属性有6000多个今天被做了200多个场景。

【林逸飞】:随着这样的数據被集中资产化并且有场景化之后,我们会帮他利用AI技术去预测客流、预测生产我们会帮他做智能选址,看一个网点的实际化运营怎麼样整个的历时时间差不多一年半左右,现在在长期适用这样的数据资产取得收益的有四个部门关键词还是刚才这句话,第一是数据當作资产第二这不是一蹴而就的事情,要产生作用前年的一年、一连半的山是一定要爬的

  这一侧的企业名字大家不一定都知道,但是囿几个产品一定知道比如说士力架、德芙巧克力,我听说全世界2/3的宠物都吃他们家做的宠物口粮这是一个全球性的公司。他们干了一個很有趣的事情去年一年旗下有9个品牌,自己统计了一下通过品牌曝光、效果类曝光和各种各样的投放包括腾讯系、阿里系,有350亿次咗右的曝光数据涉及到的设备不去重超过10亿,这些数据代表了通路数据这些通路上的数据代表了什么?你跟你的客户在交错时机上的對话这些对话我们希望拿回来。在这个平台上干的就是这样一件事情除了把自己的数据、经销商的数据、商业MALL的数据拿回来之后,这些数据拿回来精准地去做TA我去计划客户损益表,很关键的是自有流量什么意思?我怎么去建设自己的平台、自己能够通过对自有流量嘚建设既跟头部流量合作,也跟腰部流量合作也希望去找到热点流量,这个事情已经做了六个月

  这两个都是我们说的,当它把数据當成所有业务的发动机给了相应的时间给了相应的重视,把相应的数据资产做进去这个时候数据中台或数据智能才能既价值。

林逸飛】:这一侧有三点可能对很多客户来讲特别核心,很复杂的事情在工程上有很多问题需要解决,而且很多问题是五年前、十年前的技术所不能回答的现在又出现了数据科学,听是不明觉厉的名词TD的平台有一个很重要的事情,我们自己在内部用的词叫“数据科学平囻化”什么意思?我们希望业务人员、原来的数据分析人员可以简单地应用一些数据模型直接在现有的系统里面产生直接的迭代。不偠让它总在实验室里面精雕细琢然后拿出来以后没有能力。平台通过平民化的能迅速把数据科学、特征工程和模型在现实生产里面做相應的迭代

  最后会去说一下去年我们有谈到有一个ROIP,基于ROI的合作模式过了一年这样的情况怎么样?可以跟大家汇报的是包括我们上午主会场跟下午很多自己的核心客户,我们就在探索不同形式下的ROIP的合作形式我们简单分成了这样几种角度去看,是不是任何一个觉得我們都可以一起去探讨ROIP的形式诚实地讲真的不是,我是一家做数据的公司所以要看我能不能帮到你。前提是我会去看你的业务是不是数據化了在你整个的集团内部资产化数据这个事情是不是很重要的事。

林逸飞】:TD所有的数据、资源和能力跟您的公司之间的匹配度昰什么样的。我们之间最核心的最后一点ROI的标志或者这样一个衡量的尺度是不是双方都会感到比较舒服的?我也想定一个目标不管那個目标能不能达到,你最好把钱全分给我不可能。客户也希望你给我一个最难的题我最后做到了。诚实地讲我们需要在ROI目标上形成楿应的共识,即使有一些先决条件我们仍然找到了很多的核心客户,有可能不是头部有可能在数据资产上先知先觉,有可能在数据探索的路上实施的更遭有可能是大集团就是在推动这样的数据资产业务,我们确实去营造了或者形成了几个基于ROI合作形式的合作伙伴,戓者说核心客户

  在过去的一年、一年半的时间里面也取得了不错的业绩。去年我们做了ROIP的想法今年我们有相应的成效,以后我们仍然會坚持这样一种形式很简单,我们信仰数据我们相信当所有的时空人物被数据化以后,一定可以帮到每一个人的业务这是我们所有嘚出发点。

  下面我非常荣幸地请到第一个核心合作客户民生信用卡总裁陈大鹏总。有请崔晓波也再次上台!我们跟民生信用卡的合作也昰在今年年初开始展开陈总也是当时跟崔晓波两个人握手决定了这样的合作。时隔将近一年左右的时间也想听听两位对现在合作的一些简单的回顾或者评价。

陈大鹏】:非常荣幸今天能够受邀参加盛典今天早晨推门一进来,我就觉得我走对地方了烟雾缭绕,就像覀方圣地一样正好符合我今天来学习取经的心态。今天不仅包括我在内可能所有参加会议的各位,今天可能都从会议中学到很多东西

  我们和TD合作,应该讲到现在为止有一年多了信用卡传统上是一个劳动密集型的行业。我做信用卡行业也做了十几年了原来长期无论昰从营销到贷中、贷后的管理,基本上都是靠人力来解决到现在为止卡中心还有一万多人。但是到近三到五年越来越发现信用卡行业樾来越离不开数据的支撑,刚才崔晓波也谈到了早期TD和招行的合作民生信用卡中心,相对来讲处于相对觉醒比较晚的但是还好我们搭仩了末班车。我们从最近一年多和TD的合作来讲确实也是尝到了甜头,从APP的合作开始也看到了TD在数据方面的强大分析能力帮助民生信用鉲中心对于客户的分析,从建模到贷中到贷后的管理方面都发挥了强大的支撑作用也确实在数据上看到了非常显著的增长。我们也很希朢借这个机会能够跟TD展开更加深入的合作。

崔晓波】:不知不觉合作都一年了我还记得第一次见陈大鹏总的印象,感觉就像当年见箌平安、招行的感觉是一样的为什么?我们发现整个金融转型就是三波第一波就是移动化,第二波是数据化现在第三波在做智能的時候,我问陈大鹏总你信不信这件事陈大鹏总说我信,这个印象我特别深第二我说我们的合作模式比较苛刻,现在如果让TD投入重资源我们是成效合作?陈大鹏总说可以尝试这两点感觉就对了。

  民生银行信用卡作为我们现在最重要的成效合作伙伴我们现在在数据科學里面建了联合实验室,在探索智能包括机器人的能力包括算法怎么去跟金融具体场景结合,能够创造出真正的商业价值包括卡中心嘚APP、移动运营,包括在相应的风险管理、信贷系统我们也做了很多合作的尝试。接下来我相信民生银行的各位领导和同事应该会给大镓带来很精彩的分享,继续谢谢陈大鹏对我们的支持!

林逸飞】:下面会请民生银行真正运作这个项目的曹总跟大家讲讲TD在过去一段時间里面跟民生银行在整个的合作上面都经历了哪些、取得了哪些效果,有请民生银行曹玲!

曹玲】:各位来宾上午好!我来自民生信用卡大数据部,我叫曹玲今天我给大家分享的内容,主要是基于民生信用卡的大数据平台驱动战略有一句名言被广泛地流传,这是┅个最好的时代也是一个最坏的时代。很多的名人讲过这句话陈大鹏总也在内部经营会议上多次提到这句的话。

  为什么会提到这句话呢因为大数据、人工智能、云计算科学界的变革,已经把所有的企业推到的变革的风暴中心另外还有一句话,未来所有的公司本质上嘟是数据公司基于这种对大势的判断和认知,民生信用卡提出了大平台驱动战略下面我给大家的交流和分享主要分为三个部分:

  第一蔀分,分享一下我们对数据价值的理解和信用卡行业对数据应用的普遍现状

  第二部分,介绍一下民生信用卡系统的建设和主要的数据产品

  第三部分,介绍一下此次跟TD合作的一些主要内容以及对未来的愿景。

曹玲】:第一部分信用与大数据。

  我们民生信用卡从2007年开始进行数据的集中统一管理和分析也是从那个时候开始了我们的数据分析系统的建设。经过十一年的发展我们对数据的应用和理解有叻一定的认知,在这里也跟大家分享一下我们觉得数据的价值主要分成两个方向,第一个是在记录数据、记录信息这是面向过去和现茬,它应用在了我们广泛的经营活动中间包括考核、业绩披露,应用非常广泛要求数据做到精准化,保证传递的时效这主要依赖于數据治理和数据系统建设的情况,这是非常基础的功能它在过去和现在以及未来还将继续发挥着作用。按

  它同时也是我们第二个数据价徝的基本点也就是预测未来像这几年非常把的机器学习、机器学习的算法和迭代升级都是根据这个价值点实现,也就是预测未来预测未来是根据我们过去所记录的信息,对过去信息的理解和规律特征的提炼作为基础来预测未来理论上所有的决策点都可以用到预测未来嘚价值点。那它有一个最重要的要求是预测精准我们认为要想做到预测精准,主要是做好两方面的工作一方面是数据源的丰富性,这茬我们内部也有过一些实践经验当我们用更好的机器学习算法产生了效果,在有一些时候不如增加一个更有效的数据源对预测的精准会哽有帮助这是我们的一个实践经验。

曹玲】:第二个是算法的算法适用性和升级在这里也抛出一个话题供大家去讨论,是否是所有嘚模型都要用机器学习的算法去做因为机器学习的算法可能用到成百上千的变量去预测一个目标变量,对于我们以前传统的很多模型是鼡逻辑回归做的可能只有十几个变量或者五六个变量。它的预测性能理论上讲是不如机器学习的,在大部分的场合里面那是不是机器学习要全面取代传统的逻辑回归的算法呢?我觉得这里是可以值得探讨的问题我个人觉得人对于能够理解的事物会更加信任和相信,當这个变量成百上千有的是上万个变量的时候这时候预测的结果你会信吗?所以在美国很多的包括医药的监管对机器学习的算法还是歭有保留的态度。我们相信作为从从业人员来讲,希望大家更多地用到更好的工具能够达到精准度预测的目标。

  讲到这里相信在座嘚各位通过介绍了解到有很多来自于各行各业的TD客户,下面我想分享一下信用卡行业对数据的使用以便于大家对我的介绍有所理解。

  总結出一句话数据如同血液一般贯穿在信用卡的每一个经营环节中间。信用卡的经营环节我整体了一下大概是分为六个部分,申请是我們的客户来申请信用卡来获得一笔信用贷款。这个时候要填很多信息数据的价值就体现在记录信息的作用上。然后到审核审核时需偠挑选出目标客户,这个时候要核实客户的信息是否真实同时要预测,预测客户未来的信息申请信用评分、收入评分、欺诈评分,这些评分支撑一个决策要不要核准客户以及多少额度

曹玲】:进入激活环节也是非常重要的环节,如果客户不激活那前面投入的所有荿本都是沉默成本,所以希望客户有更多的激活如果客户不激活的话,我回有一个激活相应评分激活响应评分支撑我们对高响应客户采用更多自助渠道,比如发短信或APP通知的方式进行激活对于中低响应的采用不同的方式促使激活。最重要的环节就是用卡用卡环节是峩们进大家做APP的运营理念特别关注的指标日活非常相关,信用卡也注重日活就是每天用信用卡交易的客户。这是我们经营最重要的环节也是我们特别关注的环节。在这个环节里面有一个典型例子是分期分期的场景下是希望我们的客户做1224的分期会带来手续费,我们希朢低风险客户更多去做分期交易这个时候我们用到了分期响应评分、客户信用评分、客户渠道偏好,以及最优定价给他一个最后优的萣价。这四个工具帮助我们针对不同的客群形成不同的策略后面还有退出和赢回。

  整个过程中间大家会体会到数据如同血液一般贯穿茬信用卡经营过程中间,所以信用卡公司本质上就是一家数据公司

曹玲】:第二个部分,民生银行对信用卡数据的介绍

  2007年开始进荇数据大集中,整个从数据采集到数据准备、加工和发布形成了完整的流程现在主要基于数据仓库,这是一个汇总所有的数据源进行指標汇总进行指标标准化的一个平台。智能化的分析平台是面向我们的分析用户主要是报表用户、业务用户。第三是大数据平台这个岼台主要是进行数据科学挖掘、机器学习算法研发的平台。在这个平台上我们诞生了非常多的数据产品,这里有一个典型的产品叫叮咚標签叮咚标签是我们场景化、即时分期营销的标签。信用卡在2017年产生了7.5亿笔交易7.5亿笔交易里面通过这个标签疼痛精准筛选出有更高分期相应的标签,即时推送给营销部门这样能够提升营销的响应度和营销的覆盖率。

  刚才讲了一个点下面讲一个面,这个面是整个民生信用卡数据产品的矩阵第一是全生命周期的模型,这里分为风险类和营销类做了很多支撑另外是算法,这两年也在不停地尝试用机器學习的算法替代现有模型或新建模型有用到神经网络、随机森林等等的算法。

曹玲】:第二是客户全景标签刚才介绍了叮咚 标签是其中之一,还有一个是客户评级客户评级的标签是内部骨干级的标签,我们从2009年开始开发到现在为止迭代了第五期。这个项目获得了2013姩全球亚洲银行家最佳分析奖已经成为支撑我们非常多经营环节中的一个骨干级标签,比如说调额、催收、息费减免也是应用最广泛、最深入的客户标签。

  第三个方面是重大课题研究在这里我也特别地要提到一点,这个我们一直秉承着用数据说话的理念为高层决策莋数据支撑。之前跟崔总交流的时候创建TalkingData也是用数据说话的理念是神吻合。在这里还有一个特别的我们做过一个城市发展潜力研究的課题,把我们所辖一百一家机构信用卡未来潜力做了模型化、量化的分析和分类从分类的其中,我们就用到了TD发布的一个成果就是年輕客群在各个城市的流入和流出的情况,做出一个城市吸附力的排名我们把这个作为城市发展趋势研究里面的重要考量指标,最后的研究成果应用到了内部分支机构的考核目标制订上

  最后是定制化解决方案,我们会把模型、标签和一些数据理解和数据能力输出跟业务部門打造综合的技术解决方案现在我们大数据也与各种科技深度融合,包括云计算、人工智能和移动互联云计算和人工智能在后面会详細提到。在这里我就提一下人工智能我们做了很多的智能语音机器人,还有服务客服机器人、催收机器人、外呼分期机器人这些智能機器人的应用,能够提高我们对客户服务的覆盖面降低了人工成本,提升了整个经营的质效起到了非常重要的作用。

曹玲】:在这裏大家看到高颜值的产品就是近两年民生信用卡发布的颜值非常在线的产品。大家可以看到在右上角的萌黄系列这两个产品“朕就是這样的汉子”、“奉旨刷卡”,获得了信用卡设计奖类似于全球最高奖项的一览奖(音)如果对这两个产品感兴趣可以到全民APP申请。

  大數据与云计算相结合有一个落地应用是智能审批决策平台2017年民生银行信用卡发卡量达到了1000万张,这是超越了历史时期最高年度的发卡量其中70%的发卡量是来自于网申,网络的申请就是通过智能审批决策平台实现最快3秒钟能够实现审批。最后有一个数据介绍一下自动审批成功率达到90%,什么概念呢在2017所有的网络申请有1800万件,这1800万件的90%都是通过智能决策平台自动完成的相当于节省了人工审批人员300人,做箌这个结果依赖于三个方面

  第一是由于云平台、云计算能力达到秒级响应。

  第二是采纳了更多更有效的第三方数据源

  第三是建立了一套支持网络申请的模型。比如申请信用评分、收入评分和欺诈评分等等

曹玲】:2018年,我们和TalkingData有了一次全面的战略合作在我们看来,在跟TalkingData的深入逐步交流和合作我们认为TD有两个方面的能力是能力的长项,也是实现我们移动的关键点

   第一,在移动领域我们认为TD有非瑺丰富的移动运营的成功项目管理经验

  第二,在数据方面我们认为TD有非常成熟的数据理念和数据应用推广的实施能力

  这两点是实现我們移动战略不可或缺的力量,所以我们计划在未来从四个方面跟TD展开合作

  首先是移动战略,移动战略是面向未来的是以APP为主要的落地點。我们希望跟TD联合运营打造一个全民生活、全民都喜欢的APP

  第二是刚才崔总和林总都提到的数据中台,为了支撑移动我们希望前台更加创新、灵活、多变,希望打造一个重塑整个数据中台的能力形成能力的沉淀和数据的能力,能够更好地支撑移动战略

  第三是希望一個完整的智能营销闭环,从客户的洞察到分析、方案产生以及到最后的结案和评估然后再优化方案实现决策的智能化、流程的自动化和決策的最优化,形成完整的营销闭环

  第四是借助TD在移动领域、大数据领域的经验,跟民生一起培养出我们未来面向互联网、面向更高成長点的互联网运营和数据挖掘人才

曹玲】:下面最后是也借此机会跟大家汇报一下合作到现在为止的成绩单,成绩单也是让我们非常欣喜首先我们全民生活的日活DAU实现了2018年翻倍的增长,这是一个方面的成果

  第二个方面是我们通过深度数字化的服务体系,全民生活的ㄖ均分期额提升了6倍这里面还有一个数字也特别让我们觉得欣喜,就是70%的分期用户为首次分期用户可能大家知道,我们在没有APP之前自巳有自己的分期推广渠道有了APP以后运营方式进传统的都不一样了。在这里面在TD的帮助和支撑下实现了由APP70%的首次分期用户,这对我们嘚意义是不一样的

  <

浅谈我国体育赛事市场化运作的方法研究

体育赛事是一种以竞技运动为核心

经济效益及满足人民大众精神生活的需要为目的,

政治、经济、环境等领域造成一定影响的特殊事件随着社会主义市

场经济体制的建立和完善,

政府在赛事运作过程中扮演的角色也逐渐

分析研究我国体育赛事运作的发展趋势及洳何推

广体育赛事就显得尤为重要

这样可以为我国体育赛事的运作提供理

所谓市场化就是要根据消费者的需求来定位的发展方向与方式,

也就是在运作中找到需求点

根据不同的划分标准和所处的不同历史时期,可以将体育赛事划

本文的研究主要围绕我国经济体制转轨时期即市场

化条件下体育赛事项目的资源配置问题

体育赛事的分类及其特点也

将以此为核心,从以下三种形式的分类来加深对体育赛事的認识

①随着对外开放的不断深入和社会经济的不断发展,不同类型、

不同规模的体育赛事不断在我国涌现

目前应用最广泛的主要是依體

育赛事规模和任务的不同而建立的分类体系:

依比赛的规模,可分为:基层单位赛事、地区性赛事、全国性赛

事、国际赛事、洲际赛事、世界大赛(主要指奥运会、各体育单项的

世界锦标赛和世界杯赛等)

;依比赛的性质和任务可分为:运动会、

我要回帖

更多关于 根据购买者的介入程度 的文章

 

随机推荐