70 求NBA一年500万是什么等级的播放量,详细数据,以及单场比赛最高播放量

(www.36xwzx.com)为您提供第一手的全球、独到的科技观点和前沿的科技产品信息,覆盖通信、互联网、IT产业、和等领域,坚持专业、高品质的原创产业报道和。微博网友全程围观NBA 2017-18赛季 短视频播放量达142亿
近日,NBA总决赛落下帷幕,“骑勇大战”上演了近四年来最残暴的一次巅峰对决,詹姆斯首场便爆砍50+数据,但骑士最终0:4惨遭横扫,金州勇士“四年三冠”蝉联总冠军。NBA在全网引发了球迷们的关注。自2017年NBA与微博达成长期战略合作以来,2017-18首个完整合作赛季微博平台的短视频播放量达142亿,在微博看NBA、聊NBA已经成为球迷们的观赛新体验。微博&NBA首个完整合作赛季,短视频播放量达142亿自姚明进军NBA开始,篮球在国内的热度持续高涨。从过去收看电视转播,到互联网时代的在线视频网站观看,再到如今用手机App观看,NBA已经成为球迷朋友生活中必不可少的部分。而随着微博等社交媒体的普及,尤其是短视频逐渐迈入主流模式,通过社交平台看比赛、聊赛事、追球星已经成为球迷们的不二选择。据微博官方统计,自2017年3月微博与NBA达成长期战略合作后,联合推出了实时视频、独家节目、赛事竞猜、明星战队、抢红包等多种社交媒体独有的玩法。2017-18赛季作为双方合作的首个完整赛季,微博上NBA短视频的总播放量达142亿,激发了网友微博看球、聊球的热潮。2017-18NBA季后赛+总决赛期间,微博全网NBA相关短视频播放总量达到41.1亿,相关话题词增量达到163亿。其中总决赛相关短视频播放量就达到10.3亿。总决赛G4一场比赛贡献了2.4亿的短视频播放量。多路明星深度参与,预测打Call激活全程热度东部决赛第七场,詹姆斯大爆发,全场打满48分钟,砍下35分15板9助攻,率领骑士闯进总决赛。东西部决赛至总决赛期间,为了充分调动网友参与NBA讨论热情,@微博篮球 邀请张艺兴、张杰、许魏洲、陈意涵、袁姗姗等人气明星,在线发起#NBA明星战队#微博话题活动,为总决赛4支球队站队打call,创下了1.5亿阅读总量和52万的讨论热度。多位明星随赛事进程,发布赛事相关微博、表白球星,明星战队的加盟在微博全网进一步扩大赛事影响力。总决赛期间,多位明星参与录制的视频内容,单条微博平均播放达到500万+。总决赛期间,微博还联合NBA官方,联动10位体育、娱乐明星及篮球KOL,包括人气小鲜肉吴磊、现役人气球员林书豪、丁彦雨航等,发起#NBA最强预测#活动,人气明星化身预言帝,话题一经上线随即引发网友的热烈参与互动。话题阅读量1.1亿,其中小鲜肉吴磊微博互动总量达到50万+。总冠军出炉,十位嘉宾的季后赛晋级之路也告一段落,杨毅以总分380分成为预言帝;林书豪则以360分屈居亚军,球星波尔津吉斯以320分夺得第三名。此外,人气小鲜肉吴磊获得230分的成绩。总冠军结果出炉,杨毅还通过微博自嘲:早就告诉过你们,我是最胖的……同时,杨毅还和林书豪同时猜对了杜兰特获得FMVP的结果。自制节目开启看球新模式,名人粉丝联动助推热度飙升
本文来自东方体育
Sina.cn(京ICP0000007) &NBA首位终身成就奖诞生! 比乔丹更有资格的人!收视率高达到8.05亿播放量。NBA首位终身成就奖诞生! 比乔丹更有资格的人!收视率高达到8.05亿播放量。NBA神话韦德百家号  北京时间6月16日,NBA官方今天宣布,波士顿凯尔特人队传奇球星比尔-拉塞尔成为了首位NBA终生成就奖得主,该奖项将在美国当地时间6月26日进行的NBA年度颁奖典礼上颁发。  拥有11个NBA总冠军的比尔-拉塞尔被称为“指环王”,他是联盟历史上最有统治力的防守球员之一,而且曾5次成为最有价值球员。  此外,拉塞尔还是第一位赢得过NBA总冠军、NCAA总冠军和奥运会金牌的球员,之后他又成为第一位执教北美四大职业体育联盟的黑人教练。  值得一提的是,NBA总决赛MVP的奖项就是以比尔-拉塞尔命名。所以每年NBA总冠军诞生之后,往往都是比尔-拉塞尔亲自为总决赛MVP得主颁发奖杯。  今年NBA总决赛上,拉塞尔就为勇士队的凯文-杜兰特亲手颁发FMVP奖杯。  NBA年度颁奖典礼将于美国当地时间6月26日在纽约举行,典礼上,联盟将正式把NBA终生成就奖颁发给比尔-拉塞尔。2017年NBA总决赛落下帷幕,金州勇士队以4比1的总比分战胜克里夫兰骑士队,赢得NBA总冠军。而本次季后赛和总决赛期间,微博更是创造了视频总播放量近30亿、单场赛事视频播放量超1.45亿、直播间观看人数达1274万人次、新增话题阅读量155亿等多项微博体育观赛纪录。  今年3月,NBA中国与微博达成其在社交媒体领域的第一次深度合作,微博成为NBA中国官方社交媒体平台。NBA中国与微博的战略合作,基于视频、直播观赛的新趋势,面向3.13亿微博活跃用户,双方共同推出了NBA赛事实时短视频、比赛集锦、原创视频等赛事内容消费场景,旨在为广大网友打造了国际顶级体育赛事互动体验。  社交媒体改变了中国球迷了解和享受NBA的方式,而备受中国球迷关注的季后赛无疑成为双方合作最佳的阅兵场。整个季后赛&总决赛期间,视频播放量呈现出爆发式增长。微博上NBA相关总视频播放量达到29.03亿,总决赛5场的视频播放量便达到8.05亿,其中总决赛G5单场视频播放量便达到1.45亿,远超过此前NFL超级碗决赛赛事短视频8841.6万的播放量,创造了微博单场赛事视频播放量纪录。  NBA、微博体育、微博篮球等官方账号为网友带来了最原汁原味的赛事视角,由@NBA官方发布的赛后勇士队捧杯视频24小时内便获得了1444余万次播放,成为当天最受微博网友关注的视频之一。除了官方发布外,双方还首度授权自媒体用户版权视频, 4个MCN账号季后赛产出2128条视频,累计创造了1.8亿播放量。官方账号与MCN机构的协同生产,在满足球迷更多元化、个性化的观赛需求外,也实现了优质赛事内容的更即时、更深度、更广泛的传播。本文由百家号作者上传并发布,百家号仅提供信息发布平台。文章仅代表作者个人观点,不代表百度立场。未经作者许可,不得转载。NBA神话韦德百家号最近更新:简介:流过泪的眼睛更明亮,滴过血的心灵更坚强!作者最新文章相关文章&figure&&img src=&https://pic2.zhimg.com/v2-3b65a643da0d67fd897a8d_b.jpg& data-rawwidth=&1204& data-rawheight=&579& class=&origin_image zh-lightbox-thumb& width=&1204& data-original=&https://pic2.zhimg.com/v2-3b65a643da0d67fd897a8d_r.jpg&&&/figure&&p&很多读者看到漂亮的图表都会问“这个怎么做”,“用什么工具实现”。制作漂亮的可视化一般有这样几个方式:&/p&&ol&&li&利用Excel内置的图表做一些常规的统计图。高级复杂的譬如动态图表,图表的筛选展示可以通过写VBA来实现。&/li&&li&通过R、Python一类的数据分析语言,调用图表功能包,呈现可视化的数据,数据分析常用。&/li&&li&借助Echarts、HighCharts、D3.js等开源的可视化插件,嵌入代码,开发成插件包,可视化工程师和前端开发常用。&/li&&/ol&&p&&b&可视化最实用的场景就是做报表。&/b&既然这次的主题是可视化,那小编今天就细细地讲一下酷炫的可视化报表是怎么做的?有哪些基础和高级的可视化图表?代码开发是怎么一回事?大屏又是如何操作?&/p&&p&代表工具&a href=&http://link.zhihu.com/?target=http%3A//www.finereport.com/%3Futm_source%3Dmedia%26utm_medium%3Dzhihu& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&FineReport&/a&,此前介绍过其使用场景和功能。本质是一个通用的报表制作和数据可视化工具,是一个开放的商业报表工具。好比Excel,小到可以存储统计数据、制作各式各样的图表、dashboard,大到制作财务报表、开发进销存系统。大家若不熟悉,可自行和Excel绑定对比。&/p&&h2&&b&基础图表+表格&/b&&/h2&&p&柱形图、折线图、饼图、气泡图、散点图等能满足常规的数据统计。拿到数据后,先分析要展示几个维度,选用什么样的图表,需要几个图表展示等。&/p&&p&&b&如何选择图表的类型?&/b&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-145f5dbe35e189c97a1d166e569ba2fc_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1185& data-rawheight=&836& class=&origin_image zh-lightbox-thumb& width=&1185& data-original=&https://pic1.zhimg.com/v2-145f5dbe35e189c97a1d166e569ba2fc_r.jpg&&&/figure&&p&(图片源自网络)&/p&&p&&b&基础图表的制作流程&/b&&/p&&p&在FineReport中,图表的操作流程类似Excel,数据准备——插入图表——选择图表类型—选择分类轴、系列名称和系列值——选择图表样式。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-182ed42d7d9a29d8edc83_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&892& data-rawheight=&200& class=&origin_image zh-lightbox-thumb& width=&892& data-original=&https://pic4.zhimg.com/v2-182ed42d7d9a29d8edc83_r.jpg&&&/figure&&p&&b&各式各样的表格&/b&&/p&&p&表格主要在于文字、数字、格间的美感,以及整体的色彩搭配和谐,这些在FineReport中都可通过自定义来是实现。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-03fea9eb7ed43a765359_b.jpg& data-size=&normal& data-rawwidth=&1152& data-rawheight=&648& class=&origin_image zh-lightbox-thumb& width=&1152& data-original=&https://pic2.zhimg.com/v2-03fea9eb7ed43a765359_r.jpg&&&figcaption&聚合报表&/figcaption&&/figure&&figure&&img src=&https://pic4.zhimg.com/v2-696e9ed4fcb_b.jpg& data-size=&normal& data-rawwidth=&2045& data-rawheight=&756& class=&origin_image zh-lightbox-thumb& width=&2045& data-original=&https://pic4.zhimg.com/v2-696e9ed4fcb_r.jpg&&&figcaption&复杂折叠树报表&/figcaption&&/figure&&figure&&img src=&https://pic2.zhimg.com/v2-fa8d83cc5b2c394ebaad_b.jpg& data-size=&normal& data-rawwidth=&1629& data-rawheight=&841& class=&origin_image zh-lightbox-thumb& width=&1629& data-original=&https://pic2.zhimg.com/v2-fa8d83cc5b2c394ebaad_r.jpg&&&figcaption&卡片分栏报表&/figcaption&&/figure&&h2&&b&高级图表&/b&&/h2&&p&高级图表都是在基本图表的基础上展开来一些新特性。&/p&&p&饼图类:等弧度玫瑰图、不等弧度玫瑰图…&/p&&p&柱形图类:堆积柱形图、百分比堆积柱形图…&/p&&p&条形图类:堆积条形图、百分比堆积条形图…&/p&&p&折线图类:堆积折线图、面积图…&/p&&p&仪表盘类:多指针的仪表盘360度、多指针的仪表盘180度、百分比圆环仪表盘、百分比刻度槽型仪表盘、试管型仪表盘…&/p&&p&雷达图类:普通雷达图、堆积柱形雷达图…&/p&&p&气泡图类:普通气泡图、力学气泡图、十字象限气泡图…&/p&&p&地图类:区域地图、点地图、大数据流向地图…&/p&&p&还有各种组合图,比如“柱形图—折线图、柱形图—面积图、堆积柱形图—折线图、自定义地图”…&/p&&p&其他,还有漏斗图、甘特图、词云、框架图等等。&/p&&p&这些图在FineReport都是现成使用的。在其他工具或其他使用场景中,可由交由可视化工程师开发。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-c5ecd2bd4a54b0cd59fa_b.jpg& data-size=&normal& data-rawwidth=&1497& data-rawheight=&699& class=&origin_image zh-lightbox-thumb& width=&1497& data-original=&https://pic3.zhimg.com/v2-c5ecd2bd4a54b0cd59fa_r.jpg&&&figcaption&FineReport部分图表&/figcaption&&/figure&&figure&&img src=&https://pic2.zhimg.com/v2-fc3e7bd8f59d_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&910& data-rawheight=&499& class=&origin_image zh-lightbox-thumb& width=&910& data-original=&https://pic2.zhimg.com/v2-fc3e7bd8f59d_r.jpg&&&/figure&&figure&&img src=&https://pic3.zhimg.com/v2-8a2ae4e5dbf3e1b66dcab4f516e4a576_b.jpg& data-size=&normal& data-rawwidth=&910& data-rawheight=&448& class=&origin_image zh-lightbox-thumb& width=&910& data-original=&https://pic3.zhimg.com/v2-8a2ae4e5dbf3e1b66dcab4f516e4a576_r.jpg&&&figcaption&甘特图(展示机器使用状态和排期)&/figcaption&&/figure&&p&为了高度结合数据分析的过程,更好的理解数据背后的业务意义。&b&可视化图表除了形态还有动态展示部分,就是所谓的动态可视化。&/b&&/p&&p&&b&例1:地图的钻取和联动&/b&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-1881e2bfda6663db3ffa46_b.jpg& data-size=&normal& data-rawwidth=&1366& data-rawheight=&662& data-thumbnail=&https://pic3.zhimg.com/v2-1881e2bfda6663db3ffa46_b.jpg& class=&origin_image zh-lightbox-thumb& width=&1366& data-original=&https://pic3.zhimg.com/v2-1881e2bfda6663db3ffa46_r.jpg&&&figcaption&地图的钻取和联动动效&/figcaption&&/figure&&p&&b&例2:图表联动&/b&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-70b91c7f088fa7ee14fe909ddb322d8a_b.jpg& data-size=&normal& data-rawwidth=&904& data-rawheight=&596& data-thumbnail=&https://pic3.zhimg.com/v2-70b91c7f088fa7ee14fe909ddb322d8a_b.jpg& class=&origin_image zh-lightbox-thumb& width=&904& data-original=&https://pic3.zhimg.com/v2-70b91c7f088fa7ee14fe909ddb322d8a_r.jpg&&&figcaption&图表联动动效&/figcaption&&/figure&&p&&b&例3:点击词云跳转链接&/b&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-b258bfbdb6f_b.jpg& data-size=&normal& data-rawwidth=&870& data-rawheight=&594& data-thumbnail=&https://pic4.zhimg.com/v2-b258bfbdb6f_b.jpg& class=&origin_image zh-lightbox-thumb& width=&870& data-original=&https://pic4.zhimg.com/v2-b258bfbdb6f_r.jpg&&&figcaption&超链跳转动效&/figcaption&&/figure&&p&&b&例4:图表切换&/b&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-337f4dbf66ec294a20b6_b.jpg& data-size=&normal& data-rawwidth=&922& data-rawheight=&460& data-thumbnail=&https://pic3.zhimg.com/v2-337f4dbf66ec294a20b6_b.jpg& class=&origin_image zh-lightbox-thumb& width=&922& data-original=&https://pic3.zhimg.com/v2-337f4dbf66ec294a20b6_r.jpg&&&figcaption&图表切换动效&/figcaption&&/figure&&p&过去这些动态特效和交互属性都要写代码开发,这个在FineReport都已经封装成一个个功能,还有图表缩放、自动刷新、数据提示。再复杂点,就是设动态参数加超链。&/p&&h2&&b&利用开源插件开发&/b&&/h2&&p&就是用市面上开源的数据可视化工具, 譬如Highcharts、D3.js、百度Echarts、蚂蚁金服AntV、Google&br&Charts、Raphael.js、Sigma.js、three.js等。&/p&&p&像在7月,我们举办了一场可视化插件开发大赛上,很多开发者开发了令人心动的图表插件。&/p&&p&&b&譬如下方的3D城市全景地图&/b&。作者Little使用Echart-GL开源库和MapBox,与地图结合,基于真实地图和基本建筑数据构造都市圈级别的宏大场景,适用于政府部门、连锁企业、LBS提供商等对真实经纬度和展现区域范围敏感的用户。插件的底层是WebGL(Web Graphic Library),它是一个 JavaScript API,用于在任何兼容的 Web 浏览器中渲染 3D 图形。WebGL 程序由用 JavaScript 编写的控制代码和用 OpenGL 着色语言(GLSL)编写的着色器代码构成,这种语言类似于 C 或 C++,可在 GPU 上执行。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-5bcb0d1ac679f5bdb73d9c_b.jpg& data-size=&normal& data-rawwidth=&1899& data-rawheight=&878& data-thumbnail=&https://pic4.zhimg.com/v2-5bcb0d1ac679f5bdb73d9c_b.jpg& class=&origin_image zh-lightbox-thumb& width=&1899& data-original=&https://pic4.zhimg.com/v2-5bcb0d1ac679f5bdb73d9c_r.jpg&&&figcaption&3D城市大屏&/figcaption&&/figure&&p&&b&比如滚动报表图。&/b&传统的决策报表块是静态的,列表不会滚动,数据必须一次性展现,在大屏中效果不够酷炫,无法自动获取最新的数据,除非编写大量的js代码,对一般人来说就只能望洋兴叹。&/p&&p&而插件安装后,可以用图表的形式展现报表,通过设置数据集,显示成类似报表块列表,零代码获取数据库信息并配置自动更新时间,支持通过字段名称配置表头,支持自定义颜色配置等多种丰富的配置项,这样制作的决策报表效果也更酷炫。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-e8b6d1cc1dab8c5bdca8c93ce1da2f94_b.jpg& data-size=&normal& data-rawwidth=&599& data-rawheight=&292& data-thumbnail=&https://pic1.zhimg.com/v2-e8b6d1cc1dab8c5bdca8c93ce1da2f94_b.jpg& class=&origin_image zh-lightbox-thumb& width=&599& data-original=&https://pic1.zhimg.com/v2-e8b6d1cc1dab8c5bdca8c93ce1da2f94_r.jpg&&&figcaption&实时自动更新大屏&/figcaption&&/figure&&p&&b&动态水球图。&/b&插件作者Little集成了国内知名图表库的水球图组件,通过简洁明确的数据接口与功能丰富的样式配置项,可以快速生成炫酷的水球图以代替传统的仪表盘等展示百分比数据的图表,还可以用它来显示各种多层级的进度情况。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-e6d02f047c2c65955b85_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1200& data-rawheight=&960& class=&origin_image zh-lightbox-thumb& width=&1200& data-original=&https://pic2.zhimg.com/v2-e6d02f047c2c65955b85_r.jpg&&&/figure&&figure&&img src=&https://pic1.zhimg.com/v2-31fcefc3d35b5_b.jpg& data-size=&normal& data-rawwidth=&1920& data-rawheight=&935& class=&origin_image zh-lightbox-thumb& width=&1920& data-original=&https://pic1.zhimg.com/v2-31fcefc3d35b5_r.jpg&&&figcaption&水球图在大屏中的应用&/figcaption&&/figure&&h2&&b&数据大屏&/b&&/h2&&p&大屏展现作为数据可视化的一个典型使用场景,涵盖的知识太多。一个完整的大屏项目从开始调研到实施交付可能需要开发工程师、项目经理、视觉工程师、UI工程师、硬件工程师等等众多专业人员的参与。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-91b4c7f419c5c6b486df_b.jpg& data-size=&normal& class=&content_image&&&figcaption&企业驾驶舱&/figcaption&&/figure&&ul&&li&关于数据大屏设计美学:&a href=&https://zhuanlan.zhihu.com/p/& class=&internal&&大屏做成这样,领导不重用你都难!&/a&&/li&&li&数据大屏的具体制作:&a href=&https://zhuanlan.zhihu.com/p/& class=&internal&&4步教你玩转可视化大屏设计|内附实际操作&/a&&/li&&/ul&&p&&/p&&p&&/p&
很多读者看到漂亮的图表都会问“这个怎么做”,“用什么工具实现”。制作漂亮的可视化一般有这样几个方式:利用Excel内置的图表做一些常规的统计图。高级复杂的譬如动态图表,图表的筛选展示可以通过写VBA来实现。通过R、Python一类的数据分析语言,调用图…
&figure&&img src=&https://pic4.zhimg.com/v2-e7f84ea680_b.jpg& data-rawwidth=&640& data-rawheight=&750& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic4.zhimg.com/v2-e7f84ea680_r.jpg&&&/figure&&p&向商业媒体学习图表和可视化是非常好的方式,因为他们的图表与可视化都是经过专业的设计人员、美术人员制作出来,有很高的专业性和前沿性。很多国外专家也都是向媒体学习,练习用 Excel 来实现媒体的图表。在很久以前,我也是通过购买财经杂志获得案例,来琢磨如何用 Excel 来实现它上面的图表。&/p&&br&&p&今天我们看一则《财新》杂志的动态图表范例,这是他们昨天在微信公众号推出的一篇文章和动态图表,叫中国近十年境外大额房产投资的数据分析。网页链接是:&a href=&https://link.zhihu.com/?target=http%3A//datanews.caixin.com//.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&动图|中国买家境外大额房产投资十年增29倍&/a&,感谢动图作者韦梦的好作品。&/p&&br&&p&&strong&例图分析&/strong&&/p&&br&&figure&&img src=&https://pic4.zhimg.com/v2-f8f96e371ef_b.jpg& data-rawwidth=&640& data-rawheight=&748& data-thumbnail=&https://pic4.zhimg.com/v2-f8f96e371ef_b.jpg& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic4.zhimg.com/v2-f8f96e371ef_r.jpg&&&/figure&&p&这个动态图表非常酷,默认显示一个类似于封面一样的页面,有个堆积柱形图,显示10年来每年分季度累计的投资额,可以看总体的变化趋势。然后有两个选择按钮,你可以选择按国家或者按房产类型来看细分的数据,这时候堆积柱形图变成了垂直方向悬空、水平底边对齐的形式。这种把堆积柱形图改成分组水平对齐的方式,可以克服堆积柱形图不容易看出各分项变化趋势的缺陷问题。还有一个刷新还原的按钮,点击又回到这个封面。&/p&&br&&p&这个交互方式很有新意,尤其是切换时沙盒流动的感觉,非常灵动轻盈。在我们的实际工作中也可以借鉴应用这种交互方式,比如说对你的近十年的销售额数据的分析,分时间、分地区、分产品、分销售渠道等,来进行总体趋势和构成比较分析,都是很合适的。&/p&&br&&p&如果我们用 Excel 来做这个动态图表,可能做不到那么灵动的效果,但是交互的方式和界面是可以做到差不多的。今天我们就尝试用 Excel 来实现这样一个动态交互图表。&/p&&br&&p&&strong&作图思路&/strong&&/p&&br&&p&首先,让我们看一下做图思路。&/p&&ol&&li&&p&选择器。这里财新用的是扁平化风格的两个选择按钮和一个刷新按钮。我们在《向经济学人学图表》第2季里面介绍过利用超链接和自定义函数,把单元格变成一个选择器的做法,很巧妙很高级,但是要用到宏。这里为了简单起见,我们使用窗体控件里面的单选按钮来做,但要想办法让用户看不出来。&/p&&/li&&li&&p&悬空柱形图。选择后的3个柱形图,其中有两个是细分柱形图要悬空水平对齐的形式,我们可以使用多行占位数据,把细分的柱形图给垫起来,形成水平方向对齐。&/p&&/li&&li&&p&柱形图切换。这3个切换的堆积柱形图,我们其实可以把它做成一个堆积柱形图,只是当你选择某一个分类后,另外两个的数据全部取值为0,你就看不见了。&/p&&/li&&li&&p&3个柱形图的类别名称标签,可以使用1组散点图来智能化地标记。&br&&/p&&/li&&/ol&&br&&p&好,这个就是我们的作图思路,下面可以开始制作了。&/p&&br&&p&&strong&制作步骤&/strong&&/p&&br&&p&1、首先第一步,是制作这个扁平化的选择器。&/p&&br&&p&我们直接利用单元格写上“按国家和地区”、“按房产类型”,和一个表示刷新的特殊符号“?”,这个圆弧箭头,你需要在那个插入符号里面找一找。然后,我们画3个空白的单选按钮放在这3个单元格的上方,锚定对齐好。他们的选择结果链接到 control工作表的 C3 单元格,D3 顺便翻出选择结果备用。&/p&&br&&p&当用户选择之后,前面两个格子要做出格式反馈,可以使用条件格式。选中前面两个格子,条件格式,使用公式的条件格式,=C6=control!$D$3,即如果其值等于选择结果对应的内容,那么就把这个单元格设置为白色填充黑色字体,表示被选中了。&/p&&br&&p&2、第二大步骤,是组织作图数据。&/p&&br&&p&这是我们的数据源,10年的数据,有3个细分维度:&/p&&br&&figure&&img src=&https://pic3.zhimg.com/v2-7b8a7a4c_b.jpg& data-rawwidth=&1075& data-rawheight=&642& class=&origin_image zh-lightbox-thumb& width=&1075& data-original=&https://pic3.zhimg.com/v2-7b8a7a4c_r.jpg&&&/figure&&p&先把这个原数据,通过选择性粘贴、粘贴链接的方式引用到新的工作表。这样做是为了方便我们后期好更新源数据。&/p&&p&按国家和按房产类型的堆积柱形图,它是需要悬空以后水平对齐的,所以说我们就要在每行数据下面插入一个空行,组织占位数据。&/p&&br&&figure&&img src=&https://pic1.zhimg.com/v2-971bba0f00cf_b.jpg& data-rawwidth=&1261& data-rawheight=&560& class=&origin_image zh-lightbox-thumb& width=&1261& data-original=&https://pic1.zhimg.com/v2-971bba0f00cf_r.jpg&&&/figure&&p&图中,D16的公式:=MAX($D15:$N15)-D15+vgap_2&/p&&br&&p&公式的意思是说我们取上1行的最大值减去上一格的值,然后再加上一个留空值。这个留空的间隔vgap_2,我们把它做成一个参数方便调整,暂时取值为整个分类数据里的最大值除以5。&/p&&p&这个公式注意写法,锁定列号,行号不锁定。向右复制到整行,然后能把这一行复制粘贴到余下的所有占位行。检查公式和结果正确。&/p&&br&&p&然后,我们要根据用户的选择,分别引用这3块里面的1块,到作图数据区域,&/p&&br&&p&第1块区域,Q9:=IF(control!$C$3=3,calc!D9,NA()),复制到满区域;&/p&&p&第2块区域,Q15:=IF(control!$C$3=1,calc!D15,NA()),复制到满区域;&/p&&p&第3块区域,Q40:=IF(control!$C$3=2,calc!D40,NA()),复制到满区域;&/p&&br&&p&3、第三步骤,做图表。&/p&&br&&p&现在我们以P8:AA50 数据区域插入堆积柱形图,并对所有的占位行数据序列的柱形图设置为无填充色。这一步你要分别通过选择器选择 按国家和地区、按房产类型,和刷新复原情况下的图表,把所有占位数据的柱形图都设置为无填充色。&/p&&br&&p&现在你测试选择,应该可以看到动态图表的变化,检查确认正确。下面我们来给它加上那个类别标签。&/p&&br&&p&我们需要准备一列辅助数据,是一个散点图的序列xy,也是分3块分别取值:&/p&&br&&p&第1块区域,显示季度数据时,标签放右侧,x,AC9:=IF(control!$C$3=3,11,NA()),y,AD10:=SUM($Z$9:Z10)-Z10/2。这里第1行有一点特别处理,需要看看。&/p&&br&&p&第2块区域,显示国家数据时,标签放左侧,x,AC15:=IF(control!$C$3=1,0.5,NA()),y,AD15:=SUM($Q$15:Q15)-Q15。往下复制到满区域。&/p&&br&&p&第3块区域,显示类型数据时,标签放左侧,x,AC40:=IF(control!$C$3=2,0.5,NA()),y,AD40:=SUM($Q$40:Q40)-Q40。往下复制到满区域。&/p&&br&&p&数据准备好之后,我们往图表里面添加一个新的序列,数据源暂时不管,确定,然后把这个序列更改图表类型为散点图,确认,再选择数据,给他的数据源指定xy序列,分别是AC、AD列,确定之后,图表里应该出现一组散点图,给它添加数据标签,指定为P列的的类别名称,位置靠左。&/p&&br&&p&现在我们通过选择按钮来切换图表,检查标签的位置,发现当用户选择刷新复原后,那个1234季度的标签位置靠左是不合适的,单独把这四个标签的位置分别调整为居中,以及第1季度的标签靠右。&/p&&br&&p&4、第四步,美化与收尾。&/p&&br&&p&现在动态图表模型已经完成,切换图表确认是正确的,然后让我们来做一些格式美化。为了实现类似财新杂志的风格,我们可以把这个图表拷到ppt里面去,利用ppt里面的取色器,从财新例图取色,来对柱形图快速进行逐一的填色。&/p&&p&我们还可以通过柱形图的图案填充,选择一种方块格的图案,比较接近于财新的这个圆点风格。这两步都是重复操作,略微有些繁琐。&/p&&br&&p&在点刷新复原按钮选的时候,封面图里面有一些文字说明,我们也可以利用一个文本框来动态引用。先在 control表的B12 写好说明文字,然后在B15:=IF(cur_sel=3,B12,&&),根据用户的选择,如果等于3,就引用这个说明文字,否则为空。然后在图表区域里面插入一个文本框,在公式栏里链接等于这个B15,就可以动态链接的文字出现与否。&/p&&br&&p&现在图表的基本完成,我们可以进行收尾了。我们还可以做个事情,把单选按钮的那个圆点点,用一个形状把它遮住,让用户看不出来这是个单选按钮。因为这两个单元格底色可能会发生变化,所以我们用来遮挡的形状来要利用一个条件格式单元格的链接图片,这个单元格设置条件格式,和前面选择器单元格类似。那么这个遮挡的图片就会根据用户的选择是显示为白色还是黑色,来智能化地遮住那个圆形按钮。&/p&&br&&p&最后的动态图表效果如下图:&/p&&br&&figure&&img src=&https://pic3.zhimg.com/v2-6fef927e3b68e8af1903a0_b.jpg& data-rawwidth=&612& data-rawheight=&740& data-thumbnail=&https://pic3.zhimg.com/v2-6fef927e3b68e8af1903a0_b.jpg& class=&origin_image zh-lightbox-thumb& width=&612& data-original=&https://pic3.zhimg.com/v2-6fef927e3b68e8af1903a0_r.jpg&&&/figure&&p&最后呢,我们可以把文件保护起来,避免用户不小心拖动了这些图表和图片。保护之前,要把这三个单选按钮的属性里面有个锁定给取消。整个图表就完成了,你可以进行一些调试检测,确认模型的制作正确性。&/p&&br&&p&&strong&知识回顾&/strong&&/p&&br&&p&本例综合性比较强,回顾一下,我们用到了哪些知识点呢?&/p&&ol&&li&&p&首先是这个扁平化选择器的DIY制作。我们是把文字放在单元格里面,单选按钮做成隐藏的、透明的,看起来是没有 Excel 痕迹的。通过条件格式来对用户的选择作出反馈。&/p&&/li&&li&&p&数据组织上,这种悬空水平对齐的堆积柱形图,我们是用了一些辅助占位数据,把它垫起来。&/p&&/li&&li&&p&然后这三个柱形图,事实上我们是用的一个柱形图,只是你选择某一个分类的时候这个分类的柱子才全部出来,其他分类都不出现。&/p&&/li&&li&&p&然后呢,给这个图表配色,我们是把它拷到ppt里面,利用ppt里面的取色器来快速填充颜色。以及设置了填充图案。取色器移出PPT外 的技巧。&/p&&/li&&li&&p&动态的标签,是使用了散点图去智能化标记,柱形图+散点图的组合图表。&/p&&/li&&li&&p&还有呢,我们复制这个条件格式单元格,粘贴为链接的图片,也就是拍照方式的图片,去遮挡一个单选按钮的那个圆形按钮,智能变化黑色还是白色。&/p&&/li&&/ol&&br&&p&&strong&运用场景&/strong&&/p&&br&&p&这种形式的动态图表很实用,在我们日常工作中的有很多的应用场景,比如说你公司近12个月或者近10年的销售数据,你可以呢,按时间总数来看,也可以按地域维度、产品类型来分类比较,可以使用这样一个动态图表来切换,既可以看他们的时间趋势,也可以看分类构成。&/p&&br&&p&&strong&范例下载&/strong&&/p&&br&&p&难度系数:★★★★★&/p&&p&实用系数:★★★★★&/p&&br&&p&如何获得范例下载?先转发本帖到朋友圈,然后在微信公众号 iamExcelPro 发送 “&strong&caixin1&/strong&”下载范例文件,动手练习。如果不想从头制作,直接在data表里填入你的数据,直接套用也是可以的。&/p&&br&&p&(本文为语音输入写作,个别地方略有口语风格,望见谅)&/p&&br&&p&想要成为能做出这样动态图表的高手吗?参加我们的《让你的图表动起来》课程,史上最全最体系化最高阶的动态图表技术与应用大全,由浅入深,晋身顶尖高手,不容错过,点击【&a href=&https://link.zhihu.com/?target=http%3A//study.163.com/course/introduction.htm%3FcourseId%3D& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&让你的图表动起来 - 动态图表大全 - 网易云课堂&/a&】立即前往。&/p&
向商业媒体学习图表和可视化是非常好的方式,因为他们的图表与可视化都是经过专业的设计人员、美术人员制作出来,有很高的专业性和前沿性。很多国外专家也都是向媒体学习,练习用 Excel 来实现媒体的图表。在很久以前,我也是通过购买财经杂志获得案例,来…
&figure&&img src=&https://pic4.zhimg.com/v2-39ffbdf7a1c929ab5a590807_b.jpg& data-rawwidth=&1600& data-rawheight=&1066& class=&origin_image zh-lightbox-thumb& width=&1600& data-original=&https://pic4.zhimg.com/v2-39ffbdf7a1c929ab5a590807_r.jpg&&&/figure&&blockquote&本文是&a href=&https://www.zhihu.com/question//answer/& class=&internal&&《如何七周成为数据分析师》&/a&的第十七篇教程,如果想要了解写作初衷,可以先行阅读七周指南。温馨提示:如果您已经熟悉业务基础,大可不必再看这篇文章,或只挑选部分。&/blockquote&&p&数据分析涉及不同的业务领域,很多时候,业务的了解比数据技巧更重要。很多新人常问Python、SQL,但鲜有问业务,可后者才决定分析的成败。&/p&&p&业务的洞悉决定了数据分析师发展的上限,数据技巧只是逼近它。好的分析师都懂业务,也必须懂业务。&/p&&p&我希望通过本文,让数据新人对业务有一个大概的了解,也适用产品和运营新人(我是互联网背景,所以本文更多涉及这块)。文章的内容会给你「宽」和「范」的感觉,希望对新人有帮助,老人一笑而过就行了。&/p&&h2&用户获取&/h2&&p&用户获取是运营的起始,用户获取接近线性思维,或者说是一个固定的流程:用户接触-用户认知-用户兴趣-用户行动/下载。每一个流程都涉及多个数据指标。&/p&&p&&b&渠道到达量&/b&&/p&&p&俗称曝光量,即产品推广页中有多少用户浏览。它可以在应用商店,可以在朋友圈,可以在搜索引擎,只要有流量的地方,都会有渠道曝光。&/p&&p&曝光量是一个蛮虚荣的数字,想一想现代人,每天要接触多少信息?其中蕴含了多少推广,最后能有几个吸引到用户?更多时候,渠道到达量和营销推广费挂钩,却和效果相差甚远。&/p&&p&广告和营销还会考虑推广带来的品牌价值。用户虽没有点击或和产品交互,但是用户知道有这么一个东西,它会潜移默化地影响用户未来的决策。然而品牌价值很难量化,在广告计算中,系统只会将用户的行为归因到最近一次的广告曝光。&/p&&p&广告点击量称为CTR,广告点击量/广告浏览量,除了广告,它也应用在各类推荐系统的评价中。&/p&&p&&b&渠道转化率&/b&&/p&&p&既然广告已经曝光,那么用户应该行动起来,转化率是应用最广阔的指标。业界将转化率和成本结合,衍生出CPM,CPC,CPS,CPD,CPT等。&/p&&p&CPM(Cost Per Mille)指每千人成本,它按多少人看到广告计费,传统媒介比较倾向采用。CPM推广效果取决于印象,用户可能浏览也可能忽略,所以它适合在各类门户或者大流量平台采用Banner形式展现品牌性。&/p&&p&CPC(Cost Per Click)指每用户点击成本,按点击计价,对广告主来说,这个比CPM的土豪作派理性多了。也有很多人会认为,CPC不公平,用户虽然没有点击,但是曝光带来了品牌隐形价值,这对广告位供应方是损失。&/p&&p&CPA(Cost Per Action)指每行动成本,按用户行为计价,行为能是下载也能是订单购买。CPA收益高于前两者,风险也大得多,它对需求方有利对供应方不利。&/p&&p&以上三种是常见的推广方式,CPT按时间,CPS和CPS算在CPA的范围内。渠道推广是依赖技术的行业,用户画像越精准,内容与用户越匹配,则越容易产生收益。&/p&&p&还有一种指标eCPM(effective cost per mille),每一千次展示可获得收入,这是流量主预估自身收益的指标。&/p&&p&&b&渠道ROI&/b&&/p&&p&ROI是一个广泛适用的指标,即投资回报比。&/p&&p&市场营销、运营活动,都是企业获利为出发点,通过利润/投资量化目标。利润的计算涉及财务,很多时候用更简单的收入作分子。当运营活动的ROI大于1,说明这个活动是成功的,能赚钱。&/p&&p&除了收入,ROI也能推广到其他指标,有些产品商业模式并不清晰,赚不到钱,那么收入会用其他量化指标代替。譬如注册用户量,这也就是获客成本了。&/p&&p&&b&日应用下载量&/b&&/p&&p&App需要下载,这是一个中间态,如果不注意该环节也会流失不少用户。应用商店的产品介绍,推广文案都会影响。有些动辄几百M的产品,常将部分安装留在初次启动应用时以补丁形式完成,如各类游戏,就是怕漫长的下载时间造成玩家流失。&/p&&p&第三方平台下载到用户注册App,这步骤数据容易出错,主要是用户对不上。技术上通过唯一设备ID匹配。&/p&&p&&b&日新增用户数&/b&&/p&&p&新增用户数是用户获取的核心指标。&/p&&p&新增用户可以进一步分为自然增长和推广增长,自然增长可以是用户邀请,用户搜索等带来的用户,而推广是运营人员强控制下增长的用户量。前者是一种细火慢炖的优化,后者是烹炸爆炒的营销。&/p&&p&&b&用户获客成本&/b&&/p&&p&用户获取必然涉及成本,而这是运营新手最容易忽略的。曾经写过一篇文章描述获客成本,「&a href=&http://link.zhihu.com/?target=http%3A//mp.weixin.qq.com/s%3F__biz%3DMjM5NjEyMDI2MQ%3D%3D%26mid%3D%26idx%3D1%26sn%3Da1f0b5e8eb97a412e98f7bd687c07cda%26chksm%3Dbfff74bcda57aa4e76a11ba30fecebcffscene%3D21%23wechat_redirect& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&获取新增用户,运营都应该知道的事&/a&」。&/p&&p&&b&一次会话用户数&/b&&/p&&p&一次会话用户,指新用户下载完App,仅打开过产品一次,且该次使用时长在2分钟以内。这类用户,很大可能是黑产或者机器人,连羊毛党都算不上。&/p&&p&这是产品推广的灰色地带,通过各种技术刷量,获取虚假的点击量谋取收益。该指标属于风控指标,用于监管。&/p&&h2&用户活跃&/h2&&p&用户活跃是运营的核心阶段,不论移动端、网页端或者微信端,都有相关指标。另外一方面,现在数据分析也越来越注重用户行为,这是精细化的趋势。&/p&&p&&b&日活跃用户/月活跃用户&/b&&/p&&p&行业默认的活跃标准是用户用过产品,广义上,网页浏览内容算「用」,在公众号下单算「用」,不限于打开APP。「&a href=&http://link.zhihu.com/?target=http%3A//mp.weixin.qq.com/s%3F__biz%3DMjM5NjEyMDI2MQ%3D%3D%26mid%3D%26idx%3D1%26sn%3Df7b436c0e0f2b%26scene%3D21%23wechat_redirect& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&一篇文章读懂活跃数据&/a&」。&/p&&p&活跃指标是用户运营的基础,可以进一步计算活跃率:某一时间段内活跃用户在总用户量的占比。按时间维度,则有日活跃率DAU、周活跃率WAU和月活跃率MAU。活跃用户数,衡量的是产品的市场体量,活跃率,看的则是产品的健康。&/p&&p&可仅仅打开产品,能否作为产品健康的度量?答案是否定的。成熟的运营体系,会将活跃用户再细分出新用户、活跃用户、忠诚用户、不活跃用户、流失用户、回流用户等。流失用户是长期不活跃,忠诚用户是长期活跃,回流用户是曾经不活跃或流失,后来又再次打开产品的活跃用户。 &/p&&p&通过不同的活跃状态,将产品使用者划分出几个群体,不同群体构成了产品的总用户量。健康的产品,流失用户占比不应该过多,且新增用户量要大于流失用户量。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-883f42bb2c6bbe816ee5_b.png& data-rawwidth=&600& data-rawheight=&386& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&https://pic2.zhimg.com/v2-883f42bb2c6bbe816ee5_r.jpg&&&/figure&&p&&b&PV和UV&/b&&/p&&p&PV是互联网早期Web站点时代的指标,也可以理解为网页版活跃。PV(PageView)是页面浏览量,用户在网页的一次访问请求可以看作一个PV,用户看了十个网页,则PV为10。&/p&&p&UV(Unique Visitor)是一定时间内访问网页的人数,正式名称独立访客数。在同一天内,不管用户访问了多少网页,他都只算一个独立访客。怎么确认用户是不是同一个人呢?技术上通过网页缓存cookie或者IP判断。如果这两者改变了,则用户算作全新的访客。&/p&&p&PV和UV是很老的概念,但是数据分析绕不开他们,除了产品上各页面的浏览,在第三方平台如微信,各类营销活动都只能通过Web页实现,PV和UV便需要发光发热了。&/p&&p&有一点需要注意的是,微信浏览器不会长期保留cookie,手机端的IP也一直变动,基于此统计的UV会有误差(不是大问题,只是uv中的新访客误差较大)。这里可以通过微信提供的openid取代cookie作为uv基准,需要额外的技术支持。&/p&&p&&b&用户会话次数&/b&&/p&&p&用户会话也叫session,是用户在时间窗口内的所有行为集合。用户打开App,搜索商品,浏览商品,下单并且支付,最后退出,整个流程算作一次会话。&/p&&p&会话的时间窗口没有硬性标准,网页端是约定俗成的30分钟内,在30分钟内用户不管做什么都属于一次会话。而超过30分钟,不如出去吃个饭回来再操作,或者重现打开,都属于第二次会话了。&/p&&figure&&img src=&https://pic1.zhimg.com/v2-fba433e77a45fbaee1232ec_b.png& data-rawwidth=&1804& data-rawheight=&466& class=&origin_image zh-lightbox-thumb& width=&1804& data-original=&https://pic1.zhimg.com/v2-fba433e77a45fbaee1232ec_r.jpg&&&/figure&&p&移动端的时间窗口默认为5分钟。&/p&&p&用户会话次数和活跃用户数结合,能够判断用户的粘性。如果日活跃用户数为100,日会话次数为120,说明大部分用户都只访问了产品一次,产品并没有粘性。&/p&&p&用户会话依赖埋点采集,不记录用户的操作,是无法得知用户行为从哪里开始和结束的。另外一方面,用户会话是用户行为分析的基础。&/p&&p&&b&用户访问时长&/b&&/p&&p&顾名思义,用户访问时长是一次会话持续的时间。不同产品类型的访问时长不等,社交肯定长于工具类产品,内容平台肯定长于金融理财,如果分析师发现做内容的产品大部分用户访问时长只有几十秒,那么最好分析一下原因。&/p&&p&&b&功能使用率&/b&&/p&&p&除了关注活跃,运营和数据分析师也应该关注产品上的重要功能。如收藏,点赞,评论等,这些功能关系产品的发展以及用户使用深度,没有会喜欢一个每天打开产品却不再做什么的用户。&/p&&p&功能使用率也是一个很宽泛的范围,譬如用户浏览了一篇文章,那么浏览中有多少用户评论了,有多少用户点赞了,便能用点赞率和评论率这两个指标,然后看不同文章点赞率和评论率有没有差异,点赞率和评论率对内容运营有没有帮助,这些都属于功能使用率。又譬如视频网站,核心的功能使用率就是视频播放量和视频播放时长。&/p&&p&微信公众号指标即可以单独说,也能把它作为产品的功能延伸看待。图文送达率,转化分享率,二次转化分享率,关注者增量等和本文其他指标一脉相承。只是第三方数据多有不便,更多分析依赖假设。&/p&&h2&&b&用户留存&/b&&/h2&&p&如果说活跃数和活跃率是产品的市场大小和健康程度的话,那么用户留存就是产品能够可持续发展。&/p&&p&&b&留存率&/b&&/p&&p&用户在某段时间使用产品,过了一段时间后,仍旧继续使用的用户,被称为留存用户。留存率 = 仍旧使用的用户/ 当初的总用户量。&/p&&p&在今天的互联网行业,留存是比新增和活跃提到次数更多的指标,因为移动的人口红利没有了,用户越来越难获取,竞争也越来越激烈,如何留住用户比获得用户更重要。&/p&&p&假设产品某天新增用户1000个,第二天仍旧活跃的用户有350个,那么称次日留存率有35%,如果第七天仍旧活跃的用户有100个,那么称七日留存率为10%。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-822fa8f8bddaa54c6a78f9e7_b.png& data-rawwidth=&600& data-rawheight=&265& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&https://pic4.zhimg.com/v2-822fa8f8bddaa54c6a78f9e7_r.jpg&&&/figure&&p&Facebook有一个著名的40-20-10法则,即新用户次日留存率为40%,七日留存率为20%,三十日留存率为10%,有此表现的产品属于数据比较好的。&/p&&p&上面的案例都是围绕新用户展开,还有一种留存率是活跃用户留存率,或者老用户活跃率,即某时间活跃的用户在之后仍旧活跃的比率。它更多用周留存和月留存的维度。&/p&&p&新增留存率和活跃率是不同的,新增留存率关系于产品的新手引导,各类福利,而活跃留存率和产品氛围,运营策略,营销方式等有关,更看重产品和运营的水平。&/p&&p&&b&用户流失率&/b&&/p&&p&用户流失率和留存率恰好相反。如果某产品新用户的次日留存为30%,那么反过来说明有70%的用户流失了。&/p&&p&流失率在一定程度能预测产品的发展,如果产品某阶段有用户10万,月流失率为20%,简单推测,5个月后产品将失去所有的用户。这个模型虽然简陋,用户回流和新增等都没有考虑,但是它确实反应了产品未来的生命周期不容乐观。&/p&&p&这里可以引出一个公式,生命周期 = (1/流失率)*流失率的时间维度。它是经验公式,不一定有效。&/p&&p&产品的流失率过高有问题么?未必,这取决于产品的背景形态,某产品主打婚礼管理工具,它的留存率肯定低,大多数用户结婚后就不用。但这类产品一定有生存下去的逻辑。旅游类的应用也是,用户一年也打开不了几次,但依旧能发展。&/p&&p&&b&退出率&/b&&/p&&p&退出率是网页端的一个指标。网页端追求访问深度,用户在一次会话中浏览多少页面,当用户关闭网页时,可认为用户没有「留存」住。退出率公式:从该页退出的页面访问数/进入该页的页面访问数,某商品页进入PV1000,该页直接关闭的访问数有300,则退出率30%。&/p&&p&跳出率是退出率的特殊形式,有且仅浏览一个页面就退出的次数/访问次数,仅浏览一个页面意味着这是用户进入网站的第一个页面,俗称落地页LandingPage。&/p&&p&退出率用于网页结构优化,内容优化。跳出率常用于推广和运营活动的分析,两者容易混淆。&/p&&h2&营销&/h2&&p&营销也有自己的数据体系,互联网的数据体系就是脱胎于此才发展出AARRR框架。产品的发展模式有两种,如果一款产品能够在短时间获得百万用户,AARRR框架更适合它;如果一款产品从第一个用户起即有明确的商业模式,也能尝试套用市场营销的概念。&/p&&p&&b&用户生命周期&/b&&/p&&p&用户生命周期来源于市场营销理论,旧称客户生命周期。有兴趣可以移步「&a href=&http://link.zhihu.com/?target=http%3A//mp.weixin.qq.com/s%3F__biz%3DMjM5NjEyMDI2MQ%3D%3D%26mid%3D%26idx%3D1%26sn%3D400dfe16dc9f%26chksm%3Dbfff7e4d914ba5c3d5c91d3ff157efdde5d2cbfa3ae49e10a42a8109%26scene%3D21%23wechat_redirect& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&深入浅出,用户生命周期的运营&/a&」。&/p&&p&它有两种含义,一种是针对用户个体/群体的营销生存窗口。用户会随时间推移发生变化,这种变化带来无数营销机会,对市场和企业是机遇。如怀胎十月,它就是一个生命周期为十月的营销窗口,企业会围绕这时期的用户建立特定营销。搬家,大学毕业,买房等都具有典型的周期特征。&/p&&p&另外一种是用户关系管理层面的生命周期,它对运营人员更重要。产品和用户的业务关系会随着时间推移改变。在传统营销中,分为潜在用户,兴趣用户,新客户,老/熟客户,流失客户。这几个层层递进的阶段和用户活跃很像。&/p&&p&对于一款母婴产品,我既要知道营销的生存窗口,即怀孕了几个月,因为孕早期和孕晚期的营销侧重点不一样,刚怀孕肯定是最合适的。也要知道用户本身和产品对应的关系,这位妈妈是新客户,还是曾经用过App但流失了。&/p&&p&营销数据分析中,最关键的环节就是新客户—流失客户这个阶段,一位用户能和产品互动多久,将决定产品的生命力。听起来和留存挺像的,上文提过的生命周期计算公式,就是脱胎于市场营销。&/p&&p&&b&用户生命周期价值&/b&&/p&&p&生命周期价值是用户在生命周期内能为企业提供多少收益,它需要涉及财务定义。互联网行业更多提到生命周期,而不是生命周期价值,因为互联网的商业模式没有传统营销的买和卖那么简单明确。&/p&&p&举个例子,微信用户的生命周期价值能否计算?并不能,不论是广点通、游戏或者微信理财,都推导不出一个泛化的模型。但是部分产品,如金融和电商,生命周期价值是可计算的。&/p&&p&以互联网金融举例,某App提供理财和现金贷款两种业务,公司从这两个业务中获得收入通常是一个较稳固的比率,而成本支出平摊每个用户头上也是固定常数。所以利润就变成了用户理财和贷款的金额大小,以及生命周期的长短。这两者都是可估算的。&/p&&p&生命周期价值比生命周期重要,因为公司要活下去,就得赚更多的钱,而不是用户使用时间的长短。更多内容见「&a href=&http://link.zhihu.com/?target=http%3A//mp.weixin.qq.com/s%3F__biz%3DMjM5NjEyMDI2MQ%3D%3D%26mid%3D%26idx%3D1%26sn%3Dee998c624ee67a1a93cd3b1eb07d1b94%26chksm%3Dbfff6fc099f74cb08f82b869ae615d483e41719fab604%26scene%3D21%23wechat_redirect& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&运营的商业逻辑:CAC和CLV&/a&」。&/p&&p&&b&客户/用户忠诚指数&/b&&/p&&p&忠诚指数是对活跃留存的再量化。活跃仅是产品的使用与否,A用户和B用户都是天天打开App,但是B产生了消费,那么B比A更忠诚。数据往往需要更商业的指标描述用户,消费与否就是一个好维度。&/p&&p&我们可以用一个简化模型表示:&/p&&p&&img src=&http://www.zhihu.com/equation?tex=L+%3D+%5Csum_%7Bt%3D1%7D%5E%7Bn%7D%7B%5Cfrac%7Bs%7D%7Bs%2B1%7D+%7D+& alt=&L = \sum_{t=1}^{n}{\frac{s}{s+1} } & eeimg=&1&&&/p&&p&t是一个时间窗口,s代表消费次数,代表的距今某段时间内的消费次数。若时间窗口选择月,那么t=1是距今第1个月内的消费次数,t=2是距今第2个月内的消费次数,列举数据如下。
&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-eea0b5d833faf1f81db1_b.png& data-rawwidth=&1828& data-rawheight=&430& class=&origin_image zh-lightbox-thumb& width=&1828& data-original=&https://pic2.zhimg.com/v2-eea0b5d833faf1f81db1_r.jpg&&&/figure&&p&将消费次数代入s/(s+1),对数据进行转换,它的目的是收敛。以忠诚角度看,消费10次和消费100次的差异并不大,都属于很高且难以流失的用户,10/11和100/101的关系,并且有效规避极值。对于消费0次,1次,2次的用户,则对应0,0.5和0.66,在业务上也具备可解释性。
&/p&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-986fa42d4f16e02add37_b.png& data-rawwidth=&1808& data-rawheight=&432& class=&origin_image zh-lightbox-thumb& width=&1808& data-original=&https://pic4.zhimg.com/v2-986fa42d4f16e02add37_r.jpg&&&/figure&&p&各月份求和得出的指数能反应用户在消费方面的忠诚。图例只是解释,实际应用过程中需要归一化,并且考虑时间权重:越近的消费肯定越忠诚。上述的模型在于简单,适合各类商业模式的早期分析,如金融投资,便可以计算用户每个季度的投资次数。
&/p&&p&&b&客户/用户流失指数&/b&&/p&&p&流失指数是对流失的再量化,它是忠诚指数的反面。流失率衡量的是全体用户,而为了区分不同用户的精细差异,需要流失指数。在早期,流失指数=1-忠诚指数。&/p&&p&流失指数和忠诚指数的具体定义能根据业务需要调整,比如忠诚按是否消费,流失按是否打开活跃,只要解释能站住脚。&/p&&p&在拥有足够的行为数据后,可以用回归预测流失的概率,输出[0,1]之间的数值,此时流失的概率便是流失指数。
&/p&&p&&b&客户/用户价值指数&/b&&/p&&p&用户价值指数是衡量历史到当前用户贡献的收益(生命周期价值是整个周期,包括未来),它是精细化运营的前提,不同价值的用户采取不同策略以最大化效果。&/p&&p&用户价值指数的主流计算方式有两种,一种是RMF模型,利用R最近一次消费时间,M总消费金额,F消费频次,将用户划分成多个群体。不同群体即代表了不同的价值指数。&/p&&figure&&img src=&https://pic1.zhimg.com/v2-6f2bbf35a0a71f37e3bf23cddbf0fcf8_b.jpg& data-rawwidth=&667& data-rawheight=&384& class=&origin_image zh-lightbox-thumb& width=&667& data-original=&https://pic1.zhimg.com/v2-6f2bbf35a0a71f37e3bf23cddbf0fcf8_r.jpg&&&/figure&&p&第二种是主成分分析PCA,把多个指标转化为少数几个综合指标(即主成分),其中每个主成分都能够反映原始变量的大部分信息,且所含信息互不重复。&/p&&p&假设有一个旅游攻略网站,怎么界定优质的内容贡献者?用户的文章发布量?文章被点赞数?用户被关注数?文章好评数?文章更新频次?每个指标都挺重要的,主成分分析能囊括上述所有指标,将其加工成两到三个指标(通常是线性相关指标被合并)。这时再加工成价值指数则不难了。&/p&&p&上述各类指数,都是针对用户营销的明细数据。如何应用呢?最经典的是矩阵法,将指标划分出多个象限,如用户价值指数和用户流失指数。&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-3f178b0b74fb64ceb3dc92c5_b.png& data-rawwidth=&539& data-rawheight=&276& class=&origin_image zh-lightbox-thumb& width=&539& data-original=&https://pic2.zhimg.com/v2-3f178b0b74fb64ceb3dc92c5_r.jpg&&&/figure&&p&对于用户价值高且流失指数高的用户,应该采取积极的唤回策略,对于用户价值低且流失指数高,那么考虑成本的平衡适当运营即可…这就是精细化运营的一个案例,也是市场营销多年来总结出的有效方法。
&/p&&h2&&b&传播/活动&/b&&/h2&&p&把传播和活动放到一起讲,它们是一体两面。&/p&&p&&b&K因子&/b& &/p&&p&国外用得广泛的概念:每位用户平均向多少用户发出邀请,发出的邀请又有多少有效的转化率,即每一个用户能够带来几个新用户,当K因子大于一时,每位用户能至少能带来一个新用户,用户量会像滚雪球般变大,最终达成自传播。当K因子足够大时,就是快口相传的病毒营销。&/p&&p&国内的邀请传播,主体自然是微信朋友圈。微信分享功能和网页都是能增加参数统计的,不难量化。&/p&&p&&b&病毒传播周期&/b&&/p&&p&活动、广告、营销等任何能称之为传播的形式都会有传播周期。病毒性营销强则强矣,除非有后续,它的波峰往往只持续两三天。这也是拉新的黄金周期。&/p&&p&另外一种传播周期是围绕产品的邀请机制,它指种子用户经过一定周期所能邀请的用户。因为大部分用户在邀请完后均会失去再邀请的动力,那么传播周期能大大简化成如下:假设1000位种子用户在10天邀请了1500位用户,那么传播周期为10天,K因子为1.5,这1500位用户在未来的10天内将再邀请2250位用户。&/p&&p&理论上,通过K因子和传播周期,能预测依赖传播带来的用户量,可实际的操作意义不大,它们更多用于各类活动和运营报告的解读分析。&/p&&p&&b&用户分享率&/b&&/p&&p&现在产品都会内嵌分享功能,对内容型平台或者依赖传播的产品,分享率是较为重要的指标,它又可以细分为微信好友/群,微信朋友圈,微博等渠道。&/p&&p&有一点值得注意,数据只能知道用户转发与否,转发给谁是无法跟踪的。所以产品用物质激励用户分享要当心被薅羊毛。反正我转发都是给「文件传输助手」的…&/p&&p&&b&活动曝光量/浏览量&/b&&/p&&p&传播和线上活动是息息相关的,这两者的差异不大。想要做好一个活动,单纯知道活动的浏览量是不够的,好的活动一定是数据分析出来的。以朋友圈最寻常见的红包营销举例。它的分析通过网页参数,如下:&/p&&p&&a href=&http://link.zhihu.com/?target=http%3A//aaa.com/activity/bigsales/%3Fsource%3Dweixin%26content%3Dh9j76g%26inviter%3D00001%26timestamp%3D& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&aaa.com/activity/bigsal&/span&&span class=&invisible&&es/?source=weixin&content=h9j76g&inviter=00001&timestamp=&/span&&span class=&ellipsis&&&/span&&/a&
&/p&&p&问号后面的是网页参数,source=weixin说明网页是分享到微信的。content=h9j76g是页面具体内容,这里则是营销红包的类型。inviter=00001说明是哪个用户分享出去的,timestamp则是分享的具体时间戳。不同用户的分享页面有不同参数,按此作区分。&/p&&p&当这些页面被用户分享到朋友圈时,数据采集系统会记录所有页面的打开浏览。而页面参数则是活动精细化分析的前提。通过source=weixin,数据分析师知道了红包活动在微信的浏览量,相对应的还有QQ和微博。content则能看出用户喜欢哪个类型的红包,哪种红包被领取得多,成本又是多少。inviter则能看出平均每个分享者的分享页能带来多少浏览量。&/p&&p&参数越多,分析的维度就能越细,活动可优化的空间也越大。如果大家有心的话,可以看朋友圈(包括网页)各种活动的网页参数,观察其他产品的分析维度,它山之石可以攻玉,这是一个好习惯。&/p&&p&&b&活动参与率&/b&&/p&&p&活动参与率衡量活动的整体情况,可以套用用户活跃的分析指标。&/p&&p&这个活动的参于人数(活跃数)多少?有多少老用户参与了这个活动?有多少新增用户因为这个活动来,传播类的活动分享数据怎么样?活动中的各个流程转化如何?活动带来多少新订单。其实,运营活动可以看作一个短生命周期的产品,产品的一切指标都能应用于其中。&/p&&p&好的活动应该机制化,把它融入到产品的功能机制中,比如滴滴打车的红包,美图饿了么的红包,都是从活动逐渐变成一种打法和抓手。更早期的各类网游,也是通过活动的推成出新成为了现在常态化的游戏功能。&/p&&p&活动的机制化,意味着数据要分析活动指标,发现优点以改进,之后同样常态化成报表:今天使用了多少红包,今天有多少用户因为活动新增,等等。&/p&&h2&营收&/h2&&p&产品,运营或者市场人员,从来不是为活跃、留存负责,而是商业,是企业的根本财务。数据分析也不是为了提高活跃和留存,而是像一个巨头的漏斗,最终将业务驱动于此,即回归商业的本质。&/p&&p&&b&活跃交易用户数&/b&&/p&&p&从产品曝光到用户下载,用打开活跃到产生收入,产品的指标在一步步往商业靠拢,活跃交易用户则是核心指标。整个流程呈现漏斗状。&/p&&p&这里的交易,即是买方的消费,也包含卖方的供应。若平台包含B端和C端,则两端同等重要,均需要纳入数据体系。&/p&&p&和活跃用户一样,活跃交易用户也可以区分成首单用户(第一次消费),忠诚消费用户,流失消费用户等。细分交易数据和指标,关系到产品商业化的进展,所以是有必要的。其实到这个环节,各类指标已经更倾向用户画像,而非报表统计了。&/p&&p&活跃用户交易比,统计交易用户在活跃用户中的占比。当产品活跃用户足够多,但是交易用户少,此时的商业化是有问题的,俗称的变现困难,很多公司都倒在这一步。&/p&&p&&b&GMV&/b&&/p&&p&成交总金额,只要用户下单,生成订单号,便可以算在GMV里,不管用户是否真的购买了。互联网电商更偏好这个指标。&/p&&p&成交金额对应的是实际流水,是用户购买后的消费金额。销售收入则是成交金额减去退款。至于利润、净利率,涉及到财务成本,数据分析挺难拿到这类数据,所以不太用到。&/p&&p&把上述的三个指标看作用户支付的动态环节,则能再产生两个新指标,这也是数据分析的思维之一。成交金额与GMV的比率,实际能换算成订单支付率;销售收入和成交金额,也涉及到了退款率,当分析陷入卡顿时,不妨观察下这两个指标,或许有帮助。&/p&&p&&b&客单价&/b&&/p&&p&传统行业,客单价是一位消费者每一次到场消费的平均金额。在互联网中,则是每一笔用户订单的收入,总收入/订单数。&/p&&p&很多游戏或直播平台,并不关注客单价,因为行业的特性它们更关注一位用户带来的直接价值。超市购物,用户购买是长周期性的,客单价可以用于调整超市的经营策略,而游戏这类行业,用户流失率极高,运营人员更关注用户平均付费,这便是ARPU指标,总收入/用户数。&/p&&p&ARPU可以再一步细分,当普通用户占比太多,往往还会采用每付费用户平均收入ARPPU,总收入/收费用户数。&/p&&p&&b&复购率&/b&&/p&&p&若把复购率说成营收届的留存率,你就会知道它有多重要了。和新增用户一样,获得一个新付费用户的成本已经高于维护熟客的成本。&/p&&p&在不少分析场景中,会将首单用户单独拎出来作为一个标签,将两次消费以上的用户作为老客,之所以这样做,是从一到二的意义远不止加一那么简单。&/p&&p&用户第一次消费,可能是体验产品,可能是优惠,可能也是运营极大力地推动,各类因素促成了首单。而他们的第二次消费占比会有断崖式下跌(对应次日留存率的下跌),因为这时候的消费逐渐取决于用户对产品的信任,模式的喜欢或者习惯开始养成。&/p&&p&很多时候,用户决策越长往往意味着客单价越高,如投资,旅游。此时首单复购率越是一个需要关注的指标,它意味着更多的利润。&/p&&p&复购率更多用在整体的重复购买次数统计:单位时间内,消费两次以上的用户数占购买总用户数。&/p&&p&回购率是另外一个指标,值得是上一个时间窗口内的交易用户,在下一个时间窗口内仍旧消费的比率。例如某电商4月的消费用户数1000,其中600位在5月继续消费,则回购率为60%。600位中有300位消费了两次以上,则复购率是50%。&/p&&p&&b&退货率&/b&&/p&&p&退货率是一个风险指标,越低的退货率一定越好,它不仅直接反应财务水平的好坏,也关系用户体验和用户关系的维护。&/p&&h2&商品&/h2&&p&这里谈以商品为主的数据分析,商品不限于零售行业,知识市场、虚拟服务、增值服务都属于商品的一种。它有许多通用的分析模板,如购物车、进销存。&/p&&p&&b&购物篮分析&/b&&/p&&p&购物篮分析不应限于电子商务分析,而是用户消费行为分析。&/p&&p&连带率是购物篮分析的一种指标,特指销售件数和交易次数之比。在大型商场和购物中心中,连带消费是经营的中心,用户多次消费即连带消费。在电商中是购物的深度,是单次消费提高利润的前提。&/p&&p&商品热度是一种快速见效的分析。可以将商品分为最热门Top20,最盈利Top20等,它依托二八法则,找出利润的抓手,很多营销会将它和连带率结合,像电子商务,重点推广多个能带来流量的热门爆款,爆款并不赚钱,而是靠爆款连带销售其他有利润的商品。这种流量商品连带利润商品的策略并不少见。&/p&&p&购物篮分析中最知名的想必是关联度,简单理解是,买了某类商品的用户更有可能买哪些其他东西。啤酒与尿布大概是最知名的案例了,虽然它是错的,但揭示了商品之间确实存在关联。&/p&&p&关联分析有两个核心指标,置信度和支持度。支持度表示某商品A和某商品B同时在购物篮中的比例,置信度表示买了商品A和人有多少同时买了B,表示为A→B。老王每次去菜场买菜都喜欢买一把葱,在老王的菜篮(购物篮)分析中,葱和其他菜的支持度很高,可是能说明老王买葱后就一定买其他菜(葱→其他菜)么?不能,只能说老王买了菜会去买葱(其他菜→葱)。除此还有提升度。 最有名的是Apriori算法。&/p&&p&关联分析并非只适用于购物篮,在很多营销场景中都会用它作为追加销售和交叉销售。常见有大额消费+现金贷,医疗健康+保险等,目的便是提高营收。&/p&&p&&b&进销存&/b&&/p&&p&进销存是传统零售行业的经典管理模型,将企业商品经营拆分出采购、入库、销售三个环节,并且建立全链路的数据体系。在实际业务中,许多场景与进销存都息息相关。&/p&&p&电子商务有几个基础概念,商品、SKU、SPU。商品就是对应消费者理解的单品,任何主流的电子商务网站,商品详情页都对应一个商品,也称为SPU。而在商品详情页中,还会涉及尺码,颜色,样式的选择,这类属性形成了SKU,最小单位库存。每一个属性都对应着不同的SKU,如一件衣服有SML三个尺寸,则这件衣服是一个SPU,三个尺寸对应着三个SKU。&/p&&p&商品管理没有我们想象的那么简单,有些用户喜欢玫瑰金的iPhone,有些用户钟情于128G,如何更好地迈出这些商品,是从采购环节就开始的。&/p&&p&采购包括广度、宽度、深度三个维度。广度是商品品类,越充足的品类越能满足消费者的消费,但是也带来管理难销售难的缺点。市面上手机品类总共有50个,某手机店出售30种,品类比为60%。&/p&&p&采购宽度是SKU占比,代表商品供选择的丰富程度。iPhone有黑色、银色、玫瑰金三种颜色和16G、64G、128G三种容量,共9个SKU,如果手机店只卖玫瑰金色,则SKU占比0.33。采购深度是平均每个SKU的商品数量。&/p&&p&库存是一个中间状态,采购是进,销售是出。库存是一个动态滚动的变化过程,我们常拿过去时间窗口内的库存消耗速度衡量现有存量的消耗。某商场4月每天消耗库存1000件,4月末的库存为5万件,则这5万件的需要50天才能消耗完,50天被称为库存天数。虽然公式是理想状况,但以其判断缺货是没问题的。&/p&&p&销售环节大家更熟悉,指标聚焦在两个方面,销售的速度和销售的质量。销售速度常表示为售罄率,表示为时间窗口内的销售数量/时间窗口内的库存数量,这是比率,故可以用累计售罄率。某商品3月份累计售罄率50%,4月份累计售罄率60%,5月份累计售罄率80%,说明商品逐渐卖断货应该补货了,反过来售罄率一直低迷,则应该促销或者降低进货。&/p&&p&销售的质量和折扣率挂钩,乃是实收金额和标准金额的比率。国内各种红包折扣促销非常多,折扣率的统计师是非常有必要的。折扣率的典型应用是价格弹性指数:当价格变化1%时,商品销量变化的百分比。这个指数将直接影响利润。&/p&&p&进销存内容比较多,熟悉了留存活跃分析的人可能会稍有些不习惯。可是互联网变现的主流模式是电商或其变种,这方面的知识不可或缺。拿互联网金融来说,投资标的有典型的进货和库存特征,标的的投资额大小,风险等级与类型,标的剩余数量和预计库存天数,都是能直接适用进销存指标的。当分析师发现某理财标的库存天数过长,则要分析原因,是SKU过多,还是增长乏力。&/p&&h2&最后&/h2&&p&到这里,大家已经头晕了吧,业务是一个复杂体系,数据分析也从来不简单,两者结合都是充满挑战的。我的内容也没有囊括全部,比如电商还有搜索有效性的指标,用户在搜索框搜索,有多少为空搜索?而非空搜索中,有多少产生点击的有效搜索?小小一个搜索框也有很多门道。&/p&&p&更重要的能力是洞察和发现,文章所有的指标,并非我发明的,都是市场营销与数据分析的前辈总结而出,但是我个人学习中,并非囫囵吞枣,每个指标我都会停下思索如何用?过往哪种经验能和他联系起来。数据分析短期内是无法快速获得业务经验,但是多思考是一种更好掌握的技巧。&/p&&p&当然,分析中用不到那么多指标,往往两到三个关键指标足够,从业务方看,这些指标也不尽然是工作内容,大家别为KPI感到压力。更好的驱动与分析方式,是针对部门设立一个大目标,比如营收,将营收拆分成两到三个有逻辑关联的二级指标,如更多的付费用户能带来营收,更长的生命周期能带来营收,更高的客单价能带来营收。将二级指标分配个多个小团多或者按时间排期执行,二级指标也能拆分成三级。&/p&&p&————&/p&&p&文章长度超出我的预计了,想要一篇囊括还是吃力,控几不住我记几啊。以后更详细的解读,就留待未来出版或者新文了。下篇开始就是Python了。&/p&&p&欢迎关注我的个人公众号:tracykanc&/p&
本文是的第十七篇教程,如果想要了解写作初衷,可以先行阅读七周指南。温馨提示:如果您已经熟悉业务基础,大可不必再看这篇文章,或只挑选部分。数据分析涉及不同的业务领域,很多时候,业务的了解比数据技巧更重要。很多新人常…
(接上一期&a href=&https://zhuanlan.zhihu.com/p/?refer=hemingke& class=&internal&&知乎专栏&/a&,本期着重讲下图用红心标注的第四层和第五层)&figure&&img src=&https://pic3.zhimg.com/v2-f0acd9e84dbf27c88275b0_b.jpg& data-rawwidth=&606& data-rawheight=&311& class=&origin_image zh-lightbox-thumb& width=&606& data-original=&https://pic3.zhimg.com/v2-f0acd9e84dbf27c88275b0_r.jpg&&&/figure&&br&&p&&b&第四层,提升自动化程度&/b&&br&就像在IDE中使用了关键词提示以及经常检查Code Review,还是不能写好程序一样,这里面还有套路。&br&&br&Excel中的错误经常发生在不断的手工人肉操作,再简单的事情做个几十遍或者几百遍,出错的概率也会非常低。因此在Excel中可通过使用系统工具、高阶函数甚至VBA来提高自动化程度,避免反复输入函数或者重复操作,就能大大降低出错概率。&br&&br&比如,逐渐学会使用Excel自带的丰富数据清洗(排序、筛选、根据统一分隔符来分隔数据等)及分析工具(包括高阶的统计工具,ANOVA及多元线性回归等等一个都不少),减少人肉人工参与的过程。&/p&&p&&figure&&img src=&https://pic2.zhimg.com/75d041f19c10f492ac8f_b.jpg& class=&content_image&&&/figure&再比如,下面表格中,要求白色区域中的矩阵元素等于所在行、列及worksheet上对应数字的总和。最笨的办法是每个单元格写一次加总函数,重复几十次值几百次(应该会有许多张worksheet),非常容易出错;进阶的办法是利用绝对地址和相对地址,写一次函数,整个矩阵的函数拷贝粘贴就完成,出错概率大大降低,但是每出现一个新的表格就要更新函数,仍然有出错的不低概率;最高级的办法就是在上一个办法的基础上,利用CELL函数获取Worksheet的名字并提炼数字,然后一气呵成,整个表格的函数完全是动态的,Worksheet复制之后只要改成相应的名字就可以完成任务,在出错方面的鲁棒性很强。&br&&figure&&img src=&https://pic2.zhimg.com/702adc4e4bf28f65901cfad52be8a8b2_b.jpg& data-rawwidth=&968& data-rawheight=&593& class=&origin_image zh-lightbox-thumb& width=&968& data-original=&https://pic2.zhimg.com/702adc4e4bf28f65901cfad52be8a8b2_r.jpg&&&/figure&&br&又比如,制作Financial Modeling的时候经常需要将季度或者半年度数据汇总成年度的(或者反向实施),一般的做法都是写加减等简单的函数,然而却不能成块拖拽或者复制函数而需要手工不断写函数,不仅麻烦而且容易出错,利用Offset等函数,可以写好函数就一步成型,完成整个过程。&br&&figure&&img src=&https://pic2.zhimg.com/d0f62ffaffbfe915241ef_b.jpg& data-rawwidth=&894& data-rawheight=&401& class=&origin_image zh-lightbox-thumb& width=&894& data-original=&https://pic2.zhimg.com/d0f62ffaffbfe915241ef_r.jpg&&&/figure&&/p&&blockquote&函数写法是:&br&=IF(MOD(COLUMN(Constant!A1),2)=1,OFFSET($M4,0,INT((COLUMN(Constant!A1)-1)/2)), &br&-OFFSET($M4,0,INT((COLUMN(Constant!A1)-1)/2))+OFFSET($C4,0,INT((COLUMN(Constant!A1)-1)/2)))&/blockquote&&p&&br&又比如,在第二层中,使用设置Check Point(检查站)的方式来检测三张报表是否配平,然而这种土法炮制的方式只能防止最后的结果不能出错,而不能保证中间的状态以及提升效率。为了偷懒和提高财务模型的健壮性,将各类索引函数及数组函数用到极致,于是实现自动配平以及检查。&br&&figure&&img src=&https://pic4.zhimg.com/55ead616b552a_b.jpg& class=&content_image&&&/figure&&br&&figure&&img src=&https://pic4.zhimg.com/9bc2ce5c61cc3fb7c787af_b.jpg& data-rawwidth=&805& data-rawheight=&312& class=&origin_image zh-lightbox-thumb& width=&805& data-original=&https://pic4.zhimg.com/9bc2ce5c61cc3fb7c787af_r.jpg&&&/figure&&br&&/p&&blockquote&函数写法是:=SUM(('Balance Sheet'!$AA$8:$AA$100='Cash Flow'!$B44)*('Balance Sheet'!O$8:O$100-'Balance Sheet'!N$8:N$100)*('Balance Sheet'!$AB$8:$AB$100))&/blockquote&&p&&br&&b&第五层,使用先进的“编程思想”&/b&&br&以上都是技法,让编程真正成为一门科学或者手艺的是,里面存在心法或者思想。围绕着这些编程思想,构建出一套套体系:MVC框架、MVP框架以及OO等等。这些体系的目的大概都是提高工作效率、复用率以及鲁棒性等等,都是多快好省少出错得完成任务。然而世间万物,不少都是触类旁通。利用Excel做数据分析的基本思想其实和编程非常类似,许多框架都可以参考编程思想,这样就能提高效率和降低出错概率。&/p&&p&所以归根结底,还是要做“有思想”的人和“有思想”的事。&br&&/p&&blockquote&Excel最大的实战价值就是制作各类财务模型(Financial Model)或者简单的数学模型,用正确的方式方法来做模型(所谓的“套路”)才是心法。&br&&/blockquote&&p&&br&比如可以借鉴著名而老套的MVC到Excel的Financial Modeling,实战性强且效果好。将构建Financial Model的逻辑被分成三层, Model(负责数据),View(负责呈现)和Controller(负责业务逻辑),理想状态下其中一层的改动不会影响到另一层。&br&&/p&&ul&&li&灵活性高,需要有灵活的框架快速满足老板及客户多变的需求&/li&&li&复用性强,这个项目做得Financial Model,随便改改就能投入到下一个毫不相关的项目中使用&/li&&li&健壮性强,尽量减少频繁的手工输入或者操作,将原始数据集中在一个模块,改一个数据,相关的数据及模块自动更改&/li&&/ul&&p&在做大部分Financial Model的时候基本就是按照MVC的框架来要求自己的。&figure&&img src=&https://pic3.zhimg.com/50de4c5828b5aeaeac37_b.jpg& class=&content_image&&&/figure&&br&Financial Model搭建的过程就如同修建高楼一层层往上累加模块&br&&/p&&ul&&li&常数/核心数据/假设数据部分,包括:商业常数(汇率及税率等)、历史数据(过去的财报以及市场规模的历史数据)、认为靠谱而不能改动的预测数据、核心假设(比如假定宏观经济按照6-7%来增长)等等。这些数据略等于C语言的h文件部分,动一发而动全身,所以要单独对待。如同程序一样,Excel的函数中是不能出现hard-code的数字,所以如果一个财务模型中出现“=2*3.14*r”,基本是可以打回去重做的。&/li&&li&Scenario场景,包括:模型中需要经常调节的重要输入参数(比如:市场渗透率、Exit PE ratio等)。这些参数最好剥离出来成为一个单独的界面,可以比较方便的控制和调整,为之后的Sensitivity Analysis做准备,甚至可能遇到在上文中提到的类似于用梯度下降法寻求最优值的情况。&/li&&li&基础模型。这一步的核心就是做出预测的三张财务报表,最令人痛苦的是配平。可以使用各类复杂函数(Indirect/Offset/VLookup等)来进行配平而不会出错,而且复用性极高。&/li&&li&进阶模型。基于历史及预测的三张报表,做一些更复杂的财务分析或者估值预测,包括:DCF、Comparable、敏感性分析等等。&/li&&li&呈现。把用户(包括老板或者客户)最关心的产出放出来,用最友好的界面展现出来。当然做得极致些,可以把调整Scenario以及重要参数的界面也放出来,方便用户Manipulate Data(其实翻译成中文更有趣一些:猥亵数据)以便得到最满意的结果。&/li&&/ul&&p&下图是曾经奋战过的一个Financial Model,基本涵盖了上述的逻辑和构建过程,供大家参考。&figure&&img src=&https://pic4.zhimg.com/b7e2adef_b.jpg& class=&content_image&&&/figure&&br&&b&...更多回答请看&a href=&https://www.zhihu.com/people/he-ming-ke& class=&internal&&何明科的主页&/a&&br&...更多文章请到&a href=&http://zhuanlan.zhihu.com/hemingke& class=&internal&&数据冰山 - 知乎专栏&/a&&/b&&/p&
(接上一期,本期着重讲下图用红心标注的第四层和第五层) 第四层,提升自动化程度 就像在IDE中使用了关键词提示以及经常检查Code Review,还是不能写好程序一样,这里面还有套路。 Excel中的错误经常发生在不断的手工人肉操作,再简单的事情做个几…
&figure&&img src=&https://pic1.zhimg.com/v2-d5cf7dfd48c81f911ee62eb1e796a074_b.jpg& data-rawwidth=&654& data-rawheight=&390& class=&origin_image zh-lightbox-thumb& width=&654& data-original=&https://pic1.zhimg.com/v2-d5cf7dfd48c81f911ee62eb1e796a074_r.jpg&&&/figure&&blockquote&本文是&a href=&https://www.zhihu.com/question//answer/& class=&internal&&《如何快速成为数据分析师》&/a&的第三篇教程,如果想要了解写作初衷,可以先行阅读七周指南。温馨提示:如果您已经熟悉Excel,大可不必再看这篇文章,或只挑选部分。&/blockquote&&p&在&a href=&https://zhuanlan.zhihu.com/p/?refer=qinlu& class=&internal&&Excel技巧&/a&和&a href=&https://zhuanlan.zhihu.com/p/?refer=qinlu& class=&internal&&Excel函数&/a&后,今天这篇文章讲解实战,如何运用上两篇文章的知识进行分析。内容是新手向的基础教程。&/p&&p&曾经有童鞋向我反应没有Excel数据练习,所以这次提供真实数据。为了更好的了解数据分析师这个岗位,我用爬虫爬取了招聘网站上约5000条的数据分析师职位数。拿数据分析师进行数据分析。&/p&&p&&br&&/p&&p&&i&&b&数据真实来源于网络,属于网站方,请勿用于商业用途&/b&。&/i&&/p&&p&&a href=&https://link.zhihu.com/?target=https%3A//pan.baidu.com/s/1eUjcGaI& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&数据下载&/a&,提取密码 g5xa 。(链接可能会失效,最新链接去公众号看吧)&/p&&p&操作版本:Excel 2016 Mac版。文件大小约2M。&/p&&p&原始数据最好另外保存一份,后期数据可视化、SQL、Python的教程都会用到(主要我懒得找其他数据了)。&br&&/p&&p&演示过程分为五个步骤:明确目的,观察数据,清洗数据,分析过程,得出结论。&/p&&p&这也是通常数据分析的简化流程。&/p&&p&————&br&&/p&&p&&b&明确目的&/b&&/p&&p&数据分析的大忌是不知道分析方向和目的,拿着一堆数据不知所措。&b&一切数据分析都是以业务为核心目的&/b&,而不是以数据为目的。&/p&&p&数据用来解决什么问题?&/p&&p&是进行汇总统计制作成报表?&/p&&p&是进行数据可视化,作为一张信息图?&/p&&p&是验证某一类业务假设?&/p&&p&是希望提高某一个指标的KPI?&/p&&p&永远不要妄图在一堆数据中找出自己的结论,太难。目标在前,数据在后。哪怕给自己设立一个很简单的目标,例如计算业务的平均值,也比没有方向好。因为有了平均值可以想数字比预期是高了还是低了,原因在哪里,数据靠谱吗?为了找出原因还需要哪些数据。&/p&&p&既然有五千多条数据分析师的岗位数据。不妨在看数据前想一下自己会怎么运用数据。&/p&&p&数据分析师是一个什么样的岗位?&/p&&p&它的工资和薪酬是多少?&/p&&p&它有什么特点,需要掌握哪些能力?&/p&&p&哪类公司更会招聘数据分析师?&/p&&p&等等。有了目标和方向后,后续则是将目标拆解为实际过程。&/p&&p&————&br&&/p&&p&&b&观察数据&/b&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-bc82d9bbc3aabfc591b9e_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&2218& data-rawheight=&628& class=&origin_image zh-lightbox-thumb& width=&2218& data-original=&https://pic2.zhimg.com/v2-bc82d9bbc3aabfc591b9e_r.jpg&&&/figure&&p&拿出数据别急切计算,先观察数据。&/p&&p&字段名称都是英文,我是通过Json获取的数据,所以整体数据都较为规整。往后绝大部分的数据源的字段名都是英文。因为比起拼音和汉字,它更适合编程环境下。&/p&&p&先看一下columns的含义。&/p&&p&&br&&/p&&blockquote&city:城市&br&&br& companyFullName:公司全名&br&companyId:公司ID&br&&br& companyLabelList:公司介绍标签&br&&br& companyShortName:公司简称&br&&br& companySize:公司大小&br&&br& businessZones:公司所在商区&br&&br& firstType:职位所属一级类目&br&&br&secondType:职业所属二级类目&br&&br& education:教育要求&br&&br& industryField:公司所属领域&br&&br&positionId:职位ID&br&&br& positionAdvantage:职位福利&br&&br& positionName:职位名称&br&&br&positionLables:职位标签&br&&br& salary:薪水&br&&br& workYear:工作年限要求&/blockquote&&p&数据基本涵盖了职位分析的所需。职位中的职位描述没有抓下来,一来纯文本不适合这次初级分析,二来文本需要分词以及文本挖掘,后续有机会再讲。&/p&&p&首先看一下哪些字段数据可以去除。companyId和positionId是数据的唯一标示,类似该职位的身份证号,这次分析用不到关联vlookup,我们先隐藏。companyFullName和companyShortName则重复了,只需要留一个公司名称,companyFullName依旧隐藏。&/p&&p&&br&&/p&&p&尽量不删除数据,而是隐藏,保证原始数据的完整,谁知道以后会不会用到呢?&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-76e7b9abdcfc_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1828& data-rawheight=&756& class=&origin_image zh-lightbox-thumb& width=&1828& data-original=&https://pic1.zhimg.com/v2-76e7b9abdcfc_r.jpg&&&/figure&&p&接下来进行数据清洗和转换。因为只是Excel级别的数据分析,不会有哑变量离散化标准化的操作。我简单归纳一下。&br&&/p&&p&&b&数据有无缺失值&/b& &/p&&p&数据的缺失值很大程度上影响分析结果。引起缺失的原因很多,例如技术原因,爬虫没有完全抓去,例如本身的缺失,该岗位的HR没有填写。&/p&&p&&br&&/p&&p&如果某一字段缺失数据较多(超过50%),分析过程中要考虑是否删除该字段,因为缺失过多就没有业务意义了。&/p&&p&Excel中可以通过选取该列,在屏幕的右下角查看计数,以此判别有无缺失。&/p&&p&companyLabelList、businessZones、positionLables都有缺失,但不多。不影响实际分析。&br&&/p&&p&&b&数据是否一致化&/b&&/p&&p&一致化指的是数据是否有统一的标准或命名。例如上海市数据分析有限公司和上海数据分析有限公司,差别就在一个市字,主观上肯定会认为是同一家公司,但是对机器和程序依旧会把它们认成两家。会影响计数、数据透视的结果。&/p&&p&我们看一下表格中的positionName&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-2feddc5e026b438b177fe585_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&730& data-rawheight=&868& class=&origin_image zh-lightbox-thumb& width=&730& data-original=&https://pic2.zhimg.com/v2-2feddc5e026b438b177fe585_r.jpg&&&/figure&&p&各类职位千奇百怪啊,什么品牌保护分析师实习生、足球分析师、商业数据分析、大数据业务分析师、数据合同管理助理。并不是纯粹的数据分析岗位。&/p&&p&为什么呢?这是招聘网站的原因,有些职位明确为数据分析师,有些职位要求具备数据分析能力,但是又干其他活。招聘网站为了照顾这种需求,采用关联法,只要和数据分析相关职位,都会在数据分析师的搜索结果中出现。我的爬虫没有过滤其他数据,这就需要手动清洗。&/p&&p&这会不会影响我们的分析?当然会。像

我要回帖

更多关于 NBA一年500万是什么等级 的文章

 

随机推荐