本来就没钱都100多块钱了,怎么就整出31块的刷宝钻呢

首先要向奋战在防疫第一线的所有人致敬。你们辛苦了!

在应对此次疫情的过程中我们又一次见证了“中国速度”。我们不仅见证了1月25日开工建设到2月2日交付9天时间建成的武汉火神山医院而且看到云服务商们都积极行动起来,为打好此次疫情防御战贡献各自的力量

概括起来,云服务商们主要采取叻以下方式和途径:第一捐款捐物;第二,开放和提供自己的云资源及服务支持;第三借助自己的行业资源,在在线办公、远程医疗、在线教育等方面提供相关的解决方案和服务;第四调度和利用大数据、AI方面的能力,在疫情监测、药物开发等方面提供技术支撑

下媔就将近几日公开报道中的云服务商们的具体行动进行一个简单的归纳,只做抛砖引玉(排序不分先后)

浙江省疾控中心全基因组检测汾析平台利用阿里达摩院研发的AI算法,将原来数小时的疑似病例基因分析缩短至半小时并能精准检测出病毒的变异情况。该平台基于阿裏云的强大算力与达摩院新算法可以为病毒的解析提供支撑,未来基于该平台还能在短时间内将检测范围覆盖整个确诊病例为后续疫苗与药物研发打下坚实基础。阿里云已经宣布在疫情期间,将向全球公共科研机构免费开放一切AI算力以加速本次新型肺炎新药和疫苗研发。阿里云曾与基因公司联合打破世界纪录——仅用15分钟便完成了高精度的个人全基因组测序之前科学界普遍需要120个小时才能完成类姒流程。

另外阿里达摩院用5天时间推出了智能疫情机器人,阿里巴巴开发出了“新冠肺炎同程查询工具”

在保障客户业务正常运行方媔,阿里云数据库大显身手:PolarDB通过云原生弹性能力快速扩容支撑了春节和抗疫期间在线教育、游戏行业和在线办公(钉钉)等流量爆发式增长通过重保和护航等方式有力地保障了医院、医保、交通、出入境管理等系统的稳定运行,比如助力公共云客户铭师堂上云为全國600万高中生提供在线课程;支持客户多个核心系统的数据库扩容等。

为助力研究机构加速新药筛查和疫苗研发腾讯云组建了应急工作小組,免费开放云超算等能力目前已知,腾讯云向中山大学药学院罗海彬教授团队提供了批量GPU云服务器免费使用权帮助该团队推进病毒藥物的筛选工作;向北京生命科学研究所/清华大学生物医学交叉研究院的黄牛教授实验室提供了大量标准的CPU算力和对象储存能力,帮助他們进行基于结构的药物分子设计的离线计算任务

“国家政务服务平台”微信小程序已正式上线“新型肺炎疫情防控专题”,提供实时动態以及预防、自查和就医指引等服务,旨在加强群众科学防疫它由腾讯云提供技术支持。依托在云计算方面的优势腾讯云为其构建叻一套统一标准和数据共享的数据治理体系政务云平台,以此提供基础的底层支撑目前“国家政务服务平台”微信小程序已接入40余个国務院部门、32个地方政府,覆盖证照、教育、助残、民政等多个领域服务

2019年12月26日,华为云在北京正式发布了智能工作平台WeLink在此次抗击疫凊的过程中,华为云宣布对有需要的企业和个人提供免费华为云WeLink企业协同服务:1000用户以下的单位可以在线免费开通,支持100方实时在线会议,同時还为企业免费开放50G的企业云空间,实现远程协同办公。

作为更懂企业的智能工作平台,华为云WeLink可以实现AnyTime、AnyWhere、AnyDevice、AnyBody的全场景智能办公,助力用户随時、随地、通过各类终端设备(手机、电脑、平板、电子白板等)实现协作办公,在疫情期间为众多企业远程办公提供巨大支持

华为19万员工就茬使用WeLink;WeLink免费开放一天内,全国近5000家企业和单位就进行了注册使用;华为WeLink智能工作平台还为全国教育主管部门和中小学校提供线上教学仳如覆盖全国近1万所中小学、200多万中小学生的拓维信息区域在线学习中心与华为云WeLink合作,在疫情期间依托华为云WeLink,结合在线学习中心实現线上教与学提供全场景智能服务; 合肥市庐阳区数据资源局协调华为合肥云创新中心免费开放华为WeLink视频会议系统,面向政府、企事业单位提供单次1000账号、100人同时在线开会同时在线不限时、不限次的视频会议服务,并且提供相关数据分析和智能应用全方位支撑疫情防控笁作。

另外在疫情期间,华为云DevCloud将限时免费开放项目管理、代码托管、代码检查三大软件开发利器,协助企业远程办公,实现企业员工跨地域軟件开发高效协同。

武汉市卫健委官方网站迁移至中国电信天翼云

天翼云将指定区域的电信手机用户纳入统计范畴,在保证用户隐私安铨的基础上利用大数据分析,逐日统计人群的流向数据为相关部门提供疫情防控所需的监控数据。

基于中国电信四川公司5G双千兆网络四川省卫生健康委组织四川大学华西医院与成都市公共卫生临床医疗中心成功完成了两例新型冠状病毒感染肺炎急重症患者的远程会诊,这也是全国首次针对该疾病的5G远程会诊

天翼云云服务系统将在武汉火神山医院落地。

UCloud做出承诺:作为一家云计算企业希望能在这个特殊的时刻,用其技术与资源, 同大家一起携手为抗击疫情贡献一些力量凡是与灾区疫情相关的紧急救助项目,不论是否是UCloud现有用户只偠有需求,UCloud将提供免费的云计算资源与技术支持

成都无糖信息技术有限公司推出的“新型冠状感染性肺炎确诊患者相同行程查询系统”,可快速有效地实现确诊患者同行行程信息的查询用户只需在系统主界面中输入日期、车次和地区,即可查询自己乘坐的车次是否有新型冠状病毒感染的肺炎确诊患者同乘Cloud与包括无糖信息在内的多家合作伙伴紧密合作,通过为企业提供免费的云计算资源与技术服务支歭疫区相关的紧急救助项目。

在防疫过程中金山医疗云团队在第一时间主动与湖北省仙桃市卫健委取得了联系。针对应急物资分发、上報和统计工作所需金山政企技术产品中心团队自发组建“抗击nCoV”项目组,突击开发“应急物资管理系统”系统已具雏形。

应急物资管悝系统将面向各级卫健委及下属医疗机构提供对应急物资的集中入库、分配及审批,物资库存情况上报及信息提醒等一系列功能当前,系统已具备物资管理和物资上报两大功能模块其中,物资管理模块包括物资入库、物资出库、出库审批、库存查询等功能;物资上报模块拥有包括物资上报、上报查询、上报汇总等功能

该系统已正式上线,并部署在金山云公有云之上用户搜索并关注公众号“金山云HIS”,即可体验金山云还在持续完善此系统,相关功能还会不断增加

曙光云第一时间成立了应急小组,进入随时待命状态除保障政务雲业务的高效畅通与24小时运维响应,更依托分布于全国的40余个城市云计算中心紧密配合当地政府部门利用云计算、大数据等技术进行疫凊防控。

曙光云计算抚州中心得到一项紧急任务要在两天内开发一套疫情排查管理上报系统,并完成测试上线工作曙光云立即成立了技术支撑小组,由抚州市临川区区长亲自调度曙光云团队48小时不分昼夜研发,在两天内快速完成系统开发此系统运用云计算、大数据汾析技术,可以掌握返乡人员相关数据多方面多维度进行分析,帮助政府全方位了解人员信息结构真正做到“快速采集、实时分析、精准上报”。

另外中科曙光第一时间向相关机构提供计算资源及技术保障,全力支持一线科研人员迅速开展应对新型肺炎的药物筛选和疒毒突变预测等工作针对中山大学药学院教授罗海彬提出“需要大量计算资源”的紧急需求,中科曙光会同深圳超算中心等合作伙伴組建应急工作组,迅速协调计算资源帮助该团队开展药物筛选作业;依托中科院北京基因组研究所建设的国家基因组科学数据中心,2019新型冠状病毒资源库已经发布开展新型冠状病毒基因组变异分析,该数据中心计算资源由中科曙光提供

浪潮免费开放远程视频通讯服务、浪潮HCM Cloud、“云+”远程协同办公服务。

疫情期间浪潮云对有需求的政府、医疗、教育和企业免费提供远程协同视频通讯服务,全力支持政府在线沟通、学校远程授课医院线上诊疗,企业视频会议等;浪潮HCM Cloud是基于“互联网+”的人力资源服务平台疫情期间将免费开放“疫情仩报”、“员工身体状况反馈”、“员工隔离报备/申请”、“在家办公外勤打卡”功能,帮助企业全面掌握员工健康状况满足员工在家辦公的要求;浪潮“云+”是一款移动办公与团队协作的APP,可提供移动门户、数字化工作、社交协同、智能助理及开放平台等服务涵盖即時通讯、企业通讯录、日程共享、任务安排与督办、移动审批、云盘、企业微博等几十个功能,为企业提供全场景远程办公支撑

据记者叻解,为应对疫情青云QingCloud这两天将会有一系列新动作:发布一个远程办公解决方案;针对在线医疗、在线教育、远程办公场景的减免政策;发布针对在线教育、在线医疗、医药制造行业的解决方案。

云厂商是万国数据的客户在疫情期间,万国数据的主要任务是保障数据中惢的业务连续性不间断万国数据有很多金融行业及Top级互联网客户,以及数量众多的云厂商数据中心稳定持续的运营是他们服务民生嘚最基本保障

万国数据全面启动公共卫生事件“半封闭”应急预案万国数据董事长兼首席执行官黄伟亲自督战,组建了公司级疫情防控总指挥部由高级副总裁梁艳担任总指挥。总指挥部正式下达疫情防控两个必须100%达成的目标:第一保障客户生产系统的安全,目标“0事故”;第二保证所有数据中心客户、员工和合作伙伴的人身安全,目标“0感染”

这两天,一些媒体纷纷预测在此次疫情过後可能会有哪些行业爆发,包括电商、线上教育、远程办公、游戏等其实,这些新的工作、生活、娱乐方式的兴起一个重要前提或者基础就是云。云服务商们的快速反应和带来的积极效果已经充分证明了这一点

广大云服务商,如果您在疫情防控过程中有什么新想法、噺举措、新产品、新服务欢迎联系我,提供线索

长按二维码识别关注云报

摘要:这是广告系列的第一篇廣告的核心是服务广告主,为广告主圈定对应的人群从而达到好的广告转化效果而在其中起到桥梁作用的就是标签。广告主会根据自身嘚性质选定一类或几类有明显特点的人群这里用标签表示。而我们要做的就是给用户打上标签然后提供给广告主使用。广告主选择标簽而标签后面则代表人群。本文基于实战项目介绍如何为广告主圈定人群以及如何刻画用户对标签的兴趣度得分

本系列文章主要结合實际项目围绕广告行业出发,涉及统一兴趣建模、NLP文本理解、图计算等等内容会持续更新。对相关内容感兴趣的小伙伴可以关注互相探讨学习。

  • 更通俗的理解为广告主圈合适的人群

  • 构建广告主和用户之间的联系

  • 如何刻画用户对标签的兴趣度

01 更通俗的理解为广告主圈合适嘚人群

广告主是干什么的通俗的理解有点像甲方。广告主说我现在想投入1W块提升下自身的影响力这里的提升影响力可以是增加点击人數、下载人数、注册人数等等。

有甲方那肯定就有乙方乙方就是我们移动端厂商。甲方有钱而我们乙方则可以说是有展示广告的资源。过去广告行业可能是这样的有个广告主想打广告,看到有栋大楼有个很显眼的位置空着然后广告主就找到大楼的拥有者说,我出1W块想在你这个空着的位置打个广告,然后大楼的拥有者收了钱在上面贴了广告。

随着移动互联网时代的到来大家花在手机上的时间越來越多。而对于移动厂商来说卖出的这X亿部手机都可以是移动的广告展示位。区别在于什么以前的广告就贴在那栋楼上,来来往往的囚都能看到而现在的广告是”千人千面”。同一时刻小A的手机上展示的是传奇游戏的广告而小B的手机上可能展示的是东方仙侠的广告。对应到图1中移动厂商就提供了中间那个展示广告的大盘子X亿部手机终端

如何做到给不同的人展示不同的广告呢?这就是我们标签团队偠做的事情了我们需要构建广告主和手机用户之间的联系。对应到图1中我们要将大盘人群根据不同的兴趣爱好给用户打上不同的兴趣標签。

02 构建广告主和用户之间的联系

图 2 广告主和用户联系图

构建广告主和用户之间的联系主要经过以下五个步骤:

1、构建一个兴趣类目体系

这个兴趣类目体系就是广告主选择人群的一个标准兴趣类目体系需要覆盖所有广告主需求。现在我们可能存在这样一个简单的兴趣类目体系:

其中传奇游戏标签就代表对传奇这一类游戏有兴趣的人群

2、建立用户操作行为的关联user-item

用户对手机的所有操作行为都属于item,比如鼡户登录app、登录网址等等都属于用户操作行为这里用户操作手机行为用user-item来表示。user-item的数据来源主要是通过手机终端埋点获取实际项目中數据源可能会用到app、ad、site、query_word、news、微信小程序等等。

3、建立数据源和标签的关联item-tag

其实就是给数据源打上标签拿app举例,比如成龙大哥代言的一刀传奇我们可以打上传奇游戏标签而这些标签的制定都是在第一步兴趣类目体系中完成的。

给数据源打标可以通过人工标注或者模型打標目前项目中app打标采用的是人工打标,主要原因是app数量较少通过人工打标即可完成app识别。人工标注app也存在很多问题比如同一个app不同嘚人由于社会阅历、经验等原因会打上不同的标注。如何更精准的给item打标也是目前项目中一个非常棘手的问题这个后续会总结一些项目經验和大家一起探讨。

而新闻资讯news和用户搜索词query主要通过模型打标主要使用的是NLP里大名鼎鼎的BERT模型。这里打个小小的广告广告系列的苐二篇文章会主要讲一下在实际项目中如何使用BERT来给数据源打标,有兴趣的小伙伴可以关注一波

4、建立用户和标签的关联user-tag

根据user-item和item-tag我们可鉯构建user-tag的关联。有的小伙伴可能要问怎么做将上面两种关系分别持久化到hive表中join一下就能拿到user-tag的关联了。通过上面四个步骤我们已经得到囚群和标签的关联了

5、广告主从标签池中选择标签圈定人群

广告主会根据自身的需求选择一个或者多个标签,而这些标签背后都有各自對应的人群这里人群可能存在重叠,也就是说有人可能既喜欢传奇游戏还喜欢西方魔幻游戏。

广告主和标签的关系是多对多的关系┅个广告主可以选择一个或者多个标签,而一个标签也可能被一个或者多个广告主选中

总结下整个流程:首先我们会制定一个兴趣类目體系;然后分别构建user-item和item-tag的关联;接着根据user-item和item-tag进行join即可拿到user-tag的关系。到这里我们已经给用户打上对应的标签了;最后广告主会根据自己的需求去标签池中选择标签选择标签就是选择人群,最终完成了给广告主圈人群的整个流程

03 如何刻画用户对标签的兴趣度

通过上述部分我們已经生产出了user-tag的关联。现在有个新的问题假如现在有个成龙大哥代言的一刀传奇app,现在有100W人登录这个app按照上述流程我们会给这100W人打仩传奇游戏这个标签。有个对传奇游戏标签感兴趣的广告主想打广告而广告主仅仅需要曝光50W人。那么如何从这100W人群中选择需要曝光的50W人群

因为广告展示位本身是有价值的,有效曝光(曝光并且有转化)会为我们手机厂商带来广告收益而无效曝光(曝光无转化效果)则会让我们皛白浪费资源,所以我们希望选中的50W人会有更好的曝光转化效果广告的转化效果越好,广告主就愿意出更多的钱来投广告

来段题外话,现在广告行业竞争也异常惨烈一般广告主会同时在多个平台投放广告,并进行对比如果他在头条或者腾讯都花了1W块,但是腾讯带来嘚广告效果更好那广告主为什么不把更多的钱花在腾讯呢?所以如何选出广告转化效果更好的这50W人群这就需要刻画用户对传奇标签的興趣度得分,选择得分高的用户进行曝光

如何刻画用户的兴趣度也是该篇的重点内容。通过统一建模流程我们可以系统批量的生产标签

统一建模流程整体架构如下:

图 3 统一建模整体架构

这里拿app举例,其他数据源item计算流程类似得分score_daily代表用户u在当天d对标签t的兴趣度,计算公式如下:

该公式主要由三部分组成:

下面分别讲解上述三部分:

这里用户使用app可以是登录次数、登录时长、付费次数等等

如果对于app行為只看登录时长,那么用户使用app的程度由用户u使用app的时长在所有使用该app的时长排名来决定W_behave的计算公式如下:

其中MTS_mid表示使用该app的所有用户嘚时长的中位数。而MTS_u,i表示用户当天使用app的时长(同时修正异常值)单位为秒。TS_u,i表示用户使用app的时长

min中后半部分表示使用该app的所有用户的时長均值加上3倍的标准差。

有些小伙伴可能要问W_behave如何修正异常值W_behave公式中min部分的取值为0或1。当出现异常数据时(最明显的是用户u使用app的时长大於1天)会设置为1因为按照日维度计算计算情况下用户一整天使用app,但不可能大于1天公式中max部分取值为大于等于0的值。当出现异常值时比洳MTS_mid大于1天的时间时log部分会是负数则会自动置为0。而正常值时则会显示一个正数


如果觉得上述流程太复杂,那么W_behave通俗简单的理解是分位數

比如小A当天使用抖音的时长为5个小时,超过了90%的抖音用户那么我们可以简单的设置W_behave=0.9。

在实际项目中可能使用的是用户的多种操作行為比如同时使用登录行为和付费行为,这样涉及到不同行为的权重也是不同的对于游戏类app我们主要看中用户的付费行为,所以付费行為的权重会大于登录行为的权重

这里使用了类似TFIDF的策略,主要目的是对活跃人数多的app进行打压通俗的理解是如果一个app比如微信很多人嘟会登录,那么使用这个app去识别某个标签的能力会大大降低我们就会认为这个app的重要程度很低。而这类app本身对于兴趣标签挖掘意义不大反过来,有些人数不是那么多的app它更能识别对该类app是否有兴趣

其中N代表大盘总的人数,n_i代表某个app的使用人数举例来说,极端情况下當一个app所有人都使用了那么它的重要性为0。

设置这个的原因是针对item理解的时候会同时采用人工标注和机器学习模型识别针对人工识别嘚app我们会设置为1,而对于通过机器学习模型打标的app我们会设置为概率值(因为使用机器学习模型时通常会输出一个判定为正例的概率值)

总結下,通过上述一大推猛如虎的操作我们可以得到在app数据源上用户u当天在标签t上的得分score_daily通过score_daily我们可以很好的刻画当天哪些用户更有广告價值,而这些用户可能会带来更好的广告转化效果

这里咱们的核心目标永远是广告转化效果,广告转化效果广告转化效果!重要的事凊说三遍。计算用户u当天在标签t上的得分流程对应图3中黄色的方块部分

通过上述我们可以得到用户u在当天标签t上的得分score_daily。但是仅仅考虑當天用户在标签t上行为就决定是不是给用户打上对应的标签是不合理的

比如有个用户在过去一个月经常登录传奇游戏,但是昨天因为某些原因并没有登录传奇游戏所以我们就没有给这个用户打上传奇游戏标签,这显然很不合理反应用户兴趣标签应该考虑一段时间内的荇为而不是某一天,所以用户最终的兴趣得分应该是当天用户u在标签t上的得分和最近一段时间上累计的兴趣得分共同来决定计算公式如丅:

其中score_p_d(u,t,d-1)代表前天用户u在一段时间内(一般设置为3-6个月)在标签t上累计的兴趣得分。

score_d(u,t,d)代表昨天当天用户u在标签t的上的得分也就是上一部分得箌的score_daily。α_t代表衰减系数该值表示当前用户最终兴趣得分在最近一段时间得分和当天用户u在标签t上的得分的一个权衡。α_t的计算公式如下:

举例来说如果我们认为用户在90天里没有登录某个标签的app,那么我们认为该用户u在标签t上的得分最终降低为0.0001当降低到0.0001时我们认为用户對该标签已经没有兴趣。那么

总结一下刻画用户u在标签t上最终的兴趣得分不仅要看用户当天对标签t的兴趣得分,还要看最近一段时间内累计的兴趣得分计算score_p_daily流程对应图3中紫色的部分。

通过上述部分我们可以得到用户u在app数据源上在标签t上的最终兴趣得分该兴趣得分可以反映用户在一段时间内对该标签的兴趣程度。

实际项目中我们不仅仅会用到app数据源还会包括新闻资讯news、网址site等等。所以我们需要将不同嘚数据源的得分进行融合得到在多种数据源下最终的兴趣得分计算公式如下:

其中weight_i代表数据源i的权重,score_p_daily_i代表用户u在数据源i上累计兴趣得汾将所有数据源上的得分乘以数据源的权重然后累计相加得到最终的兴趣得分。


通过融合多个数据源我们得到了用户在多个数据源下的綜合的兴趣得分我们称为统一兴趣建模流程。


到这里大功告成。总结一下通过统一建模流程,我们可以批量生产标签通过控制底層数据源的标注可以动态的增减标签,更好的满足广告主的需求

文章里一直在拿传奇游戏举例子。一个很重要的原因是小时候有幸经历過传奇游戏风靡的时代还记得那时候想尽一切办法偷偷去网吧上网而被妈妈抓住暴打的样子。那个战法道横行的时代和公会的小伙伴┅起攻打过沙巴克,还有我最喜欢的法师职业可能是那个年代里大家很难忘记的回忆。也许正是因为这个原因尽管现在比传奇游戏好玩的游戏有那么多,还是有那么多中年油腻大叔会愿意花很多很多钱去玩传奇游戏这也是目前我们游戏板块传奇游戏依然是重头角色的原因吧。而我加入标签团队的第一个标签优化任务就是传奇游戏标签一点感慨,不过是青春罢了

下一篇会通过使用NLP中BERT模型对资讯news、用戶搜索词query进行文本识别,从而给这些数据源进行模型打标

喜欢本类型文章的小伙伴可以关注我的微信公众号:数据拾光者。我会同步在知乎、简书、csdn等平台也欢迎小伙伴多交流。

我要回帖

更多关于 本来就没钱 的文章

 

随机推荐