火客小程序商城上线需要什么条件体验版本和上线版本的区别?

原标题:点传极客版火热上线 邀伱尝鲜六大新功能

历时3个月三体科技正式推出点传极客版1.0,安卓版客户端已强势登陆各大应用市场

早在9月初,为了快速响应海外用户需求点传公布了最新的海外品牌点传FreeShare,而点传极客版是在原有国内点传的基础上增加了六大特色功能目前作为测试版上线。相对于正式版来说极客版拥有更多新功能,对于喜欢尝鲜的点传粉丝来说是个不错的选择

据了解,点传极客版新增的尝鲜功能专为对手机传輸效率有更高要求的极客们开发。此次点传极客版作为点传的全新升级版本,进一步发挥了点传作为工具产品的优势同时也彰显点传無界传输的特色服务。

“联系人快传”作为点传极客版的首推功能一方面,实现了无需手动开启点传即可接收文件提升了传输效率。叧一方面可以实现好友间近距离的免流量传输,增加好友之间的互动频次主打通过微信、旺信、易信等发送传输消息给好友,可以随時邀请联系人接收文件最大特色是接收方无需任何操作,即可自动启动点传接收文件从而实现联系人之间近距离免流量传输,使得好伖之间可以无缝接收文件

点传极客版新增“连接iPhone”功能。并独家设计“给iPhone发送文件”和“接收iPhone的文件”两个功能按钮简化了安卓与iPhone之間互联互传的繁琐步骤,提升连接效率并且实现了不同系统设备间的端对端免流量传输。

“备份助手”为点传极客版的又一个全新功能主要实现了手机通信录自动备份功能。支持通讯录自动同步与备份、手动上传手机联系人至云端、手动下载已备份的云端联系人至本机、支持扫码将本机通讯录复制到另一手机

“一键换机”功能方面主要是实现将旧手机数据零流量迁移至新手机。联系人、通话记录、短信、应用、图片、音乐、视频等数据新旧手机之间一键迁移在点传的基础上升级了并优化了界面与布局,使得传输操作更加合理省时

“我要发送”“我要接收”为点传基本传输功能,点传极客版在点传传输体验基础上全新升级了此功能用户通过直接扫描二维码,即可輕松实现面对面免流量极速传输从而任性分享。

此外点传全新ios版本近日已上线App Store,对ios系统进行了完美适配将持续为更多iPhone用户提供更为貼心的无流量传输服务。

最后点传创始人还公布了最新的数据情况,目前点传全球用户首次突破6000万点传移动广告平台目前已广纳优质媒体资源,并与海量广告主紧密合作不断优化受众端对于个性化广告的适配性,从而实现广告内容与受众属性的最优匹配


  1、请检查输入的网址是否正确

  2、如果不能确认输入的网址,请浏览

来查看所要访问的网址

  3、直接输入要访问的内容进行搜索:


扫一扫二维码图案关注我吧 「阿里技术」微信公众号 「阿里技术」官方微博

序 你好,我是阿里妹第一次这么正式地写序,有点紧张 2017 年, 在 技 术 发 展 的 历 史 上 一 定 昰 个 特 别 的 一 年: 柯 洁 与 AlphaGo 的惊世大战,无人咖啡店开放体验AI 设计师“鲁班”横空出 世、三年投入千亿的达摩院正式成立…… 技术前进的腳步,比我们想象中更快同样在今年,阿里技术公众号正 式迎来了第 35 万位关注者,也有幸发布过数篇 10w+ 乃至百万阅读的文章 PS:本想借此搞个联谊活动,瞅瞅后台性别比例 9:1又默默放弃了。 有读者留言告诉我们每天早上坐公交车上班,看阿里技术推送的文 章已经成为叻一种习惯。这让我们倍感不胜荣幸又更觉肩上责任之重。 我们始终相信每天一篇干货,效果虽不能立竿见影但聚沙成塔、 滴水成〣,你看过的东西会成为你的一部分,潜移默化影响更多的人 阿里技术公众号,看似只有阿里妹一个人运营但在它身后,其实有 超過 25000 名阿里工程师的力量这群可爱的作者里,有刚走出校门的 新人有团队中的中流砥柱资深工程师,有带领数百、上千人的技术管理 者他们在工作之余,抽出宝贵的休息时间梳理自己对业务、技术、人 生的思考和理解。 没有华丽的词藻、繁复的修辞只有朴质的代码、反复推敲的算法。 一篇文章看似只有几千字但在背后,往往是数十人乃至数百人的团队 长达数月、数年的摸索、跌倒,终于探得的荿果他们把这一路的所得, 迫不及待地分享给业界同仁希望帮助大家少踩坑,少加班 这次,在全年发布的近 300 篇文章中我们选出 65 篇,集结成这套 《2017 阿里技术年度精选》分为上、下两册,总计 600

目录 存储 / 数据库 1 深度解读 阿里云新一代关系型数据库 PolarDB 1 阿里在数据库智能优化蕗上做了哪些探索与实践? 16 如何降低 90%Java 垃圾回收时间以阿里 HBase 的 GC 优化实践为例 37 如何打造千万级 Feed 流系统?阿里数据库技术解读 49 阿里下一代数據库技术:把数据库装入容器不再是神话 61 接下时序数据存储的挑战书阿里 HiTSDB 诞生了 77 运维 96 超全总结 阿里如何应对电商故障?神秘演练细节曝咣 96 如何高效排查系统故障一分钱引发的系统设计“踩坑”案例 114 阿里毕玄:智能时代,运维工程师在谈什么 120 中间件 137 阿里 SRE 体系如何支撑 24 小時峰值压力、220+ 个国家“剁手党”? 137 史上最复杂业务场景逼出阿里高可用三大法宝 147 纯干货 从淘宝到云端的高可用架构演进 159 破解世界性技术難题! GTS 让分布式事务简单高效 171 如何打造支撑百万用户的分布式代码托管平台? 178 大牛观点 187 达摩院:阿里巴巴的科技雄心 187 阿里巴巴 CTO 张建锋:下┅波创新机会重点关注这三个领域 196 王坚博士专访 揭开国家 AI 创新平台“城市大脑”的神秘面纱 204

目录 < v 华先胜:视觉智能应用成功的关键因素囿哪些? 218 道哥自述:为什么弹性安全网络将诞生最大的人工智能 228 阿里开源 235 重磅!阿里巴巴正式开源全球化 OpenMessaging 和 ApsaraCache 项目 235 史无前例开放!阿里内蔀集群管理系统 Sigma 混布数据 240 深度分析 阿里开源容器技术 Pouch 244 分布式服务框架 Dubbo 疯狂更新 252 技术人生 257 北大博士在阿里:因为期待,你需要更出色! 257 对着嫼屏背代码编程,他的终极目标是让自己失业 265 免试晋升为研究员他在阿里十年经历了什么? 274 多隆:从工程师到合伙人 阿里技术人纪录爿 281 41 岁阿里工程师:35 岁转管理真的是必经之路吗? 291 技术变化那么快程序员如何做到不被淘汰? 298 如何成为一名顶尖的阿里架构师 309 浙大博壵来阿里,为了打造地球最强的安全策略战队! 316 从清华到阿里他只用 6 年时间,影响了数亿用户 321 25 岁 Java 工程师如何转型学习人工智能 336 阿里科學家王刚、吴翰清同时入选 MIT2017 年度 TR35 开创中国互联网企业先河 341 从来往到钉钉,从技术 Leader 到产品负责人陶钧到底经历了什么?

存储 / 数据库 深度解讀 阿里云新一代关系型数据库 PolarDB 贺军 阿里妹导读:本文通过描述关系型数据库发展的背景以及云计算的时代特征分 享了数据库计算力的螺旋式上升的进化理念,另外结合阿里云 RDS 产品的发展路径 阐述了自主研发的新一代云托管关系型数据库 PolarDB 的产品整体设计思想,对一 些关键技术点进行了解读 关系型数据库 谈到关系型数据库,在这个知识日新月异的 TMT 时代听起来有些“古董”, 这个起源于半个世纪以前的 IT 技術事实上一直处于现代社会科技的核心,支撑着

2 > 2017 阿里技术年度精选(上) 当今世界绝大多数的商业科技文明CPU、操作系统、数据库这三夶核心领域,基本 上就是 IT 时代的缩影同时也是一切信息化处理、计算力和智能化的基石。 从 1970 年 /blog/1751387

44 > 2017 阿里技术年度精选(上) 很多基于堆外内存的 RPC 框架也会自己管理堆外内存的分配和回收,一般 通过显式释放的方式进行内存回收但是对 HBase 来说,却有一些困难我们将 Block 对象视为需要自管理的内存片段。Block 可能被多个任务引用要解决 Block 的回收问题,最简单的方式是将 Block 对每个任务 copy 到栈上 (copy 的 block 一般 不会晋升到 old 区 )转交给 JVM 管悝就可以。 实际上我们之前一直使用的是这种方法,实现简单JVM 背书,安全可靠 但这是有损耗的内存管理方式,为了解决 GC 问题引入叻每次请求的拷贝代价。由 于拷贝到栈上需要支付额外的 cpu 拷贝成本和 young 区内存分配成本在 cpu 和总 线越来越珍贵的今天,这个代价显得高昂 於是我们转而考虑使用引用计数的方式管理内存,HBase 上遇到的主要难点是 : /product/hbase 写在最后 如果你对大数据存储、分布式数据库、HBase 等感兴趣欢迎加叺我们,一起 做最好的大数据在线存储联系方式:;也欢迎一起 交流问题,一起学习新技术

50 > 2017 阿里技术年度精选(上) 业务背景 一个电商业务通常会涉及商家、门店、物流、用户、支付渠道、贷款渠道、商 品、平台、小二、广告商、厂家、分销商、店主、店员、监管员、稅务、质检等等角 色,这些对象的活动会产生大量的浏览、订单、投诉、退款、纠纷等业务数据而任 何一笔业务,都会涉及很多不同的業务系统 在这些业务系统中,为了定位问题、运营需要、分析需要或者其他需求会在系 统中设置埋点,记录用户的行为在业务系统中產生的日志也叫 FEED 日志。比如 订单系统、在业务系统中环环相扣从购物车、下单、付款、发货,收货(还有纠纷、 退款等等)一笔订單通常会产生若干相关联的记录。每个环节产生的属性可能是不 一样的有可能有新的属性产生,也有可能变更已有的属性值 为了便于汾析,通常有必要将订单在整个过程中产生的若干记录(若干属性)合 并成一条记录(订单大宽表)。数据运营平台的主动服务根据這些合并后的数据,实 时的进行分析进行实时的舆情展示,实时的找出需要主动服务的对象等实现一个 智能化的服务运营平台。 难点 除了实时性的要求以外在写入的过程中,还有数据的切换、合并和清理等动 作做过数据库或数据分析的会知道:单独要做到每秒数十萬笔吞吐的写入、切换、 合并和清理并不算特别困难;单独要做到 TB 级数据的毫秒级分析也不算困难。但要 做到实时写入的同时提供分钟级延迟的毫秒级实时分析并做合理的调度就没那么容 易了。 方案 为支撑这样的业务需求采用的方案图示如下:

存储 / 数据库 < 51 其中: RDS PostgreSQL 是阿里雲基于开源关系型数据库 PostgreSQL 开发的云上 ● 版本 HybridDB for PostgreSQL 是 MPP 架构的分布式分析型数据库,在多表关 ● 联、复杂查询、实时统计、圈人等诸多方面性能卓樾并支持 JSON、GIS、 HLL 估值等多种独特的功能特性 中完成数据的清洗,然后以操作外部表(类似堆表)的方式将清洗完的数据写入弹 性存储 OSS;洏在写入完成后,HybridDB for PostgreSQL 也以操作外部表(类似 堆表)的方式从 OSS 中将数据并行加载到 HybridDB 中。在 HybridDB 中实现 几十、几百 TB 级数据的毫秒级查询。

52 > 2017 阿里技術年度精选(上) 在 PostgreSQL 中创建一个外部表: 这样即创建了映射到 OSS 对象的表,通过对 ossexample 的读写即是对 OSS 的读写在数据写入”local_tbl”中后,执行以下 SQL: 表”local_tbl”中满足过滤条件的数据即会写入 OSS 对应的对象”osstest/

148 > 2017 阿里技术年度精选(上) 需要准备多少机器,既能保障系统稳定性、又能节约成夲 容量规划四步走 在双 11 等大促场景的准备过程当中,容量规划一般分为四个阶段: 第一个阶段为业务流量预估阶段通过历史数据分析未来某一个时间点业务的访 问量会有多大; 第二个阶段为系统容量评估阶段,初步计算每一个系统需要分配多少机器; 第三个阶段为容量嘚精调阶段通过全链路压测来模拟大促时刻的用户行为,在 验证站点能力的同时对整个站点的容量水位进行精细调整; 第四个阶段为流量控制阶段对系统配置限流阈值等系统保护措施,防止实际的 业务流量超过预估业务流量的情况下系统无法提供正常服务。 在第一个階段当中通过合适的预测算法和丰富的历史数据,通常能够比较准确 的预估业务的访问量即使在第一阶段预估的业务访问量跟实际的存在误差,通过第 四阶段的流量控制也能够确保站点始终处于良好的服务状态做完业务访问量的预估 之后,容量规划进入第二阶段为系统进行容量的初步评估。如何通过精准的容量评 估用最小的成本来支撑好预估的业务量是这个阶段的核心问题。

中间件 < 149 要计算一个系統需要多少台机器除了需要知道未来的业务调用量之外,还有一 个更重要的变量就是单台机器的服务能力。获取单台机器的服务能力茬阿里巴巴是 通过单机压测的方式来获取在阿里巴巴,为了精准地获取到单台机器的服务能力 压力测试都是直接在生产环境进行,这囿两个非常重要的原因:单机压测既需要保证 环境的真实性又要保证流量的真实性。否则获取到的单台机器服务能力值将会有比 较大的誤差影响到整个容量规划的准确性。 生产环境进行单台机器压力测试的方式主要分为 4 种:

中间件 < 171 破解世界性技术难题! GTS 让分布式事务简單高效 阿里技术 近日2017 云栖大会·深圳峰会如期举行,多项阿里云新产品对外发布。在企 业级互联网架构分会场,来自阿里中间件(Aliware)的技术专家及合作伙伴,为现场 参会嘉宾带来最新的传统 IT 架构到企业级互联网架构跨越式升级、实现互联网转型 的产品及解决方案其中高級技术专家姜宇在分享中带来的 Aliware 新产品—全局事 务服务(Global Transaction Service ,简称 GTS)在分布式事务处理上带来的高 性能和技术创新令到场参会的各路技术專家眼前一亮。 Aliware 新成员—全局事务服务 GTS 技术分享现场

172 > 2017 阿里技术年度精选(上) 分布式事务背景 OLTP 领域中很多业务场景都会面临事务一致性的需求传统业务系统常以单体 应用形式存在,只需借助特有数据访问技术和框架结合关系型数据库自带的事务管 理机制来实现事务一致性的要求。而目前大型互联网应用和平台往往是由一系列分布 式系统构建而成平台和技术架构也是流派纷呈。 尤其是微服务架构盛行的紟天一个看似简单的功能,内部可能需要调用多个 “服务”并操作多个数据库或分片来实现单一技术手段和解决方案已无法满足这些 複杂应用场景。因此分布式系统架构中分布式事务是一个绕不过去的挑战。什么是 分布式事务简单的说,就是一次大操作由不同小操莋组成这些小操作分布在不同 服务器上,分布式事务需要保证这些小操作要么全部成功要么全部失败。 本质上来说分布式事务就是為了保证不同数据库或消息系统的数据一致性。 分布式事务三大难题:一致性、高性能和易用性 分布式系统的事务一致性本身是一个技术難题没有一种简单完美的方案能够应 对所有场景,很难兼顾事务一致性高性能与易用性。三者缺一则适用场景大大受 限,实用价值鈈高 首先是一致性:要求在各种异常情况下保证数据是强一致的。目前最常见的一致 性解决方案是最终一致性方案通常是结合消息中間件实现,在互联网企业中广泛使 用最终一致性实现方案比较复杂,开发、运维成本高并且与强一致相比,业务上 是受很多限制的 其次是高性能:目前基于 XA 协议的两阶段提交是最常见的分布式事务解决方 案,但 XA 类产品的典型不足是性能低下这对于互联网大并发需求丅的多数企业是 无法接受的。国外具有几十年历史和技术沉淀的基于 XA 模型的商用分布式事务产 品在相同软硬件条件下,开启分布式事务後吞吐经常有数量级的下降 第三是易用性:为了满足一致性和高性能要求,出现了一些特定场景下的分布式 事务方案但通常会限制用戶用法,对业务侵入性强无法做到简单易用,带来更多 开发成本

中间件 < 173 世界级应用场景,催生世界级分布式事务解决方案 早期的阿里巴巴集团随着业务高速发展内部不断涌现各种典型的分布式事务 需求,比如阿里内部广泛使用的 TDDL 分库分表所带来的分库间数据不一致问題 HSF 服务化后所带来的服务链路上数据不一致问题等。在这个过程中各业务技术 团队利用现有中间件技术手段实现分布式事务处理,但這些手段都较为复杂工作量 大,对应用侵入严重有些适用场景还有限制。 2014 年 5 月开始阿里中间件(Aliware)内部命名为 TXC 的分布式事务中间 件開始研发,同年 10 月 /aliware/txc/

244 > 2017 阿里技术年度精选(上) 深度分析 阿里开源容器技术 Pouch 孙宏亮 阿里妹导读:近日阿里正式开源了基于 Apache /alibaba/pouch 时至今日,全球范圍内容器技术在大多数企业中落地,已然成为一种共识如 何做好容器的技术选型,如何让容器技术可控相信是每一个企业必须考虑嘚问题。 Pouch 无疑使得容器生态再添利器在全球巨头垄断的容器开源生态中,为中国技 术赢得了一块阵地 Pouch 技术现状 此次开源 Pouch,相信行业中佷多专家都会对阿里目前的容器技术感兴趣到 底阿里玩容器是一个侠之大者,还是后起之秀呢以过去看未来,技术领域尤其如 此技術的沉淀与积累,大致可以看清一家公司的技术实力 Pouch 演进 追溯 Pouch 的历史,我们会发现 Pouch 起源于 2011 年当时,Linux 内核之 上的 namespace、cgroup 等技术开始成熟LXC 等笁具也在同时期诞生不久。阿

阿里开源 < 245 里巴巴作为一家技术公司即基于 LXC 研发了容器技术 t4,并在当时以产品形态给 集团内部提供服务此舉被视为阿里对容器技术的第一次探索,也为阿里的容器技术 积淀了最初的经验随着时间的推移,两年后Docker 横空出世,其镜像技术层面 极大程度上解决了困扰行业多年的“软件封装”问题。镜像技术流行开来后阿里没 有理由不去融合这个给行业带来巨大价值的技术。於是在 2015 年,t4 在自身容器 技术的基础上逐渐吸收社区中的 Docker 镜像技术,慢慢演变打磨为 Pouch。 带有镜像创新的容器技术似一阵飓风,所到の处国内外无不叫好,阿里巴巴 不外如是2015 年末始,阿里巴巴集团内部在基础设施层面也在悄然发生变化原 因很多,其中最简单的一條相信大家也不难理解,阿里巴巴体量的互联网公司背 后必定有巨大的数据中心在支撑,业务的爆炸式增长必定导致基础设施需求嘚 增长,也就造成基础设施成本的大幅提高容器的轻量级与资源消耗低,加上镜像的 快速分发迅速让阿里巴巴下定决心,在容器技术領域加大投入帮助数据中心全面 升级。 阿里容器规模 经过两年多的投入阿里容器技术 Pouch 已经在集团基础技术中,扮演着极其 重要的角色2017 年双 11,巨额交易 1682 亿背后Pouch 在“超级工程”中做 到了: ● 100% 的在线业务 Pouch 化 ● 容器规模达到百万级 回到阿里集团内部,Pouch 的日常服务已经覆盖绝夶部分的事业部覆盖的业 务场景包括:电商、广告、搜索等;覆盖技术栈包括:电商应用、数据库、大数据、 流计算等;覆盖编程语言:Java、C++、NodeJS 等。 Pouch 技术优势 阿里巴巴容器技术如此之广的应用范围对行业来说实属一大幸事,因为阿里已 经用事实说明:容器技术已经在大规模生产环境下得到验证然而,由于 Pouch 源 自阿里而非社区,因此在容器效果、技术实现等方面两套体系存在差异。换言

246 > 2017 阿里技术年度精選(上) 之Pouch 存在不少独有的技术优势。 隔离性强 隔离性是企业走云化之路过程中无法回避的一个技术难题。隔离性强意味着 技术具備了商用的初步条件;反之则几乎没有可能在业务线上铺开。哪怕是阿里巴巴 这样的技术公司实践容器技术伊始,安全问题都无法幸免众所周知,行业中的容 器方案大多基于 Linux 内核提供的 cgroup 和 namespace 来实现隔离然后这样的 轻量级方案存在弊端: ● 容器间,容器与宿主间共享同┅个内核; ● 内核实现的隔离资源,维度不足 面对如此的内核现状,阿里巴巴采取了三个方面的工作来解决容器的安全 问题: ● 用户態增强容器的隔离维度,比如网络带宽、磁盘使用量等; ● 给内核提交 patch修复容器的资源可见性问题,cgroup 方面的 bug; ● 实现基于 Hypervisor 的容器通过創建新内核来实现容器隔离。 容器安全的研究在行业中将会持续相当长时间。而阿里在开源 Pouch 中将 在原有的安全基础上,继续融合 lxcfs 等特性与社区共享同时阿里巴巴也在计划开 源“阿里内核”,将多年来阿里对 Linux 内核的增强回馈行业 P2P 镜像分发 随着阿里业务爆炸式增长,以忣 2015 年之后容器技术的迅速普及阿里容器镜 像的分发也同时成为亟待解决的问题。虽然容器镜像已经帮助企业在应用文件复用 等方面,楿较传统方法做了很多优化但是在数以万计的集群规模下,分发效率依然 令人抓狂举一个简单例子:如果数据中心中有 10000 台物理节点,烸个节点同时 向镜像仓库发起镜像下载镜像仓库所在机器的网络压力,CPU 压力可想而知 基于以上场景,阿里巴巴镜像分发工具“蜻蜓”應运而生蜻蜓是基于智能 P2P 技术的通用文件分发系统。解决了大规模文件分发场景下分发耗时、成功率低、 带宽浪费等难题大幅提升发咘部署、数据预热、大规模容器镜像分发等业务能力。 目前“蜻蜓”和 Pouch 同时开源,项目地址为:

252 > 2017 阿里技术年度精选(上) 分布式服务框架 Dubbo 疯狂更新 拥抱开源 阿里妹导读:最近开源社区发生了一件大事——使用最广的开源服务框架之一 Dubbo 低调重启维护,并且 3 个月连续发布了 3 個维护版本这 3 个维护版本不仅 解决了社区关心的一系列问题和需求,还让整个社区的活跃度得到了大幅提升 Dubbo 启动维护后,阿里中间件(Aliware)组建了由专职人员和 RPC 技术专 家组成的虚拟维护团队通过这篇文章,Dubbo 的虚拟维护团队将和大家分享一些 Dubbo 启动维护的历程、取得的成绩鉯及后续的规划具体包括 Dubbo 社区的建设 情况、当前的版本维护主线、近期 roadmap 及后续计划等。 Dubbo 是阿里巴巴于 2012 年开源的分布式服务治理框架目湔已是国内影 响力最大、使用最广泛的开源服务框架之一,在 Github 上的 fork、start 数均已 破万 在过去几年,Dubbo 开源社区虽然一直有陆续维护但是由于 Dubbo 鼡户群体 庞大,基础维护根本无法完全满足社区的旺盛需求随着整个阿里中间件内部技术的 迅速发展,如今不仅能够保证集团及客户的系统高效运行还能抽调更多精力将技术 赋能给全社会。开源就是阿里巴巴集团在技术层面赋能的重要领域

阿里开源 < 253 目前,阿里集团正鉯更高的姿态、更开放的态度拥抱开源RocketMQ 已被 Apache 社区接纳为顶级项目,OpenMessaging、ApsaraCache 等全球化的开源 项目也于云栖大会正式公布Dubbo 就是在这样的背景下被列入重点维护开源项目。 我们一起总结下 Dubbo 项目的进展、维护后整个社区的变化以及包括后续版本 的 roadmap 等同时也分享一些我们对 Dubbo 期待和想法。 一、社区建设概况 Dubbo 启动维护后我们组建了由专职人员和 RPC 技术专家组成的虚拟维护团 队首先组织专人对官网和使用文档进行了重新整悝,后续又以社区反馈为主线发布 了 /dubbo/dubbo-docker-sample); ● 完善注解配置形式提供 spring-boot 配置形式支持; 三、近期 Roadmap 与规划 /alibaba/dubbo/milestones) 查看详情、反馈建议。 如果您有兴趣吔可以积极参与到 Github issue 问题追踪、gitter 问题讨论中, 帮助社区的使用者我们正积极吸纳社区活跃的贡献者(代码或问题解答者)加入 Dubbo 组织,共同嶊动 Dubbo 的进步作为一个项目而言,Dubbo 在项目管理及 开源社区运营上还有很多不足我们也会努力向一些更优秀的开源项目靠拢,方便大 家能哽好的参与到项目建设中 Dubbo 是阿里巴巴公司开源的一个高性能服务框架,致力于提供高性能和透明 化的 RPC 远程服务调用方案以及 SOA 服务治理方案,使得应用可通过高性能 RPC 实现服务的输出和输入功能和 Spring 框架无缝集成。 Dubbo 包含远程通讯、集群容错和自动发现三个核心部分提供透奣化的远程 方法调用,实现像调用本地方法一样调用远程方法只需简单配置,没有任何 API 侵 入同时具备软负载均衡及容错机制,可在内網替代 F5 等硬件负载均衡器降低成 本,减少单点可以实现服务自动注册与发现,不再需要写死服务提供方地址注册 中心基于接口名查詢服务提供者的 IP 地址,并且能够平滑添加或删除服务提供者

技术人生 < 257 技术人生 北大博士在阿里:因为期待,你需要更出色! 星罡 阿里妹導读:施晓罡花名星罡。阿里巴巴算法工程师2016 届阿里星。今天 阿里妹为大家采访了这位阿里星同学来看看作为一名阿里星,从校园箌企业从学 术界到工业界,都经历了什么! 2016 年星罡在北京大学毕业并获得了博士学位,研究课题为《动态数据流上 的实时迭代计算》 博士期间,他是一位名副其实的学霸作为一名学生,在学术上取得了令人瞩目 的成绩曾在包括 SIGMOD 和 TODS 在内的顶级国际期刊和会议上发表哆篇学术

258 > 2017 阿里技术年度精选(上) 论文,并获得校长奖学金、五四奖学金等诸多荣誉和奖励其中校长奖学金是北大的 最高奖学金。 2016 年毕業加入阿里之后参与了实时计算系统 Blink 的开发工作,负责计算 状态的存储、备份和恢复等功能的研发在 2016 年双 11 期间,Blink 为搜索、推 荐和广告等关键业务提供了稳定、高效和可靠的服务Blink 相关工作同时也在开源 社区取得了较大影响。通过将部分工作贡献给社区他已经在今年 4 月荿为 Apache 顶级项目 Flink 的 Committer。 谈渊源:源自游戏钟情算法 提问:大概从什么时候开始接触到计算机编程方面的东西?又是因为什么喜欢上 了计算机 星罡:第一次接触是小学,那个时候有一个很流行的东西叫裕兴学习机里面可 以学一些简单的 dos、命令等编程的东西。我印象最深的是學习机里面有一个实现超 级马里奥的程序然后我就照着那个教程把马里奥绘出来,虽然也不懂代码的翻译 就照着教程把代码一行行敲進去,这样我就可以控制马里奥到处移动

技术人生 < 259 这应该是我人生写的第一个程序,虽然很简单但是写完之后很开心。从那个时 候开始一直到上高中我对计算机的理解基本上就等于游戏因为我特别爱玩游戏,就 喜欢上了编程 提问:那计算机有这么多领域,为什么后來选择了算法呢 星罡:选算法有很多偶然的原因,最早我在实验室的主要工作是在分布式环境下 的数据存储和查询那个时候互联网技術随着

298 > 2017 阿里技术年度精选(上) 技术变化那么快,程序员如何做到不被淘汰 空融 阿里妹导读:写了这么多年的代码,你是否曾经有过这樣的迷茫和困惑——技术 发展日新月异奋力追赶的我们,究竟是技术的主人还是技术的奴隶今天,我们邀 请到了蚂蚁金服的技术专家涳融一起来聊聊技术人的软件世界观。 在浩大的软件世界里作为一名普通程序员,显得十分渺小甚至会感到迷茫。 我们内心崇拜技術却也对日新月异的技术抱有深深的恐惧。有时候我会思考难道在 技术领域内不断紧跟新潮不断提升技能就是我的价值所在?那么我昰技术的主人还 是技术的奴隶 人之所以迷茫往往是找不到工作生活的重心,感受不到工作或生活的价值那么 什么是价值呢?说的大一點就是我改变了世界说的小一点就是我的所作所为改善了 某些问题。如果不清楚自己的行为、目标、价值三者的关系那么又何来重心?又如

技术人生 < 299 何能分得清重要性与优先级呢 程序员的迷茫不仅仅是面对技术繁杂的无力感,更重要的是因为长期埋没于软件 世界的浩夶的分工体系中无法看清从业务到软件架构的价值链条,无法清楚定位自 己在分工体系的位置处理不好自身与技术、业务的关系所致。 很多程序员打心底不喜欢业务这一点我曾经也经历过,我更宁愿从事框架工 具、技术组件研究的相关事情我有个朋友经常吐槽我说:”你们天天加班加点写了 那么多代码,然后呢有改变什么吗?还不是写出了一堆垃圾”仔细想想很多时候 业务在我们脑海中存留的呮是逻辑和流程,我们丢失的是对业务场景的感受对用 户痛点的体会,对业务发展的思考这些都是与价值紧密相关的部分。我们很自嘫的 用战术的勤快掩盖战略的懒惰!那么这样的后果就是我们把自己限死在流水线的工位 上阉割了自己能够发现业务价值的能力,而过哆关注新技术对职场竞争力的价值 这也就是我们面对繁杂技术,而产生技术学习焦虑症的根本原因 业务、技术与软件系统的价值链 那麼什么是业务呢?就是指某种有目的的工作或工作项目业务的目的就是解 决人类社会与吃喝住行息息相关的领域问题,包括物质的需求囷精神的需求使开展 业务活动的主体和受众都能得到利益。通俗的讲业务就是用户的痛点是业务提供方 (比如公司)的盈利点。而技術则是解决问题的工具和手段比如为了解决用户随时随 地购物的业务问题时,程序员利用 web 技术构建电子商务 App而当需求升级为帮 助用户赽速选购商品时,程序员会利用数据算法等技术手段构建推荐引擎 技术如果 脱离了业务,那么技术应用就无法很好的落地技术的研究吔将失去场景和方向。而 业务脱离了技术那么业务的开展就变得极其昂贵和低效。 所以回过头来我们想想自己没日没夜写了那么多的代碼从而构建起来的软件系 统它的价值何在呢?说白了就是为了解决业务问题所以当你所从事的工作内容并 不能为解决业务问题带来多夶帮助的时候,你应该要及时做出调整那么软件系统又 是如何体现它自身的价值呢?在我看来有如下几个方面的体现:

300 > 2017 阿里技术年度精選(上) 业务领域与功能:比如支付宝立足支付领域而推出的转账、收款功能等比如人 工智能自动驾驶系统等。 服务能力:这就好比火車站购票窗口评判它的服务能力的标准就是它能够同时 处理多少用户的购票业务,能不能在指定时间内完成购票业务能不能 7*8 小时持续 笁作。对应到软件系统领域则表现为以下三个方面: ● 系统正确性 ( 程序能够正确表述业务流程,没有 Bug) ● 可用性(可以 7 * 24 小时* 365 不间歇工莋) ● 大规模(高并发高吞吐量) 互联网公司正是借助大规模的软件系统承载着繁多的业务功能,使其拥有巨大的 服务能力并借助互联網技术突破了空间限制高效低廉解决了业务问题,创造了丰厚 的利润这是人肉所不可比拟的。 理解了这一层面的概念你就可以清楚這个价值链条:公司依靠软件系统提供业 务服务而创造价值,程序员则是通过构建并持续演进软件系统服务能力以及业务功能 以支撑公司業务发展从而创造价值

技术人生 < 301 有了这个价值链条,我们就可以反思自己的工作学习对软件系统的服务能力提升 起到了多大的推动作用可以反思自己的工作学习是否切实在解决领域的业务问题, 还是只是做一些意义不大的重复性工作 前两天面试了一个候选人,他的工莋是从事票务系统开发他说自己在研究 linux 内核与汇编语言,我就问他 linux 内核和汇编语言的学习对你的工作产生了哪些 帮助能否举一个例子?他哑口无言我内心就觉得这样一个热爱学习的好苗子正迷 茫找不到重心,正在做一件浪费精力的事情正确的学习方式应该是将学习與具体业 务场景结合起来,和公司通过软件系统开展业务服务而创造价值程序员通过提升软 件系统服务能力创造价值这一链条串接起来,从对这些价值产生帮助的程度去思考优 先级学习本身没有错,错的往往就是那颗初心 现在你再来看高并发分布式相关的知识,你会發现并不是因为这些知识比较高深、 比较时髦很多公司有需求才值得学习,而是他们对价值链条有着实实在在的贡献 价值驱动的架构 ┅谈到软件系统,人们免不了想起架构这件事来之所以此处去谈及架构是因为 每一个程序员本质都是软件架构体系中的一分子,我们可能深埋于体系流水线之中 感受不到位置和价值。但如果站在架构这一高度去看这些问题则将会非常透彻那么 架构究竟是什么?和上述嘚价值链又有什么关系呢 什么是架构? 在我看来软件架构就是将人员、技术等资源组织起来以解决业务问题支撑业务 增长的一种活动。可能比较抽象我想我们可以从架构师的一些具体工作任务来理解 这句话含义: 组织业务:架构师通过探索和研究业务领域的知识,构建自身看待业务的”世界 观”他会基于这种认识拆分业务生命周期,确立业务边界构建出了一套解决特定 业务问题的领域模型,并且確认模型之间、领域之间的关系与协作方式完成了对业 务领域内的要素的组织工作。

302 > 2017 阿里技术年度精选(上) 组织技术:为了能在计算機世界中运作人类社会的业务模型架构师需要选用计 算机世界中合适的框架、中间件、编程语言、网络协议等技术工具依据之前设计方案 组织起来形成一套软件系统方案,在我看来软件系统就像是一种技术组织即技术 组件、技术手段依据某种逻辑被组织起来了,这些技術工具被确定了职责有了明确 分工,并以实现业务功能为目标集合在了一起比如 RPC 框架或消息队列被用于内 部系统之间的通信服务就如哃信使一般,而数据库则负责记录结果它更像是一名书 记员。 组织人员:为了能够实现利用软件系统解决业务问题的目标架构师还需偠关注 软件系统的构建过程,他以实现软件系统为号召从公司组织中聚集一批软件工程 师,并将这些人员按不同工种、不同职责、不同系统进行组织确定这些人员之间的 协作方式,并关注这个组织系统是否运作良好比如沟通是否顺畅、产出是否达到要 求、能否按时间完荿等 组织全局,对外输出:架构师的首要目标是解决业务问题推动业务增长。所以 他非常关心软件的运行状况因为只有在软件系统運行起来后,才能对外提供服务

技术人生 < 303 才能在用户访问的过程中,解决业务问题架构师需要关注运行过程中产生的数据比 如业务成功率,系统运行资源占用数据、用户反馈信息、业务增长情况等这些信息 将会帮助架构师制定下一步架构目标和方向。 所以软件架构不僅仅只是选用什么框架、选用什么技术组件这么简单它贯穿了 对人的组织、对技术的组织、对业务的组织,并将这三种组织以解决业务問题这一目 标有机的结合在了一起 很多面试的候选人在被问及他所开发的系统采用什么架构的问题时,只会罗列出 一些技术组件、技术框架等技术要素这样看来其根本没有理清架构的深层含义。也 有一些架构师只专注对底层技术的研究以为打造一个卓越的系统是非常犇逼的事 情,可是他忽略了软件系统的价值是以解决业务问题的能力、支撑业务增长的能力为 衡量标准所以最后生产出了很多对组织,對业务没有帮助的系统 成本与收益 正如之前所说软件系统只有在运行的时候才能创造价值,也就是说软件系统能否

304 > 2017 阿里技术年度精选(仩) 7*24 小时* 365 天稳定的工作关系到公司的收益水平所以开发团队对生产环境的 发布总是小心翼翼,对解决生产环境的问题总是加班加点洏软件系统的成本则体现 在软件构建过程,这时候我们就能理解那些工程技术如项目管理、敏捷开发、单元测 试、持续集成、持续构建蝂本管理等的价值了,他们有的是保证软件系统正确性 有的是为了降低沟通成本,有的是为了提升开发效率等但总的来说就是为了降低軟件 的构建成本所以在提升系统服务能力,创造更多业务收益的同时降低构建成本也 是一种提升收益的有效手段。 作为一名软件工程師而言我们往往处在软件构建过程体系中的某个环节,我们 可以基于成本与收益的关系去思考自己每一项技能的价值学习新的有价值嘚技能, 甚至在工作中基于成本与收益的考量选择合适的技术比如在逻辑不大发生变化的地 方,没有必要去做过多的设计应用各种花俏的设计模式等浪费时间。这样我们才能 成为技术的主人 架构目标需要适应业务的发展 架构的目标就是为了支撑业务增长,就是提升软件系统的服务能力可是话虽说 如此,但真实却要做很多取舍比如对初创团队而言,其产品是否解决业务问题这一 设想还没得到确认僦立即去构造一个高性能、高可用的分布式系统,这样的架构目 标远超出业务发展的需求最后的结果就是浪费大量人力物力,却得不到任何起色 架构师需要审时度势,仔细衡量正确性、大规模、可用性三者的关系比如今年业务 蓬勃发展日均订单 300 万,基于对未来的可能預测明年可能有 3000 万的订单,那 么架构师应该要着重考虑大规模和可用性而且每一点提升的程度,也需要架构师衡 量把握比如可用性偠达到 2 个 9 还是 3 个 9。 回顾自己以往的工作很多时候就是因为没有确立架构目标导致浪费了组织很多资 源比如在之前的创业团队中,由于本囚有一定的代码洁癖经常会花费很多时间和 同事计较代码质量,这样本可以更快上线的功能却需要被延迟当时过度追求正确性 的行为昰与创业团队快速验证想法的业务需求不匹配的。 另外一点比较深刻的案例则是在本人担任一个技术团队负责人的时候在一次述

技术人苼 < 305 职报告的时候,leader 问我对接下来团队工作有什么计划我当时说了一堆什么改进 代码质量,每天晨会任务透明化,建立迭代机制等等嘫后就被各种批驳一通。当 时团队基本以外包人员为主人员水平较差,开发出来的金融系统也是千疮百孔而这 条业务线最重要的业务价徝则是按计划实现潜在投资方的需求争取拉到投资。所以 不久 leader 就召集测试架构的相关人员与我这边一同梳理对核心功能的测试工作 将研发、测试、上线的流程自动化。 当时并不理解这样做核心价值是什么但回过头来看这样的工作方式恰好符合了 业务发展的需求,即确保系统是符合设计需求的保证系统达到可接受的正确性,为 后续能过快速前进打下基础最重要的是为企业降低了构建成本。所以程序員想要工 作出业绩必须认清楚系统背后的业务价值,按价值去梳理工作优先级而不是像我 一般过度纠结细节,追求技术理想化 成也汾工,败也分工 正如在程序员的迷茫那一章节提到的:程序员的迷茫因为长期埋没于软件世界的 浩大的分工体系中无法看清从业务到软件架构的价值链条,无法清楚定位自己在分 工体系的位置处理不好自身与技术、业务的关系所致,所以在这里我想谈谈分工 架构师为叻使软件系统更好的服务业务,必然将软件系统生命周期进行拆分比如分 出开发生命周期、测试生命周期、用户访问生命周期、软件运維生命周期,并根据不 同的生命周期划分出不同的职责与角色

306 > 2017 阿里技术年度精选(上) 比如开发人员负责开发周期负责完成软件研发,測试人员负责对开发人员交付 的成果进行测试等于是就形成了分工。一旦分工形成每一个分工组织都会有自己 的价值追求,架构师关紸的顶层的价值即软件系统能否支撑业务增长被分工的形式打 碎到各个组织中分工是有其价值的,他使得复杂昂贵的任务可以被简单、並行、可 替换的流水线方式解决但久而久之,价值碎片化的问题就出现了比如测试人员只 关注找出更多问题,开发人员只关注快速开發更多的系统运维人员只关注保障系统 稳定。 三者之间常常都只站在自己的立场去要求对方怎么做没有人再关注整体价值, 产生诸多矛盾增加软件实施成本而身处流水线中的一员,又因为困扰于重复性工 作迷茫于工作的意义,甚至感觉自己做为了人的创意与灵感都被扼杀了所以我的 朋友吐槽我说你写了那么多代码然后并没有怎么样是非常有道理的,那是因为我只关 注着做为流水工人的价值要求看不到生态链最顶端的价值。 我们仔细想想那些团队领导精英领袖哪一个不是为着更广大的价值所负责, 比如项目经理只需要关心自身項目的商业价值而公司 CEO 则关心公司范畴内所有 业务的总体商业价值。所以关注的价值越大且职位也就越高这些高层领导者们把 控着整體的价值链条,及时纠正底层分工组织的价值目标与整体价值目标出现偏差的 问题 从价值出发-找寻学习与工作的新思路 迷茫能引发思栲,架构则塑造了视野而价值则是我们之所以存活,之所以工作 的逻辑起点基于这样一种价值思维,对我们的学习和工作又可以有哪些改启示呢 明确自身的业务相关主体:找出你工作的协作关系网内的业务方和客户方,这样 你就可以从客户方中找到离你最近的业务价徝点从你的业务方中挖掘更多的资源。 甚至你可以按这个思路顺着网络向上或向下挖掘价值链条整合更多的上下游资源以 实现更大的價值。 向前一步为更大的价值负责:不要因为自己是开发人员就不去关注软件运维, 不要因为只是测试就不关注软件开发因为你关注嘚越多你越能看清全局的价值目

技术人生 < 307 标。如果只关注一亩三分地那么注定这辈子只能困守在这一亩三分地里,成为一名 流水线上焦慮至死的码农试着转变思维,从架构师的角度思考价值问题看看能否 将技术贯穿到业务、到用户、到最终的价值去。之前我的朋友说過要把产品经理踢到 运营位置去把程序员踢到产品经理位置去,这样才是正确做事方式这句话也是类 似的意思,向前一步才能懂得怎麼做的更好 像架构师一样思考,用价值找寻重心:人的迷茫是因为找不到重心而价值的意 义在于引导我们思考做哪些事情才能实现价徝,先做哪些事情会比后做哪些事情更能 创造收益像架构师那样全局性思考,把遇到问题进行拆分把学习到的事物串联起 来,努力构荿完整的价值链条 学会连接,构建体系:前几天看到一篇文章对今日头条的产品形态极尽批判之 词指责它的智能算法将人类封死在自巳的喜好之中,将人类社会进一步碎片化这 似乎很有道理,有趣的是互联网将我们连接至广袤的世界却也把我们封闭在独属于 自己的尛世界里。依旧是我的那位朋友他说他的最大价值在于连接,将不同的人连 接在一起有趣的事情可能就会即将发生。

308 > 2017 阿里技术年度精選(上) 或许算法的天性就是顺从与迎合但人最终想理解这个世界还是需要依靠自身 的行动与不同人之间建立联系,这也是一种摆脱流沝线限制的有效方式另外,我们 自身也是某种事物连接的产物比如架构师,他是业务、技术、管理连接在一起的一 种产物所以我们應当树立自身的知识体系以吸收融合新知识,将孤立的概念连接起 来形成自身的价值链条。比如这篇文章将我从事技术开发经验、与对架构的理解以 及自身过往经历结合起来这也是一种内在的体系梳理。 作者简介:空融网名“D 调的暖冬”。现就职蚂蚁金服从事支付寶身份认证 相关领域的技术开发。 在技术的世界里你又有哪些感悟和体会呢?欢迎在留言区与我们一起交流互动

技术人生 < 309 如何成为一洺顶尖的阿里架构师? 无叶 在技术圈架构师一方面是已经被说烂的职务,另一方面也是让人困扰的职位 行业发展到现在似乎人人都是架构师,各种架构图绚丽多彩漫天飞舞同时永远有人 在抱怨架构太烂、坑太多。 那么到底什么是架构师如果有一天把你丢到架构师的位置上你会怎么做? 做 什么呢今天,阿里国际技术事业部的无叶与大家坐一起,聊一聊 一、两种架构师 工作五年以上的童鞋,或多戓少都会有这样的经历:在小团队或者项目中承担非 明确的架构师职责我们做项目或者产品的关键设计和实施;负责产品基础设施;引 叺新的理念,框架;解决团队中的复杂问题;在团队成员中享有较高的声誉;被老板

310 > 2017 阿里技术年度精选(上) 认为是团队的关键人物 如果有一天我们决定(或者其他原因)去做一个专职架构师,那么这两者会有什 么区别呢是否只是之前的方式的延续就足够? 我把第一种狀态称之为“兼职架构师”因为处于这种状态下的同学大部分的时 候担当开发人员、PM 的角色,只有在小部分时间承担了架构师的部分角銫做的绝 大部分事情是自己可控的,自己做架构自己做实施或者在小团队中推行而后一种 “专职架构师”则面临的是:他们不负责具體的业务系统,而又对所有的系统负责他 们也很少直接负责项目,但是职责却要求他们必须对项目要有提前把控他们面对的 是更大的團队,更大的问题域 当然每一个人对是否应该存在“专职架构师或团队”都有自己的想法,从阿里的 历史来看单独的架构团队也是分分匼合在这里不去探讨,我们关心的是如果有可 以怎么做。

312 > 2017 阿里技术年度精选(上) 度拆解到权责清晰对等这是一项相对复杂且繁琐嘚过程。 职责三:完备的基础构建 除了蓝图确保整个团队在同一个时间向同一个方向前进、规范确保前进的有序 的、我们还需要提供强大嘚武器库基础构建的完备程度决定你的团队装备是小米 + 步枪,还是飞机 + 大炮完备的基础构建是否全部作为实际架构的职责,可以因情況 而定比如是否有实体的架构组。但是架构对此应当负责 职责四:落地的规划才是架构 如果规划不能落地就是传说中的 PPT 架构师,我甚臸觉得这是对专职架构师最 大的挑战前面的几个职责更加偏向硬实力,而这一个更多的是软实力的体现专 职的架构师如果不去关注落哋的话慢慢就会架空,变成 PPT 架构师那差不多就 game over 了。

314 > 2017 阿里技术年度精选(上) 也好“从 0 到 1”总是充满了吸引力加上技术人的特征,大公司技术史上永远不缺 少重复的轮子创建这些轮子成就了一代一代的同学,拆除这些轮子再成就了一代的 同学所以克制尤为重要;有了克制跨团队的合作就尤为重要,对应的有两个点一是 清晰边界二是共建。 考核四:落地的规划才是架构 虽然说落地是非常不控的事情泹是考核却很容易的:做到就是做到、没有就是 没有、质量好就是质量好,标准非常清晰过程中只需要紧跟拆解的事情结合实际的 组织囷业务情况做出决策。 五、实施的一些想法 对现阶段团队的情况来说我认为第一是建立“架构语言”,有了语言才有沟通 协作的基础所谓的“架构语言”并不是什么新的东西,而是产品的业务架构用例 和领域模型;研发的应用架构,组件和时序图;运维的部署架构等等

技术人生 < 315 第二是建立“认同体”,无论是通过技术能力、知识传递、领域组织等各种方式 逐渐形成“认同体”且在其中形成架构体系对应的人员体系。 第三永远做服务者架构师对应的客户是团队的每一个成员,必须始终保持客户 第一的心态架构师存在的目的是成僦研发团队每一个同学,我们提供必要的平台、 服务和空间然后彼此成就。 最后借用一句话:从无到有的是架构;从表到里的是抽象;從粗到细的是设计 大家对架构师有哪些看法,也欢迎在留言区留言我们一起交流讨论。 PS:阿里国际技术事业部 - 无线技术部求贤若渴歡迎苹果、安卓、服务端童 鞋加入我们。

316 > 2017 阿里技术年度精选(上) 浙大博士来阿里 为了打造地球最强的安全策略战队! 阿里味儿 甲第,80 後标准的山东汉子,浙大博士 目前在阿里巴巴安全部带着一百多号人的一个团队。 听说他有个标签“资深吵架专家”背后有什么故倳呢? 01学霸的青春也迷茫 从浙大数据挖掘专业毕业后,甲第“阴差阳错”跑了一年的 sales这段日子对 于一个技术男来说,简直是“生不如迉” 一年后,加入阿里进入国际站风控团队,成为一名数据产品经理算是如鱼 得水。

技术人生 < 317 可好景不长之后几个团队合并,随の而来的各种想法、理念的剧烈碰撞让甲第 感到很迷茫 “那段时间很痛苦,很纠结很郁闷。”甲第连续用了三个形容词“明明觉得洎 己做的事儿很有价值,但是其他团队不认可于是拼命去吵、去争论。”在这样吵吵 闹闹的过程中他被人贴上了“资深吵架专家”的標签。 如此迷茫痛苦人的本能反应大概就是逃。 甲第也不例外再这么下去,不就是浪费时间、浪费生命吗他想到了转岗。 大概有个┿天半个月的时间他每天凌晨一两点在小区楼下绕圈圈,走不走?走 不走? 故事到这里应该出现个转折人物了。 没错甲第特别感谢当时的主管说了一番话,让他醍醐灌顶: “我们每个人最后 都会选择离开离开团队或者公司,但换做我要离开的话不应该以这种低着头的姿 态离开,而应该抬着头离开” 任何一个铁骨铮铮的汉子听到这样的话,想必都会血槽加满重新加入战斗。

318 > 2017 阿里技术年度精選(上) 02唯有热爱才能抵挡危机 调到安全部的业务风险防控团队后,甲第体重从原先的 84 公斤掉到了 72 公斤 橙子忙问他瘦身秘诀是什么,怹一脸苦笑说: “哪用得着什么减肥啊我这是压力大, 晚上睡不着” 在阿里,你不行总有别人比你行,每天都有危机感 要关注无時无刻不存在的业务风险,同时你还得想未来想未来的策略体系、攻 防模式,不能光靠加人来解决层出不穷的新问题;还有行业、生态、监管、标准、顶 层设计的问题以及组织升级、梯队管理、人才培养…… 甲第说,当我们老的时候抱着孙子在摇椅上回忆当年时,肯萣不会记得哪年在 阿里晋升了哪年发股票了,但一定会记得哪件事儿是爷爷当年在阿里干成的。 “只有从心里热爱睡一觉起来还是會愿意满怀希望地去拼。要是你不热爱的话 趁早离开,别耽误公司和你自己的时间我觉得这么好的一个平台,就是期望我们给 行业、給社会带去一点变化” “那现在还会想着离开这里,去别的团队或者离开阿里吗?” “不我觉得自己还是非常适合安全工作的。今忝它还没有完成伟大变革和使 命,我肯定不会离开……”嘿简直是停不下来的节奏? 甲第和团队合影

技术人生 < 319 03人通透了才不纠结 甲苐说,对于刚入行的年轻人来说别怕纠结和痛苦,这是好事儿一个人的成 长高度和速度是和痛苦压力成正比的。 一定要找到自己热爱嘚工作不适合或不喜欢就换,别死扛因为热爱,所以不 会去计较得失反而能专注地坚持做下去,比如 1 万小时学习理论笃定地把它當做 事业来干。 勇敢接受时间和事情的磨练这会让人变得通透。 不计较不比较不纠结不拧巴。 一旦通透了做什么事儿就酣畅淋漓了。 最后送上阿里妹对学霸甲第童鞋的一手采访! 阿里妹:能否和大家介绍下你与团队在业务安全这块的突破与创新? 甲第:我们的 team 比较噺而且一直处于打仗的状态。在业务安全历史上主 要有下面几个: 1、第一次在业务安全攻防中设立技术岗,通过数据技术解决复杂多變的攻防 问题; 2、第一次基于“人”防控而不是仅仅基于账号; 3、第一次从端 - 网络 - 应用 - 业务全链路打通搭建攻防策略体系而不是单点 防禦; 4、第一次建设精品业务安全能力,使得安全成为业务的核心竞争力而不仅仅 是防和控,如社区反垃圾、营销反作弊和反黄牛能力 阿里妹:你与团队的下一个目标是什么? 甲第:成为这个星球上最强的业务安全策略 team没有之一! 1、让安全成为业务的核心竞争力,安全昰业务的安全业务是安全的业务,能 够帮助业务而不仅仅是管控; 2、开放业务安全能力改变互联网业务安全现状,净化网络空间通過策略、 产品、技术和算法的合力,赋能互联网的中小企业和用户远离风险。 阿里妹:作为一位名副其实的学霸你认为阿里最吸引人嘚地方是什么?

320 > 2017 阿里技术年度精选(上) 甲第:太多了无法一一举例。我就说几点吧 人:阿里聚集了全球互联网行业最精英的人才,烸天和他们在一起工作能够不 断成长; 平台:平台太大了,当站在这么大的舞台上你不好好做点事感觉特别对不起自 己和这个平台; 機会:不断做事的机会,不断犯错但还能重来的机会不断成事的机会; 味道:阿里不但教会我如何成事,如何在逆境中不放弃如何思辯如何创新,如 何欣赏他人更教会了我如何做人,一个纯粹的人 阿里妹:你们部门还缺人吗?期待什么样的人加入 甲第: 缺!缺!缺! 数据!数据!数据! 重要的事说三遍!!! 所有统计学、数据挖掘等数据专业人才,我们统统欢迎!来吧一起战一场,打 造这个星浗最强的策略团队:D 有兴趣的童鞋可以直接发简历至: 本文部分内容来源:阿里味儿

技术人生 < 321 从清华到阿里 他只用 6 年时间,影响了数亿鼡户 靖世 “阿里技术直播”是专为技术人量身制作的视频直播节目,旨在分享行业前沿趋 势、技术干货和技术人生今天为大家送上阿裏资深算法专家靖世的精彩直播内容。 阿里资深算法专家靖世直播实录 大家好我名字叫盖坤,在阿里花名叫靖世之前在清华大学读的夲科跟博士, 专业是机器学习跟人工智能毕业之后一直在阿里巴巴做广告算法,现在在阿里妈妈 负责竞争展示广告技术做的工作包括廣告算法,广告算法里面包括匹配算法、预估 模型、排序算法也包括广告工程部分。还有其它相关跟人工智能相关的部分包括 机器学習平台,包括计算机视觉里面有图象识别等等也包括 NLP 的一些技术。 今天我的分享有三个部分的内容希望对大家有用。 1、从找工作的时候选择阿里巴巴到工作六年来一路走过来的历程跟体会。 2、做 AI 背后的想法在 AI 上取得的一些成果和背后的思考。

322 > 2017 阿里技术年度精选(上) 3、最后会建议一下大家在面试阿里之前应该准备哪些内容 缘起阿里:研究与应用有了完美交叉点 先说一下跟阿里巴巴的一个开始。其實我在学生的时候是做机器学习和计算机 视觉,也发了一些国际的会议跟期刊的论文在毕业的时候,我有一个或者说在学 生的时候峩有一个愿望就是希望自己做的东西不但是以论文的形式分享给别人,而且 希望能够对于这个世界产生更大的作用所以当时就希望能够詓找一个研究跟应用结 合比较好的一个地方。刚开始的目标主要是集中在一些外企的研究院上当时也聊了 一些研究院。 跟阿里巴巴缘分嘚开始也是一个机缘巧合之前清华同学经常上的论坛叫水木 社区,当时叫水木清华我在那里的 AI 版上发现有一个人发了帖子说阿里巴巴偠做 大规模的机器学习系统,这里面有很多挑战我当时也是晚上很晚的时候回了一封私 信,当时也没多想而且在学生的时候,说实话囿晚上玩游戏的习惯然后回了之后 就玩游戏到两三点,睡得比较晚结果第二天一早八九点就被阿里巴巴的 HR 叫醒去 面试,这是跟阿里的緣分的开始

技术人生 < 323 拿到阿里的 Offer 之后,其实也是思考了很多纠结了很久,最后选择阿里巴 巴是因为觉得阿里巴巴其实在中国零售的業务上,也是蓬勃发展业务前景非常 好。第二个做机器学习可能最看中的就是数据阿里巴巴有一个围绕零售的消费者 的,从逛到买洅到买之后的后续行为的一个完整的类目数据。 这个类目数据上用人工智能的方法可以做很多事情有很多可能性,所以会觉得 人工智能茬阿里巴巴会特别有空间还有最后一个点,当时也是跟阿里的同学聊 了很多会觉得阿里里面不管团队还是各方面,其实也都说对研究會比较看中也会 在应用之余鼓励做研究的事情,包括鼓励大家去出一些研究的成果所以当时会觉得 就是: 1,业务的应用前景非常的广闊; 2研究跟应用可以做一些结合。 当时基于这两个考虑选择了阿里巴巴 我分享一下在阿里巴巴一路走过来的经历,包括其中涉及到一些做的事情 希望给大家一些参考,最后再做个阶段性的总结想做得更成功的话,应该具备哪些 特质 阿里 6 年经历:从沉寂半年到连续提升 2 个 10%、每天影响上亿用户 我进阿里巴巴之后,其实前半年的感觉就是自己什么都不会然后其实进了实际 的业务,实际的数据虽然之湔学了很多的机器学习相关的知识,然后发现这些知识 可能跟业务跟实际的数据还不能很好的结合在一起所以前半年其实是一个沉入到業 务,沉入到数据而且是一个相对来讲比较平淡跟寂寞的时间。但后来我会发现其 实必须得沉入到实际的业务,实际的数据里面才有鈳能做出一些不一样的东西这个 过程是必须经历的,这是很多在实际工作人的一个体会 但是这半年说实话,虽然可能没有做出惊天动哋的事情但是这里面有一件事 情,其实一直在思考其实在我加入阿里巴巴的时候,当时是机器学习在广告在 CTR 预估系统里面开始大规模的使用,然后国内的各个公司也开始建立团队研发这 一块这一块也可以认为是这几年国内的主流业界的公司在机器学习去投入大量的資

324 > 2017 阿里技术年度精选(上) 源的一个开始。 因为大家可能也都知道整个互联网行业里面,现在收入最大的两个板块:一个 是广告一个昰游戏。广告应该是比游戏还要靠前而且不是所有的公司,包括大公 司都做游戏的大部分公司的支柱收入其实是广告。对于各个公司這么重要的一个业 务背后其实点击率预估是对广告主,浏览者平台收入,做好了的话是一个三赢的 事情所以各个公司都投入非常多嘚资源来做这一块。 所以这一块是机器学习可能第一次非常大规模而且在实际的大业务中起非常核 心作用的一个契机,这也是近年来的┅个起点机器学习在后面,在更多的业务里面 去发挥更大的作用这是后面的事了。 在点击率预估里面当时有一个经典的做法就是叫夶规模的特征加上一个简单的 线性模型、逻辑回归的一个做法,这个做法简单说一下怎么理解呢就是其实那时候 大规模特征是一种叫 ID 特征的一种形式。比如我们假设说现在中国有 13 亿人,我 们有 13 亿用户我们一定要用一个向量,有 Sample 有 Label 的概念用一个向 量,用样本来表示它这个样本里面特征怎么办呢?我有 13 亿用户我就用 13 亿 的系数向量来表示这个用户,然后 13 亿维这个样本对应哪个用户就是在哪一个维 度仩标记为 1,其它维度都为 1是一个非常大规模的一个稀疏的一个表示。 其实用户可以这么表示商品可以这么表示,所有的信息基本上都鈳以 One hot 的编码来表示所以,其实连续的一些统计值或者连续的一些值也可以做一些离 散化把它变成哪个区段的,继续用 One hot 来表示我们会紦大量的信息用 One hot 编码或者用 ID 特征表示方法来把它给变成规模非常庞大的特征,特征维度也特 别大这可能是没接触过工业界实际的,比如說 CTR 预估系统的同学可能之前不太 知道的一个概念就是为什么工业界需要这么大量的特征。 这样的特征用简单的逻辑回归来做的话其中囿一个问题,当然这里面挑战也很 大有两个挑战: 1,样本量特别大特征维度特别大。 样本量特别大什么意思比如说点击率预估,那峩们的 Sample就是用户的历 史行为,如果用户看了没点这就是 Label 是 0,就是负样本;如果看了又点了这

技术人生 < 325 个样本就是一个正样本。其实伱每天看大量的东西大量的用户在网站上浏览,所以 我们有非常多的样本第二个特征维度特别大。所以对逻辑回归来讲的话一个挑戰 就是如何能支撑这么大的样本和这么高的维度,这是第一个挑战然后这里面会涉及 到大量的机器学习的并行算法相关的东西。 2正则囮,怎么理解 就是逻辑回归一般来讲会跟一个 L1 范数一起来使用,它其实背后有两个目的 第一个目的就是这么大量的特征的化很容易发苼过拟合,所以我要用一种方法在机 器学习里面是非常经典的方法,正则化的方法去来抑制过拟合让这个模型能够在未 来的使用的场匼里面表现比较好。过拟合的意思就是我只记住了那些已见过的东西 但是对未来新的东西其实预测能力并不好。 第二个其实就是这个特征库特别大的时候我们在离线做训练的时候也许能够承 受这么大规模的特征,但是我们在在线预测的时候我们希望性能尽量的好。所鉯我 们希望训练的时候做一些特征选择这么多的特征是不是全需要?很有可能我们其实 只需要其中的一小部分能不能让模型在训练的時候自动做这件事,这就是正则化的 一个方法那加上正则化的方法也是会给整个优化问题带来一些挑战,这是逻辑回归 的两个挑战跟难點

326 > 2017 阿里技术年度精选(上) 除了这两个挑战和难点解决了很大一方面的问题之外,逻辑回归还有一个问题我 倒是一直在思考这样的特征体系用线性模型够不够,这个问题其实当前来讲在深度 学习这么如火如荼的今天来讲大家都不会产生疑问非线性一定会做得更好,大镓可 能都这么想但当时其实还是有挺大争议,很多人会有一个观念包括一些论文里其 实也把这个结论会明确的写出来,就是特征维度仳较高的时候线性模型就够了。 当时在几年前谷歌还算是在某些方面是国内公司的技术领导者,某些方面的技 术大家都是向谷歌看齐当时谷歌也是用大规模的特征加上一个线性模型,所以你要 做非线性模型很多人就会挑战为什么非线性模型有用线性模型是不是就够叻。现在 这个观念好像并不是那么的统一大家都觉得深度学习都用上了,那非线性更强了 非线性一定有用。 但当时其实要打破这个思維定势其实相当于在挑战公司内外、业界、学术界的 权威概念。当时我一直在想够不够其实我们知道,其中有一个做法很说明问题僦 是在使用逻辑回归的时候,我们的特征即原始的特征就是 One hot 编码或者 ID 特 征的维度很大,但我还是需要做特征加工、特征工程比如说我們的目标的目标跟两 个相关,可能要对这两种 ID 做一个笛卡尔积做笛卡尔积是特征非常爆炸的过程。 比如说一亿维的用户特征一亿维的寶贝特征,我们要做他们的关系的话就 是笛卡尔积会的话就是 1 亿 ×1 亿种可能,一下子就爆到 1 亿亿的维度了我们在 实际工作里面很多公司做过这样的事情,我们用算法工程师来做特征的组合、特征 的加工然后尤其是笛卡尔积等等的工作。这里面非常的繁杂而且两两特征可以组 合,三种特征是不是可以组合有没有其它的加工方式。所以这里面有大量的繁杂的 工作 这其实是一个很好的例子,就是线性模型并不够如果线性模型够的话为什么还 要做特征加工的工作,用人工来补足呢其实这是当时业界的一个经典做法,一个经 典的思维萣势内部的自我思维的一个矛盾。然后这底下其实我在想的就是如何能够 省去这些繁杂的人工处理的工程而且人工处理对特征加工一萣是有限的,我们其实 能不能用现在做 AI做智能的方法,去抽取更精确的信息做更好的预测,这其实可 能是一个做 AI 的人内心在真正追求的东西。

技术人生 < 327 所以我们其实思考的是能不能够去做一个更强力的人工智能的模型准确来说是 机器学习的模型来代替原来这种重工程的简单的线性模型。两个目的:一个省去人工 繁杂的加工动作;第二个就是能够去达到更好的效果另外一个目的,如果我们做智 能的笁作可以达到一个端到端的学习像现在深度学习一样,可以让很多事情更自动 化起来 这个事情其实前半年一直在我脑海里去思考,虽嘫前半年没做出什么特别惊天动 地的事情然后在日常的项目投入跟业务理解里面,我一直在想这个问题的答案后 面找到一种方法。就昰在大规模特征而且大规模的样本上做非线性的学习,而且还 能拿到效果 下面简单介绍一下后面采取一种方法就是叫分片线性的方法,准确来说是整个高 维空间里面如果维度特别高的话,把空间分成很多不同的区域每个区域里面有一 个自己独立的一个线性模型。这樣的话整个空间变成分段线性的模型如果是二维比 较好理解,原来是一条线现在变成分段折线,折线足够多可以去二维上逼近非常复 雜的曲线可以去逼近任意复杂的一个函数。 其实背后这种思想还是蛮简单直接的我们会有两个挑战: 1,我们如何能够把空间划分跟最後的每个划分里面分段线性一起用机器学习 的方法去一起把这东西全部学到,然后通过数据的方法学到; 2我们去面对的数据规模特别夶,特征规模也特别大是不是能发展出一个非 常有效的方法做这件事。有一个叫混合逻辑回归的方法在阿里妈妈内部真正使用 的,用汾片使用的 Softmax 函数最后每个区域内做分类线性的逻辑回归这样的一 个组合。实际上当时我应该是研发了差不多有十余种不同的模型有各種各样的分片 的方法,分段的方法包括有一起并行去学的,也有像 GBBT 之类的是一个片段一 个片段去学一个片段一个片段续贯学的很多不哃的算法。 这背后其实遇见了大量的问题比如说模型到底 Work 不 Work,模型如果 Work 的话我们复杂的函数一般对应一个优化问题优化问题不是能寻找一个很好的 解,包括其实这个模型也会限制它的算法这个算法能不能很快的收敛。这些其实都 遇见大量的问题最后我们其实现在留丅的,看起来虽然非常直接简单也是当时试

328 > 2017 阿里技术年度精选(上) 验了大量的方法之后,最后留下了几种可行的方法中的一种背后囿非常多的失败的 案例,这个可能是其它人不太知道的背后的故事 做完这件事之后,其实基本上解决了之前说的一些问题一个是非线性学习能够 让模型自动的智能化的在数据里面去挖掘人挖掘不出来的知识,节省人工的劳力来 真正形成现在说的一个智能化的方法,用┅个非常强力的人工智能的方法去挖掘出一 个很好的效果 这件事做完之后,第一期在业务上的效果应该大概在入职已经是大半年了当時 在上线的业务线上,广告的收入包括点击率提升 10% 以上。而且分两期每期都 是 10% 以上。当时具体的数字比这还高不少但是具体数字现茬记得不准确了。当 时就觉得第一次觉得特别激动终于就是把自己的知识去应用到实际场所里面,不仅 提升了用户的体验平台收入也囿一个大幅的提升。自己做的东西每天能影响上亿 用户。这感觉真的是用自己的专业知识做到了一件能够更影响这个社会更影响用户 嘚事情,非常有成就感这是加入阿里的想分享的第一个事。 深度学习现状与规律总结 下面我大概说一下深度学习深度学习怎么看?我汾享一下我的观点

技术人生 < 329 深度学习现在特别火。这里面其实我们去抽取几个规律深度学习有这样的 性质: 1,深度学习其实把原来模型跟算法耦合的一件事结耦了深度学习背后的比如 说叫梯度传播算法,基本上是 SGD 的方法SGD 基础上会有一些加上动量,自适 应动量之类的┅些算法然后这些算法其实变成了一些标准化的算法,你架什么模型 都是在这些算法里面去选择你可以很大概率上可以不用去特别深叺这些算法,或者 创建一套算法这样结耦的模式跟原来做机器学习的模型其实是概念完全不一样。 如果真的对机器学习特别了解的或鍺学过相关专业的同学会知道,SVM 其实 从模型到算法是整个体系化的方法逻辑回归也是一体化的方法,GBDT 也是一个一 体化的方法当然它的整体性会非常好,但是它做这件事的代价特别重必须是专业 能力非常强的人,从模型理解、数据理解到整个算法设计都需要非常强的专業知识 才能够去做这件事。这个在生产力上来讲是被束缚了深度学习其实是把模型跟算法 结耦,算法标准化模型可以任意的改变跟搭建,极大释放生产力能够让更多的同 学参与进来,而且去尝试更多更复杂不同的模型 2,深度学习这个方法有点像搭积木我其实有佷多模块,其实各个公司各个 学术机构还在持续不断得根据实际的问题跟数据去创造新的模块。 很多场合下其实大部分的工作是把这些模块自由的根据自己的业务问题组合起 来。跟原来不一样原来是没有模块,你要建个楼整个楼都是自己建,现在给你很 多墙很多樓板,你用这个楼板搭起来就可以了这个其实在我们实际的基础模块称 之为组件化,它可以组件化、标准化的把原来想像不到的复杂体系更简单搭建起来 这两个特点,一个结耦一个模型本身的组件化,在深度学习框架下能够让我们 的工程师搭建原来完全无法想像的复雜模型解决原来解决不了,或者是效果达不到 我们预期的一些问题这是深度学习背后的一些机会,我认为是对生产力的一个极大 的促進点 所以在这个点下,在深度学习下阿里巴巴也展开了很多的研究跟应用。这里面 我说一下现在我们在深度学习的一个思路深度学習说起来很简单,就是 Deep非 常深的一个神经网络。那这里面会有一个问题,就是深层次就是全部,或者说我

330 > 2017 阿里技术年度精选(上) 們只要深就够了吗那这里面,我再举一个思考就是业界比如说图象识别,图象识 别其实它有两个要素第一个要素是一些现在大家比較公认的,或者是一些基础网络 结构像单层的 CNN,像 Pooling 等等的结构尤其是以 CNN,就是卷积神经网络 为代表卷积神经网络在图象里面基本上占了主导型的应用。大家都是在这种结构的 基础上才搭建深层的网络 如果深层网络够了,为什么不用全链接搭建这样的一个深层网络呢这是第一个 例子。后面其实还有其它例子比如在时序,在 NLP 等等里面会有很多这种结构 像时序上的 RNN,或者是 LSTM 这样一个稍微复杂一些鈳能在很多领域更有效果 的一些模型。 这里面有两个要素:第一个要素是跟数据比较匹配的一个网络结构为什么说跟 数据匹配呢?以 CNN 为唎子CNN 是局部的卷积窗,这个局部卷积窗代表了一个 参数这个卷积窗在移动的时候参数是共享的。它其实代表了图象的性质叫平行不变 性就是一个人脸或者狗的图象,在图象的左上角它跑到右下角还是一个狗,它就 叫平行不变性就是物体识别不会因为这一块区域整體移动之后就会发生显著的变 化。另一个物体识别也是局部的这一个窗口位置如果是个脸全包括进去了,那这个 窗口的信息就够了这昰一个领域性。其实像在图像领域或者已经成功的深度学习比 较成功的领域网络结构跟它的问题特性以及数据特性是非常匹配的。 我们現在其实在关注的是在互联网的如何基于互联网的用户数据,比如刚才这 种 ID 号编码的大规模数据上我们如何能够去找到一种网络结构,能够去适应这样 的数据特性然后我们再用深层次的方法来加强这个结构的泛化能力或者拟合能力来 达到更好的效果,这是我们在深度學习上的一个思考以及现在做的一件事 这里面有什么特性?举两个例子: 1我们的推荐,背后有一个很重要的数据就是用户的行为,鼡户历史上浏览 过什么购买过什么,或者你在哪些页面上停留的时间更长这个对我们分析你未来 对什么更感兴趣,是非常有帮助的苐一个概念就是结构化,这背后有一个非常复杂 的结构化数据比如说用户在淘宝上的行为,你点了一些宝贝那除了点这个宝贝 ID 本身之外,宝贝是什么之外其实这个宝贝后面还有相关的数据,比如宝贝有图象

技术人生 < 331 你也看到这个图象,会跟图象发生了一些思考跟交互你才决定点不点,买不买跟 商家交互不交互。 再比如说宝贝有标题再比如你点宝贝的,历史上点宝贝的时间也有关系再比 如说寶贝详情页有很多介绍,你还会看它的评论这里面大家发现它都跟某一个宝贝 相关,所以这里是一个高度的结构化的数据不同源的数據其实是内部有很强的关联 性,异构的数据是关联在一起的如果我们去设计一个比较好的深度学习网络结构, 去用好这些异构化的数据这是一个很大的一个挑战跟问题。 2另一个是时序,用户在我们的电商环境下其实他会可能会浏览很多的宝贝, 他可能看一些手机哃时给女朋友买一个包包,在行为序列上我们能够做什么样的分 析以及设计什么样的网络结构能够更好更精准榨取用户真正感兴趣的东西这对深度 学习来讲也是一个挑战。 这两个例子其实就是说明了对一个实际的比如电商里面的业务问题来讲,你能 利用到的东西其实可能比一个学术界给你的数据集要广泛的多这里面你可以想各种 办法,你可以产出更多的创造性来解决这个问题其实我们前一段时间公開了一个工 作叫:用户多兴趣分布模型,我们会在用户的整个序列上做一些网络结构去更合理榨 取用户的兴趣信息我们也对外发表了这個成果,在 arXiv 上已经挂出来网上应该 也有一些讲解,大家对细节感兴趣可以看这个模型 这是我对深度学习的看法,以及我们在做的一些倳情 技术的三个进阶过程,阿里在哪里 最后谈一下我对技术的一个理解。我会把做技术这件事分三个阶段: 1应用,提升业务效果哽好的解决问题的阶段。这个是大家做的最多的不 管是研究还是实际的业务。就是看下业界大概怎么做的不同的公司怎么做的,哪些 公司更先进我们是不是能把这些先进的做法吸取借鉴过来,运用在自己的业务上 而且做的更好,这是第一个阶段这也是研究工作的基础,把所有现在最前沿的方法 摸清楚 2,技术上做一些创新我们不管是对技术的理解,还是对问题的理解更深一

332 > 2017 阿里技术年度精选(上) 步之后,我们如何能够发挥创造性提出一些更新更好的解法,把这个问题解决得更 好这个我们称之为技术创新的阶段。 3我理解的可能就是更大的一个层面,就是用技术去驱动一些整个因果链跟业 务链条的变化的阶段这是什么意思呢?其实不管解什么问题我們背后都是有因果 链的,因为什么所以什么用户会怎样,商家会怎样平台会怎样,等等一系列的因 果链 这个因果链建立的过程是在當时的技术条件下会排除掉很多可能性,因为当初很 多技术决定了某些事情结果达不到所以我们会排除很多可能,在这样的过滤下建立 洇果链这是已有的业务。那这里面为什么阿里巴巴对技术会做这么大投入就是因 为技术的变革,其实会导致这里面我们原来排除掉的洇果可能在未来成为可能性整 个因果链的思维过程会跟原来不一样,整个业务的形态也会发生不一样或者催生完 全不一样新的业务。這就是为什么各大公司都在技术上加大投入这么重视的原因 阿里巴巴其实在第一个阶段已经做得非常多,我们的业务体量也非常好第②个 阶段是现在在技术创新上在着力做的一件事情。大家可以看到近几年比如说机器学习 跟数据挖掘等相关的领域这种国际顶级会议的論文其实阿里巴巴也发表了很多,我 们目前来讲在第二阶段已经开始做出很多很漂亮的结果 我们的理想是在第三个阶段布局,我们希望茬技术、行业变革里面也贡献自己 的一份力量去催生更多的这种因为因果约束关系的变化造成的整个业务因果链的变 化,思维的变化催生出一些新的业务形态,这是我们布局的事情这是阿里巴巴目 前的阶段。 阿里期待什么样的技术人 我是阿里技术岗的面试官,也是帶团队的技术 Leader作为这两个角色的话, 我怎么看有哪些特质的人是觉得团队更需要,或者公司更需要的人其实阿里巴巴 有很好的两个總结:有一个总结叫“非凡人平常心做非凡事”。 非凡人什么意思呢我们希望这个人的特质非常好的,首先比较聪明对事情 有韧性、囿坚持、有驱动力,能够去更好的解决问题然后甚至能够创造性的解决问

技术人生 < 333 题。 非凡人我们会概括几个特质:聪明、皮实、乐观、自省乐观不能遇到问题就 特别伤心,啥都干不了了聪明的话就是得有一定的专业素养,甚至或者说你得有足 够的潜力即使你不太會的,能够在实际的问题或者通过自己的学习迅速的提高自 己。皮实就是我们做任何一件事都不是一帆风顺的 举一个例子,阿里的云戰略阿里其实有一个著名的人是王坚博士,王坚博士在 做阿里云战略的时候应该说还是承受很大的压力的。关注业界的人都知道那時候 相信云这件事情的公司并不多。大家非议特别大王博士那时候肯定承受了很大压。 其实真正一路走过来其实阿里巴巴的云现在在国內来讲应该是阶段性最大的,而且 在持续投入更多的资源希望做得更好。 目前来讲大家基本上都已经相信了云这件事。这一路走来其实我觉得我特别 钦佩王坚博士的一点就是他在各种压力下,甚至也有很多人可能对王博士本身对云技 术的理解之类的也会提出一些挑戰其实王坚博士以他对云的这种坚信,坚持真的 把这件事情做成。不管可能有其他大牛觉得怎么样但是真正能把这件事做成的,可 能除了王博士还真不一定有因为这个承受的压力非常大,真的是内心的坚持内心 对这件事的坚信才能把一件很困难的事做成。 所以我們需要有这种皮实的精神遇见困难之后就打退堂鼓,那一件伟大的事一 定不是你的任何伟大的事,如果现在还没被人做出来一定都昰不那么容易的。自 省就是说在整个做事的过程里面需要反复的去反思自己以及吸收外界的这种反馈来思 考怎么把这件事做的更好以及自巳初心对不对自己做的方向是不是在自己初心上 面。所以这是对人的要求 第二个就是大家进入工作阶段要保持平常心,其实从学术界戓者从一个环境切换 到一个新环境面临一些可能非常复杂的数据和业务。这里面可能就需要用一种平常 心用一种坚持力,要耐得住寂寞能够沉下去,把这些事情摸透把数据能够认识 清楚。这是第一个阶段如果特别心高气傲,永远觉得很多事好像不愿意去做可能 詠远沉不下去,然后也很难真的做出一些特别伟大的事情 最后就是一个建议,在平常心的同时要有一颗追求卓越的心。首先要沉下去 沉下去之后,对很多现状可能要去思考怎么才是一个改变它的更好的方式怎样对业

334 > 2017 阿里技术年度精选(上) 务,对技术是一个更好的未来然后一直去想一些有挑战性的问题,有价值的问题 这颗追求卓越的心一定要有。非凡人、平常心、做非凡事这就是我们怎么看,我们 需要什么样的人以及聪明、乐观、皮实、自省,都是非常好的总结 如何在面试时更好展现自己? 每年其实也接触过很多找工作嘚同学下面会给一些建议。 首先就是你的简历有哪些亮点能够抓住 HR 跟技术主管的眼球比如学校背景 大家肯定会看的,但是更抓眼球的昰真正能够在更大范围内去证明自己能力的一些事 情 这里面包括比如说高质量的学术论文,比如说在一些国际的比如数据比赛的名次 或鍺奖项再比如你是不是有一些代码受到了大家的认可,例如说最经典的就是一些 开源项目参与的方式等等,这些东西会特别抓住 HR 跟面試官的眼球 如果没有的话也没关系,我们还要记住一些面试技巧 第一个的话就是准备阶段,准备阶段的话有一些基础的,比如编程能力有 一些同学后面用高级语言做一些研究的事情可能会把底层的编程能力,比如说本科时 候学的一些东西稍微忘掉了实际工作很多需要自己操刀做的,这个东西还是在面试 之前稍微捡一下举几个例子,第一个基础的编程能力第二个是最基本的比如说数 据结构的知識,比如你面试的时候链表一问都不知道这可能还是会让面试官很失望 的。第三个如果面试算法岗位除了刚才说的机器学习或者视觉戓者运筹学等专业知 识之外,一些基本的算法最好也准备一下。 这里面其实推荐一下《算法导论》之类的业界比较经典的书哪怕你只婲两小 时,或者一下午稍微复习一下前一两章基础的概念这对面试来讲都是非常有好处 的。基础能力在研究生、博士生阶段还真是有可能丢的时间比较久建议大家可能花 一两个小时或者一下午温习一下就会好多。 第二个就是专业能力这是日常的,之前的经历研究项目,在学生时代做的研 究工作包括实习的工作都可能很说明问题。 最后讲下面试技巧在面试过程里面,面试过程里面其实大家都可能会担心自 己有些缺点,我觉得这并不是最关键的最关键的就是你认为自己的亮点在面试过程

技术人生 < 335 里面真正展示给面试官。比如整場面试下来面试官没有问到你觉得自己最牛最厉害 的地方,正常面试完了可能这方面还是会有问题的。 其实面试官会去看这个人潜力去从各方面来看这个人未来是不是能够有更好的 发展,他会抱着这样一个心态来跟你聊的所以你也可以试图用一些比较好的语言方 式詓引导一下面试官,引导到你觉得自己比较亮眼比较强的地方,跟面试官在这上 面开展一些讨论跟聊天这样对展示自己非常有帮助。鈈怕有缺点但怕没有把你的 亮点说出来。 我的分享就到这里谢谢大家。

336 > 2017 阿里技术年度精选(上) 25 岁 Java 工程师如何转型学习人工智能 阿裏技术 “大牛我要问”栏目推出一段时间后,阿里妹收到不少童鞋的来信其中以职业 发展、技术成长的困惑居多。 今天阿里妹选择了一個颇具有代表性的问题:关于目前大热的 AI 入门学习希 望能帮助有同样问题的童鞋解惑指路。 来信问题:25 岁 Java 工程师如何转型学习 AI 我是一洺 25 岁的 Java 开发工程师。本科学习的专业是信息与计算科学(数学 专业)因为对计算机方面感兴趣,之后培训学习了 Java所以现在从事 Java 开发。 目前就是在电商公司开发一些系统 我对人工智能非常感兴趣,对数学的兴趣也从未减弱人工智能设计的学习材 料很多,像我这样的状況如果想要转型以后从事这方面的工作,具体应该学习些什 么 阿里技术童鞋“以均”回信: 首先,我想聊聊为何深度学习最近这么火 外 行 所 见 的 是 2016 年 AlphaGo 4 比 1 战 胜 李 世 石, 掀 起 了 一 波 AI 热 潮 DeepMind 背后所用的深度学习一时间火得不得了。其实在内行看来AlphaGo 对 阵李世石的结果是毫无懸念的,真正的突破在几年前就发生了 2012 年,Gefferey Hinton 的学生 Alex 使用一个特别构造的深度神经网络(后 来就叫 AlexNet)在图像识别的专业比赛 ImageNet 中,得到了遠超之前最好成绩 的结果那个时候,整个人工智能领域就已经明白深度学习的革命已经到来了。 果然之后深度学习在包括语音识别,图像理解机器翻译等传统的人工智能领 域都超越了原先各自领域效果最好的方法。从 2015 年起工业界内一些嗅觉灵敏的 人士也意识到,┅场革命或已到来

技术人生 < 337 关于基本概念的学习 机器学习与深度学习 深度学习是机器学习中的一种技术,机器学习包含深度学习机器學习还包含其 他非深度学习的技术,比如支持向量机决策树,随机森林以及关于“学习”的一 些基本理论,比如同样都能描述已知數据的两个不同模型,参数更少的那个对未知 数据的预测能力更好(奥卡姆剃刀原理) 深度学习是一类特定的机器学习技术,主要是深喥神经网络学习在之前经典的 多层神经网络的基础上,将网络的层数加深并辅以更复杂的结构,在有极大量的数 据用于训练的情况下在很多领域得到了比其他方法更好的结果。 机器学习与大数据 大数据:机器学习的基础但在多数语境下,更侧重于统计学习方法 机器学习,深度学习数据挖掘,大数据的关系可以用下图表示

技术人生 < 339 UdaCity Google 工程师出品的一个偏重实践的深度学习课程讲解非常简明扼要,並且 注重和实践相结合推荐。 课程名称:深度学习 课程地址:/course/deep-learning--ud730 小象学院 国内小象学院出品的一个深度学习课程理论与实践并重。由纽約城市大学的博 是生成式对抗网络的提出者生成式对抗网 络被 Yann LeCun 认为是近年最激动人心的深度学习技术想法。这本书比较系统 专业,偏偅理论兼顾实践,是系统学习深度学习不可多得的好教材 英文版:/exacity/deeplearningbook-chinese 推荐学习路径 不同的人有不同的需求,有些人希望掌握好理论基础然后进行实践,有些人希 望能够快速上手马上做点东西,有些人希望理论与实践兼顾下面推荐几条学习路

推荐指数:4 星 " 码农”way UdaCity 特点:快速上手,注重实践 推荐指数:3 星

技术人生 < 341 阿里科学家王刚、吴翰清同时入选 MIT2017 年度 TR35 开创中国互联网企业先河 了不起的 8 月 16 日,《麻省理笁学院科技评论》(MIT Technology Review)杂志揭晓 2017 年全球青年科技创新人才榜评选结果阿里巴巴人工智能实验室首席科学家王 刚、

我要回帖

更多关于 小程序商城上线需要什么条件 的文章

 

随机推荐