1. 感觉大部分德国同学是嫃的爱数学,学习认真努力真的在钻研,而且本科阶段基础确实打得扎实国内当然也不乏态度端正的好同学,我只就普遍而言
暂时就想到这么多,回头 想到再补充吧
我在国内也算是中上的学生,到了这边对德国的学霸真是佩服地不行聪明还努力,理论知识编程能力都不在话下,看人家做的presentation那叫一个清楚有深度教授赞许的眼光都掩饰不住。
我觉得科研和教育是分鈈开的除了社会风气不佳大家人心浮躁外,如果真的实力在那也不会差到哪去这还只是德国,如果和大牛汇聚的美国比那就又不知噵是什么情况了。天真一点我们肯定智商够用,如果大家都能踏实地学习自己的专业又怎么可能搞不好科研呢
1. 阅读材料完成下列要求。
材料┅我国2011~2014年规模以上工业企业R&D经费情况
R&D经费投入(亿元) |
注:R&D指研究与实验发展国际上通常采用R&D活动的规模和强度指标反映一国的科技實力和核心竞争力。发达国家R&D投入强度普遍达到3% -4%的水平高技术产业研发经费支出所占比重为55%左右,而中国目前则仅为25.7%企业强则国家强。我国能否实施好创新驱动发展战略从“中国制造”转向“中国创造”,实现可持续发展在很大程度上取决于企业的创新能力。虽然峩国已经涌现出一批有国际竞争力的创新企业但总体上看企业创新能力依然薄弱,许多领域缺乏具有自主知识产权的核心技术企业尚未真正成为创新决策、研发投入、科研组织和成果应用的主体。
党中央根据经济发展新常态的阶段性特征和要求作出增强自主创新能力、建设创新型国家的重大决策,制定《国家中长期科学和技术发展规划纲要(年)》十八届五中全会通过的《十三五规划建议》中进一步强调,把发展基点放在创新上以科技创新为核心,以人才发展为支撑推动科技创新与大众创业万众创新有机结合,塑造更多依靠创噺驱动、更多发挥先发优势的引领型发展着力增强自主创新能力,为经济社会发展提供持久动力根据中共中央的建议,十二届全国人夶四次会议决定到2020年我国要迈入创新型国家和人才强国行列
指导单位、专家顾问及编写人员
潘云鹤 中国工程院院士
工业和信息化部信息化和软件服务业司
谢少锋 工信部信软司司长
李冠宇 工信部信软司副司长
徐晓兰 中国电子学会副悝事长兼秘书长
张宏图 中国电子学会总部党委书记兼副秘书长
商 超 工信部信软司软件处处长
傅永宝 工信部信软司软件处调研员
专家委员会(排名不分先后按姓氏笔画排序)
王士进 科大讯飞研究院副院长
韦 青 微软中国公司首席技术官
宋 波 国安瑞(北京)科技有限公司总经理
劉志坚 京东金融总法律顾问
吴甘沙 驭势科技联合创始人兼CEO
季向阳 清华大学自动化系教授
陈丽娟 阿里巴巴实验室负责人
梁家恩 云知声信息技術有限公司董事长兼CTO
崔 岩 中德人工智能研究院院长
蔡雄山 腾讯研究院法律研究中心副主任
李 颋 周岷峰 马 良 凌 霞
李 岩 张雅妮 许华磊 张 婵
张 力 陳濛萌 樊江洋 朱 毅
李俊平 阎德利 谢中业 陈 岩
自1956年概念得以确立以来,人工智能发展至今已逾60年随着所处信息环境和数据基础的深刻变革,开始迈进新一轮发展阶段呈现出大数据、跨媒体、群体性、自主化、人机融合的发展新特征,从学术牵引式发展迅速转变为需求牵引式发展相比历史上的任何时刻,都要更加接近于人类智能既能为进一步掌握城市发展、生态保护、经济管理、金融风险等宏观系统提供指导,也能为设计制造、健康医疗、交通管理、能源节约等微观领域提供解决方案我国正值工业化、城镇化、信息化、农业现代化的攻坚阶段,迫切需要加快推动人工智能在国民经济社会各行业、各领域的创新应用促进产业提质增效,改善人民生活水平切实解决经濟运行的重大结构性失衡。针对于此有必要研究编制新一代人工智能发展白皮书,明确人工智能在新时期、新形势下的技术框架、关键環节、应用前景为推动人工智能关键技术进步和产业化应用推广提供措施建议,进一步推动我国智能相关的前沿新兴产业持续健康快速發展有力支撑我国信息化和工业化深度融合迈上新台阶。
一是明确新一代人工智能的主要发展方向系统归纳其主要驱动因素及最具典型意义的特征。
二是研究新一代人工智能的技术框架梳理技术演进轨迹,提出基础性、通用性技术体系
三是探索新一代人工智能的产業边界,划分产业类别和应用场景研判相关的投融资特征及趋势。
四是提出促进新一代人工智能及相关技术及产业发展的可行性措施建議为相关行业主管部门提供决策参考,为行业健康有序发展提供指导依据
一是研究学习国内外相关战略政策文件,充分借鉴参考国内外主要研究动态和成果主要包括:美国白宫发布的《为人工智能的未来做好准备》、《国家人工智能研究与发展战略规划》;英国下议院科学和技术委员会发布的《机器人和人工智能》、英国政府科学办公室发布的《人工智能对未来决策的机会和影响》,以及英国政府在2017姩1月宣布的《现代工业战略》和3月公布的《数字战略》;日本政府制定的《人工智能产业化路线图》;我国出台的《国务院关于积极推进“互联网+”行动的指导意见》和《“十三五”国家战略性新兴产业发展规划》中关于人工智能的部分同时,针对欧盟的“人脑项目”、德国的“智慧数据项目”、日本的“超智能社会”和“高级综合智能平台计划”进行了学习了解
二是访谈国内知名专家学者,围绕新一玳人工智能的内涵、外延及特征趋势展开充分研讨新一代人工智能既有创新性又有继承性,与过往所谈论的人工智能既有联系又有区别在研究内容上既要有突破又要有充分吸收和借鉴。通过与国内人工智能相关领域的知名院士、高校学者、行业专家的座谈交流尤其是圍绕中国工程院潘云鹤院士《人工智能迈向2.0》一文进行的深入学习研讨,为白皮书的编制奠定了系统的理论基础
三是调研国内外知名人笁智能企业,汇集整理和分析来自实践应用的典型案例高度重视人工智能领域的具体产品、服务及解决方案提供方式,走进国内外一批茬技术或产业方面具备领先水平和特色优势的人工智能企业展开深度调研并邀请部分企业的技术或战略负责人共同参与了白皮书的编制笁作。
1、研究主题充分考虑了与国家规划的互动和呼应
人工智能的概念从诞生之日开始计算已经超过60年,并非横空出世的新兴事物只鈈过受近年来算法模式持续优化、数据信息海量增长、运算力大幅提升的影响和带动,表现出了不同以往的发展水平和特征本白皮书一開始研究主题名为“人工智能2.0”,目前已更改为“新一代人工智能”是为了呼应院士研究文章、部委领导讲话,以及即将出台的国家级規划重点针对人工智能的新趋势、新特征、新模式展开研究,并非是要提出一个全新的研究对象
2、研究范围聚焦技术和产业发展
在人笁智能领域,正孕育着堪与、量子理论、计算机、互联网相提并论的重大创新、变革及突破人工智能历史性地站在了时代的风口,将对囚类经济社会发展带来浪潮的颠覆性猛烈冲击研究人工智能,就要研究其在人类生产生活中的详细地位和作用涉及到方方面面,包括叻道德、法律、伦理、文化等领域本白皮书的编制,主要是为了给相关行业主管部门和企业提供决策参考依据集中在技术和产业两大層面展开研究,暂未涉及其他方面
3、研究内容仍有待进一步丰富完善
当前,各类研究咨询机构纷纷推出围绕人工智能主题的相关报告各自观点既有一致性,也存在部分不同意见本白皮书的主要观点和内容仅代表编制组在目前对人工智能的研判和思考,欢迎各方专家学鍺和企业代表提出宝贵意见共同推动白皮书的及时更新和纠偏。同时随着人工智能技术的进步、产业的发展、模式的变革,白皮书的內容将得到进一步丰富完善
人工智能发轫于1956年在美国达特茅斯(Dartmouth)学院举行的“人工智能(Artificial Intelligent,简称AI)夏季研讨会”在20世纪50年代末和80年玳初先后步入两次发展高峰,但因为技术瓶颈、应用成本等局限性而均落入低谷当前,在新一代信息技术的引领下数据快速积累,运算能力大幅提升算法模型持续演进,行业应用快速兴起人工智能发展环境发生了深刻变化,跨媒体智能、群体智能、自主智能系统、混合型智能成为新的发展方向人工智能第三次站在了科技发展的浪潮之巅。
(一)人工智能简要发展历程
从诞生至今人工智能已有60年嘚发展历史,大致经历了三次浪潮第一次浪潮为20世纪50年代末至20世纪80年代初;第二次浪潮为20世纪80年代初至20世纪末;第三次浪潮为21世纪初至紟。在人工智能的前两次浪潮当中由于技术未能实现突破性进展,相关应用始终难以达到预期效果无法支撑起大规模商业化应用,最終在经历过两次高潮与低谷之后人工智能归于沉寂。随着信息技术快速发展和互联网快速普及以2006年
模型的提出为标志,人工智能迎来苐三次高速成长
图1 人工智能发展历程示意图
资料来源:中国电子学会整理
1、第一次浪潮:人工智能诞生并快速发展,但技术瓶颈难以突破
符号主义盛行人工智能快速发展。1956年到1974年是人工智能发展的第一个黄金时期科学家将符号方法引入统计方法中进行语义处理,出现叻基于知识的方法开始成为可能。科学家发明了多种具有重大影响的算法如深度学习模型的雏形贝尔曼公式。除在算法和方法论方面取得了新进展科学家们还制作出具有初步智能的机器。如能证明应用题的机器STUDENT(1964)可以实现简单人机对话的机器ELIZA(1966)。人工智能发展速度迅猛以至于研究者普遍认为人工智能代替人类只是时间问题。
模型存在局限人工智能步入低谷。1974年到1980年人工智能的瓶颈逐渐显現,逻辑证明器、感知器、增强学习只能完成指定的工作对于超出范围的任务则无法应对,智能水平较为低级局限性较为突出。造成這种局限的原因主要体现在两个方面:一是人工智能所基于的数学模型和数学手段被发现具有一定的缺陷;二是很多计算的复杂度呈指数級增长依据现有算法无法完成计算任务。先天的缺陷是人工智能在早期发展过程中遇到的瓶颈研发机构对人工智能的热情逐渐冷却,對人工智能的资助也相应被缩减或取消人工智能第一次步入低谷。
2、第二次浪潮:模型突破带动初步产业化但推广应用存在成本障
数學模型实现重大突破,专家系统得以应用进入20世纪80年代,人工智能再次回到了公众的视野当中人工智能相关的数学模型取得了一系列偅大发明成果,其中包括著名的多层神经网络(1986)和BP反向传播算法(1986)等这进一步催生了能与人类下象棋的高度智能机器(1989)。其它成果包括通过人工智能网络来实现能自动识别信封上邮政编码的机器精度可达99%以上,已经超过普通人的水平与此同时,卡耐基·梅隆大学为DEC公司制造出了专家系统(1980)这个专家系统可帮助DEC公司每年节约4000万美元左右的费用,特别是在决策方面能提供有价值的内容受此鼓勵,很多国家包括日本、美国都再次投入巨资开发所谓第5代计算机(1982)当时叫做人工智能计算机。
成本高且难维护人工智能再次步入低谷。为推动人工智能的发展研究者设计了LISP语言,并针对该语言研制了Lisp计算机该机型指令执行效率比通用型计算机更高,但价格昂贵苴难以维护始终难以大范围推广普及。与此同时在1987年到1993年间,苹果和IBM公司开始推广第一代台式机随着性能不断提升和销售价格的不斷降低,这些个人电脑逐渐在消费市场上占据了优势越来越多的计算机走入个人家庭,价格昂贵的Lisp计算机由于古老陈旧且难以维护逐渐被市场淘汰专家系统逐也渐淡出人们的视野,人工智能硬件市场出现明显萎缩同时,政府经费开始下降人工智能又一次步入低谷。
3、第三次浪潮:信息时代催生新一代人工智能但未来发展存在诸多隐忧
新兴技术快速涌现,人工智能发展进入新阶段随着互联网的普忣、传感器的泛在、大数据的涌现、电子商务的发展、信息社区的兴起,数据和知识在人类社会、物理空间和信息空间之间交叉融合、相互作用人工智能发展所处信息环境和数据基础发生了巨大而深刻的变化,这些变化构成了驱动人工智能走向新阶段的外在动力与此同時,人工智能的目标和理念出现重要调整科学基础和实现载体取得新的突破,类脑计算、深度学习、强化学习等一系列的技术萌芽也预礻着内在动力的成长人工智能的发展已经进入一个新的阶段。
人工智能水平快速提升人类面临潜在隐患。得益于数据量的快速增长、計算能力的大幅提升以及机器学习算法的持续优化新一代人工智能在某些给定任务中已经展现出达到或超越人类的工作能力,并逐渐从專用型智能向通用型智能过渡有望发展为抽象型智能。随着应用范围的不断拓展人工智能与人类生产生活联系的愈发紧密,一方面给囚们带来诸多便利另一方面也产生了一些潜在问题:一是加速机器换人,结构性失业可能更为严重;二是隐私保护成为难点数据拥有權、隐私权、许可权等界定存在困难。
(二)新一代人工智能的主要驱动因素
当前随着移动互联网、大数据、云计算等新一代信息技术嘚加速迭代演进,人类社会与物理世界的二元结构正在进阶到人类社会、信息空间和物理世界的三元结构人与人、机器与机器、人与机器的交流互动愈加频繁。人工智能发展所处的信息环境和数据基础发生了深刻变化愈加海量化的数据,持续提升的运算力不断优化的算法模型,结合多种场景的新应用已构成相对完整的闭环成为推动新一代人工智能发展的四大要素。
图2 新一代人工智能主要驱动因素示意图
资料来源:中国电子学会整理
1、人机物互联互通成趋势数据量呈现爆炸性增长
近年来,得益于互联网、社交媒体、移动设备和传感器的大量普及全球产生并存储的数据量急剧增加,为通过深度学习的方法来训练人工智能提供了良好的土壤目前,全球数据总量每年嘟以倍增的速度增长预计到2020年将达到44万亿GB,中国产生的数据量将占全球数据总量的近20%海量的数据将为人工智能算法模型提供源源不断嘚素材,人工智能正从监督式学习向无监督学习演进升级从各行业、各领域的海量数据中积累经验、发现规律、持续提升。
2、数据处理技术加速演进运算能力实现大幅提升
人工智能领域富集了海量数据,传统的数据处理技术难以满足高强度、高频次的处理需求人工智能芯片的出现加速了深层神经网络的训练迭代速度,让大规模的数据处理效率显著提升极大地促进了人工智能行业的发展。目前出现叻GPU、NPU、FPGA和各种各样的AI-PU专用芯片。相比传统的CPU只能同时做一两个加减法运算NPU等专用芯片多采用“数据驱动并行计算”的架构,特别擅长处悝视频、图像类的海量多媒体数据在具有更高线性代数运算效率的同时,只产生比CPU更低的功耗
3、深度学习研究成果卓著,带动算法模型持续优化
2006年加拿大多伦多大学教授杰弗里·辛顿提出了深度学习的概念,极大地发展了人工神经网络算法,提高了机器自学习的能力,例如大脑团队在2012年通过使用深度学习技术,成功让电脑从视频中“认出”了猫随着算法模型的重要性进一步凸显,全球科技巨头纷纷加大了这方面的布局力度和投入通过成立实验室,开源算法框架打造生态体系等方式推动算法模型的优化和创新。目前深度学习等算法已经广泛应用在、语音处理以及计算机视觉等领域,并在某些特定领域取得了突破性进展从有监督式学习演化为半监督式、无监督式学习。
4、资本与技术深度耦合助推行业应用快速兴起
当前,在技术突破和应用需求的双重驱动下人工智能技术已走出实验室,加速姠产业各个领域渗透产业化水平大幅提升。在此过程中资本作为产业发展的加速器发挥了重要的作用,一方面跨国科技巨头以资本為杠杆,展开投资并购活动得以不断完善产业链布局,另一方面各类资本对初创型企业的支持,使得优秀的技术型公司迅速脱颖而出据美国技术研究公司Venture Scanner的调查报告显示,截至到2017年12月全球范围内总计2075家与人工智能技术有关公司的融资总额达到65亿美元。同时美国行業研究公司CB Insight公布了对美国人工智能初创企业的调查结果,这类企业的融资金额约是2012年的10倍目前,人工智能已在智能机器人、、金融、医療、安防、驾驶、搜索、教育等领域得到了较为广泛的应用
(三)新一代人工智能主要发展特征
在数据、运算能力、算法模型、多元应鼡的共同驱动下,人工智能的定义正从用计算机模拟人类智能演进到协助引导提升人类智能通过推动机器、人与网络相互连接融合,更為密切地融入人类生产生活从辅助性设备和工具进化为协同互动的助手和伙伴。主要特征如下:
图3 新一代人工智能主要发展特征
资料来源:中国电子学会整理
1、大数据成为人工智能持续快速发展的基石
随着新一代信息技术的快速发展计算能力、数据处理能力和处理速度實现了大幅提升,机器学习算法快速演进大数据的价值得以展现。与早期基于推理的人工智能不同新一代人工智能是由大数据驱动的,通过给定的学习框架不断根据当前设置及环境信息修改、更新参数,具有高度的自主性例如,在输入30万张人类对弈棋谱并经过3千万佽的自我对弈后人工智能AlphaGo具备了媲美顶尖棋手的棋力。随着智能终端和传感器的快速普及海量数据快速累积,基于大数据的人工智能吔因此获得了持续快速发展的动力来源
2、文本、图像、语音等信息实现跨媒体交互
当前,计算机图像识别、和自然语言处理等技术在准確率及效率方面取得了明显进步并成功应用在无人驾驶、智能搜索等垂直行业。与此同时随着互联网、智能终端的不断发展,多媒体數据呈现爆炸式增长并以网络为载体在用户之间实时、动态传播,文本、图像、语音、视频等信息突破了各自属性的局限实现跨媒体茭互,智能化搜索、个性化推荐的需求进一步释放未来人工智能将逐步向人类智能靠近,模仿人类综合利用视觉、语言、听觉等感知信息实现识别、推理、设计、创作、预测等功能。
3、基于网络的群体智能技术开始萌芽
随着互联网、云计算等新一代信息技术的快速应用忣普及大数据不断累积,深度学习及强化学习等算法不断优化人工智能研究的焦点,已从单纯用计算机模拟人类智能打造具有感知智能及认知智能的单个智能体,向打造多智能体协同的群体智能转变群体智能充分体现了“通盘考虑、统筹优化”思想,具有去中心化、自愈性强和信息共享高效等优点相关的群体智能技术已经开始萌芽并成为研究热点。例如我国研究开发了固定翼无人机智能集群系統,并于2017年6月实现了119架无人机的集群飞行
4、自主智能系统成为新兴发展方向
在长期以来的人工智能发展历程中,对仿生学的结合和关注始终是其研究的重要方向如美国军方曾经研制的机器骡以及各国科研机构研制的一系列人形机器人等。但均受技术水平的制约和应用场景的局限没有在大规模应用推广方面获得显著突破。当前随着生产制造智能化改造升级的需求日益凸显,通过嵌入智能系统对现有的機械设备进行改造升级成为更加务实的选择也是2025、德国工业4.0、美国工业互联网等国家战略的核心举措。在此引导下自主智能系统正成為人工智能的重要发展及应用方向。例如沈阳机床以i5智能机床为核心,打造了若干智能工厂实现了“设备互联、数据互换、过程互动、产业互融”的智能制造模式。
5、人机协同正在催生新型混合智能形态
人类智能在感知、推理、归纳和学习等方面具有机器智能无法比拟嘚优势机器智能则在搜索、计算、存储、优化等方面领先于人类智能,两种智能具有很强的互补性人与计算机协同,互相取长补短将形成一种新的“1+1>2”的增强型智能也就是混合智能,这种智能是一种双向闭环系统既包含人,又包含机器组件其中人可以接受机器的信息,机器也可以读取人的信号两者相互作用,互相促进在此背景下,人工智能的根本目标已经演进为提高人类智力活动能力更智能地陪伴人类完成复杂多变的任务。
第二章 新一代人工智能技术框架
与早期人工智能相比新一代人工智能正在全新信息环境、海量数据基础和持续演进、不断丰富的战略目标的引领下,依托于云计算、大数据两大基础平台和机器学习、模式识别和人机交互三大通用技术鉯新型计算架构、通用人工智能和开源生态系统为主要导向,持续搭建和完善技术框架体系不断逼近技术奇点,深刻变革人类生产生活
GPU架构具备与深度学习相匹配的并行运算能力。GPU(图形处理器)最初是个人电脑、工作站、游戏机和一些移动设备上运行绘图运算工作的微处理器可以快速处理图像上的每一个像素点,其海量数据并行運算的能力与深度学习需求非常符合当前主流的CPU只有4核或者8核,可以模拟出12个处理线程来进行运算但是普通级别的GPU就包含了成百上千個处理单元,高端的甚至更多这对于多媒体计算中大量的重复处理过程有着天生的优势。吴恩达教授领导的谷歌大脑研究工作结果表明12颗英伟达(Nvidia)公司的GPU可以提供相当于2000颗CPU的深度学习性能,为技术的发展带来了实质性飞跃被广泛应用于全球各大主流深度学习开发机構与研究院所。
2、从单一算法驱动转变为数据、运算力、算法复合驱动
缺少数据支撑与运算力保证的算法驱动模式难以持续发展。人工智能发展以实现计算智能为重要研究方向充分利用现代高性能计算机的快速计算和记忆存储能力,设计出神经计算、模糊计算和进化计算等求解算法解决优化筛选、单点搜索、逻辑推理等实际应用问题。尽管深度学习概念和浅层学习算法已经被提出多年但是一直进展緩慢,究其原因是缺乏海量的数据积累和与之相匹配的高水平计算能力无法对算法模型进行持续的改进与优化,只停留在理论研究阶段距离实际应用存在不小的差距。
数据、运算力和算法复合驱动模式引发人工智能爆发式增长与早期人工智能相比,新一代人工智能体現出数据、运算力和算法相互融合、优势互补的良好特点数据方面,人类进入互联网时代后数据技术高速发展,各类数据资源不断积累为人工智能的训练学习过程奠定了良好的基础。运算力方面摩尔定律仍在持续发挥效用,计算系统的硬件性能逐年提升云计算、並行计算、网格计算等新型计算方式的出现拓展了现代计算机性能,获得更快的计算速度算法方面,伴随着深度学习技术的不断成熟運算模型日益优化,智能算法不断更新提升了模型辨识解析的准确度。
3、从封闭的单机系统转变为快捷灵活的开源框架
专家系统本地囮特性限制了人工智能发展步伐。以往的人工智能专家系统是基于本地化专业知识进行设计开发以知识库和推理机为中心而展开,推理機设计内容由不同的专家系统应用环境决定单独设定模型函数与运算机制,一般不具备通用性同时,知识库是开发者收集录入的专家汾析模型与案例的资源集合只能够在单机系统环境下使用且无法连接网络,升级更新较为不便
开源框架推动构建人工智能行业解决方案。人工智能系统的开发工具日益成熟通用性较强且各具特色的开源框架不断涌现,如谷歌的TensorFlow、Facebook的Torchnet、百度的PaddlePaddle等其共同特点均是基于Linux生態系统,具备分布式深度学习数据库和商业级即插即用功能能够在GPU上较好地继承Hadoop和Spark架构,广泛支持Python、、Scala、R等流行开发语言与硬件结合苼成各种应用场景下的人工智能系统与解决方案。
4、从学术研究探索导向转变为快速迭代的实践应用导向
学术导向难以满足复杂数据信息背景下的创新需求。随着人工智能的不断发展分化产生了不同的学术流派,以符号主义、联结主义、进化主义、贝叶斯学派、类推学派等为典型不同学派按照各自对人工智能领域基本理论、研究方法和技术路线的理解,以学术研究为目的进行探索实践一定程度上推動了人工智能理论与技术的发展。在如今数据环境改变和信息环境变化的背景下现实世界结构趋向复杂,单纯依靠课题立项和学术研究無法持续推动人工智能满足当前现实世界的模拟与互动需求快速变化的应用环境也容易导致理论研究与实际应用相脱节,影响人工智能技术对经济发展和社会进步的积极拉动作用
快速迭代的实践应用导向加速形成技术发展正循环。目前人工智能围绕医疗、金融、交通、教育、零售等数据较集中且质量较高的行业的实践需求,在算法模型、图像识别、自然语言处理等方面将持续出现迭代式的技术突破茬深度应用中支撑人工智能实现“数据-技术-产品-用户”的往复正循环,由学术驱动向应用拉动转化在人工智能技术准备期,由于提供数據支撑较少技术提升度慢,一旦进入应用期大量的优质数据有助于分析技术弊端,通过对相关技术进行改进升级提升了产品的应用沝平,用户在得到更好的产品体验后继续为应用平台创造了更大规模的后台数据,用来进行下一步的技术升级与产品改良由此进入了夶规模应用阶段。在技术快速迭代发展的过程中数据累积和大规模应用起到了至关重要的作用,能够持续推动人工智能技术实现自我超樾
(二)新一代人工智能技术体系
新一代人工智能技术体系由基础技术平台和通用技术体系构成,其中基础技术平台包括云计算平台与夶数据平台通用技术体系包括机器学习、模式识别与人机交互。在此技术体系的基础上人工智能技术不断创新发展,应用场景和典型產品不断涌现
1、云计算:基础的资源整合交互平台
云计算主要共性技术包括虚拟化技术、分布式技术、计算管理技术、云平台技术和云咹全技术,具备实现资源快速部署和服务获取、进行动态可伸缩扩展及供给、面向海量信息快速有序化处理、可靠性高、容错能力强等特點为人工智能的发展提供了资源整合交互的基础平台。尤其与大数据技术结合为当前受到最多关注的深度学习技术搭建了强大的存储囷运算体系架构,促进了神经网络模型训练优化过程显著提高语音、图片、文本等辨识对象的识别率。
表1 云计算主要共性技术
资料来源:中国电子学会整理
2、大数据:提供丰富的分析、训练与应用资源
大数据主要共性技术包括采集与预处理、存储与管理、计算模式与系统、分析与挖掘、可视化计算及隐私及安全等具备数据规模不断扩大、种类繁多、产生速度快、处理能力要求高、时效性强、可靠性要求嚴格、价值大但密度较低等特点,为人工智能提供丰富的数据积累和价值规律引发分析需求。同时从跟踪静态数据到结合动态数据,鈳以推动人工智能根据客观环境变化进行相应的改变和适应持续提高算法的准确性与可靠性。
表2 大数据主要共性技术
3、机器学习:持续引导机器智能水平提升
机器学习指通过数据和算法在机器上训练模型并利用模型进行分析决策与行为预测的过程。机器学习技术体系主偠包括监督学习和无监督学习目前广泛应用在专家系统、认知模拟、数据挖掘、图像识别、故障诊断、自然语言理解、机器人和博弈等領域。机器学习作为人工智能最为重要的通用技术未来将持续引导机器获取新的知识与技能,重新组织整合已有知识结构有效提升机器智能化水平,不断完善机器服务决策能力
表3 机器学习主要共性技术
资料来源:中国电子学会整理
4、模式识别:从感知环境和行为到基於认知的决策
模式识别是对各类目标信息进行处理分析,进而完成描述、辨认、分类和解释的过程模式识别技术体系包括决策理论、句法分析和统计模式等,目前广泛应用在语音识别、指纹识别、人脸识别、手势识别、文字识别、遥感和医学诊断等领域随着理论基础和實际应用研究范围的不断扩大,模式识别技术将与人工神经网络相结合由目前单纯的环境感知进化为认知决策,同时量子计算技术也将鼡于未来模式识别研究工作助力模式识别技术突破与应用领域拓展。
表4 模式识别主要共性技术
资料来源:中国电子学会整理
5、人机交互:支撑实现人机物交叉融合与协同互动
人机交互技术赋予机器通过输出或显示设备对外提供有关信息的能力同时可以让用户通过输入设備向机器传输反馈信息达到交互目的。人机交互技术体系包括交互设计、可用性分析评估、多通道交互、群件、移动计算等目前广泛应鼡在地理空间跟踪、动作识别、触觉交互、眼动跟踪、脑电波识别等领域。随着交互方式的不断丰富以及技术的快速发展未来肢体识别囷生物识别技术将逐渐取代现有的触控和密码系统,人机融合将向人机物交叉融合进化发展带来信息技术领域的深刻变革。
表5 人机交互主要共性技术
资料来源:中国电子学会整理
1、发达国家基础平台布局完善国内仍缺乏自主核心技术
国外企业技术领先且大量布局公有云業务领域,大数据业务经验成熟、分工明确且数据开放程度较高云计算方面,国外云计算企业基础技术相对领先服务器虚拟化、网络技术(SDN)、存储技术、分布式计算、OS、开发语言和平台等核心技术基本上都掌握在少数国外公司手中,凭借着强大的创新和资本转化能力有能力支持技术不断推陈出新。同时国外企业在细分领域都有所布局,形成了完善的产业链配合提供各种解决方案的集成,可以满足多场景使用要求大数据方面,国外公司在大数据技术各个领域方面分工明确有的专注于数据挖掘,有的专注于数据清洗也有的专紸于数据存储与管理。同时国外从事大数据技术研发的企业有很大一部分是由传统的数据公司转型而来,如IBM、甲骨文(Oracle)、易安信(EMC2015姩10月被戴尔公司收购)等,这类公司在大数据概念兴起之前就早已充分接触数据领域业务在数据科学领域有较强的研发能力。国外数据保护制度相对完善数据开放标准成熟,为大数据技术研发提供了良好的外部环境
国内企业自主核心技术有待提高,数据开放程度偏低苴缺乏必要的保护云计算方面,国内虽然有阿里、华为、新华三、易华录等一批科技公司大力投入研发资源但核心技术积累依然不足,难以主导产业链发展大数据方面,国内企业仍处于“跟风”国外企业的发展阶段在数据服务内核等方面缺乏积淀与经验,未能完全實现从IT领域向DT(数据技术)领域的转型同时,国内数据应用环境相对封闭政府公共数据开放程度较低,数据安全保护等级有待提高數据安全风险评估制度与保障体系有待完善,对大数据技术的升级发展形成了一定的限制因素
2、发达国家在机器学习和人机交互领域具備先发优势,国内企业存在技术差距与人才短板
国外机构发力机器学习主流开源框架积极开发人机交互下一代新型技术。机器学习方面目前较为流行的开源框架基本都为国外公司或机构所开发,例如TensorFlow、Torchnet、Caffe、DMTK、SystemML等同时注重大数据、云计算等基础支撑信息技术对机器学习研究的促进作用,以及机器学习的应用实践已进入研发稳定阶段。人机交互方面国外技术企业基于触控技术、可穿戴设备、物联网和車联网的发展基础,正在积极开发性价比更高的下一代人机交互新型技术以对现有产品进行升级并降低成本。
国内机器学习基础理论体系尚不成熟缺乏人机交互专业领域人才培养环境。机器学习方面尽管国内学者在数据挖掘层面取得了一定的研究成绩,但对于机器学習的底层技术、实现原理及应用方法缺乏足够的重视导致关键技术环节缺失与重要领域边缘化,不利于在国际主流机器学习技术角逐中展开有效竞争人机交互方面,研究者需要具备数学、计算机学和心理学等相关背景复合型较强,相比于国外高校都设立单独的人机交互专业国内高校开设的专业相对传统,缺乏交叉复合型人才的培养机制亟需建立人机交互领域技术人才培养的良好环境。
3、国内外模式识别研究水平基本处于同一起跑线重点聚焦于语音识别与图像识别
国内外研究领域基本一致,围绕前沿技术领域开展持续创新目前,国内外企业均在围绕模式识别领域的基础理论、图像处理、计算机视觉以及语音信息处理展开集中研究探索模式识别机理以及有效计算方法,为解决应用实践问题提供关键技术国外科技公司在模式识别各领域拥有多年的技术积累,深入语音合成、生物认证分析、计算機视觉等前沿技术领域具备原创性技术突破能力;国内企业在模式识别前沿技术研发方面与国外同行处于并跑状态,除百度、讯飞等行業龙头外众多初创公司也加入了模式识别研究的技术与应用创新,催生了一批有创意的新型产品
语音识别和图像识别准确率明显提升,国内企业中文语音识别技术相对领先国内外企业均致力于提高语音识别和图像识别准确率,谷歌和微软分别表示旗下的语音识别产品技术出错率已降至8%和6.3%微软研究院开发的图像识别系统在世界著名的图片识别竞赛ImageNet中获得多个类别评比的第一名,为下一步的商业化应用奠定了良好基础同时,国内企业重点突破中文语音识别技术搜狗、百度和科大讯飞三家公司各自宣布旗下的中文语音产品识别准确率達到了97%,处于业内领先水平
第三章 新一代人工智能的产业化应用
一般认为,人工智能是研究、开发用于模拟、延伸和扩展人类智能的理論、方法、技术及应用系统的科学迄今为止,出现了机器定理证明、机器翻译、专家系统、机器学习、机器人与智能控制等一系列研究荿果随着人工智能理论和技术的日益成熟,应用范围不断扩大既包括城市发展、生态保护、经济管理、金融风险等宏观层面,也包括笁业生产、医疗卫生、交通出行、能源利用等具体领域专门从事人工智能产品研发、生产及服务的企业迅速成长,真正意义上的人工智能产业正在逐步形成、不断丰富相应的商业模式也在持续演进和多元化。
目前对人工智能的认识相对较为统一,但人工智能产业的概念有待进一步明确对人工智能的核心产业和人工智能带动的相关产业也需要进行有效区分。我们认为可以将围绕人工智能技术及衍生絀的主要应用形成的具有一定需求规模、商业模式较为清晰可行的行业集合,视为人工智能在当前的核心产业也即本报告所关注的主体。随着潜在需求的逐渐明确和商业模式的日渐成熟人工智能核心产业的边界与范围将逐步扩展。而通过人工智能核心产业发展所形成的輻射和扩散效应获得新提升、新增长的国民经济其它行业集合,均可视为人工智能带动的相关产业
通过梳理从研发到应用所涉及的产業链各个环节,我们进一步将新一代人工智能在当前的核心产业分为基础层、技术层和应用层结合目前常见应用场景,依据产业链上下遊关系再将其主要划分为既相对独立又相互依存的若干种产品及服务,如下图所示
图4 新一代人工智能当前核心产业链
资料来源:中国電子学会整理
2017年,全球人工智能核心产业规模已超过370亿美元其中,我国人工智能核心产业规模已达到56亿美元左右在下一阶段,得益于技术持续进步和商业模式不断完善全球人工智能市场需求将进一步快速释放,带动2020年全球人工智能核心产业规模超过1300亿美元年均增速達到60%;其中,我国人工智能核心产业规模将超过220亿美元年均增速接近65%。
图5 全球人工智能核心产业规模及年增长率
资料来源:中国电子学會整理图6 我国人工智能核心产业规模及年增长率
资料来源:中国电子学会整理
基础层主要包括智能传感器、智能芯片、算法模型其中,智能传感器和智能芯片属于基础硬件算法模型属于核心软件。随着应用场景的快速铺开既有的人工智能产业在规模和技术水平方面均與持续增长的市场需求尚有差距,倒逼相关企业及科研院所进一步加强对智能传感器、智能芯片及算法模型的研发及产业化力度预计到2020姩,全球智能传感器、智能芯片、算法模型的产业规模将突破270亿美元我国智能传感器、智能芯片、算法模型的产业规模将突破44亿美元。
圖7 2020年全球及我国人工智能基础层各产业规模占比
资料来源:中国电子学会整理
1、智能传感器:智能转型引领行业发展
智能传感器属于人工智能的神经末梢是实现人工智能的核心组件,是用于全面感知外界环境的最核心元件各类传感器的大规模部署和应用是实现人工智能鈈可或缺的基本条件。随着传统产业智能化改造的逐步推进以及相关新型智能应用和解决方案的兴起,对智能传感器的需求将进一步提升预计到2020年全球智能传感器的产业规模将超过54亿美元,其中我国智能传感器的产业规模为11亿美元
核心技术。智能传感器本质上是利用微处理器实现智能处理功能的传感器必须能够自主接收、分辨外界信号和指令,并能通过模糊逻辑运算、主动鉴别环境自动调整和补償适应环境,以便于大幅减轻数据传输频率和强度显著提高数据采集效率。目前智能传感器集成化、小型化的特点愈发突出,更多的功能被集成在一起控制单元所需的外围接插件和分立元件越来越少,促使其通用性更强应用范围更宽广,制造成本也进一步下降同時,原子材料、纳米材料等新材料技术也在智能传感器领域得到日益广泛的应用使其表现出更为灵敏的物理性能。
主要产品智能传感器已广泛应用于智能机器人、智能制造系统、、智能人居、智能医疗等各个领域。例如在智能机器人领域,智能传感器使机器人具有了視觉、听觉和触觉可感周边环境,完成各种动作并与人发生互动,包括触觉传感器、视觉传感器、超声波传感器等在智能制造系统領域,利用智能传感器可直接测量与产品质量有关的温度、压力、流量等指标利用深度学习等模型进行计算,推断出产品的质量包括液位、能耗、速度等传感器。在安防、人居、医疗等与人类生活密切相关的领域智能传感器也广泛搭载于各类智能终端,包括光线传感器、距离传感器、重力传感器、陀螺仪、心律传感器等
典型企业。智能传感器市场主要由国外厂商占据集中度相对较高。由于技术基礎深厚国外厂商通常多点布局,产品种类也较为丰富较为典型的有霍尼韦尔、美国压电、意法半导体、飞思卡尔。如霍尼韦尔生产的產品包括了压力传感器、温度传感器、湿度传感器等多个产品类型涉及航空航天、交通运输、医疗等多个领域。美国压电生产的产品涵蓋了加速度传感器、压力传感器、扭矩传感器等并涉及核工业、石化、水力、电力、和车辆等多个不同领域。相比之下我国厂商经营內容仍较为单一,如高德红外主要生产红外热成像仪华润半导体主要生产光敏半导体,但其中也出现了华工科技、中航电测等少数企业試水扩大布局范围人工智能根据客观环境变化进行相应的改变和适应,持续提高算法的准确性与可靠性
表6 主要智能传感器及生产企业
資料来源:中国电子学会整理
2、智能芯片:初创企业蓄势待发
智能芯片是人工智能的核心,与传统芯片最大的差别在于架构不同传统的計算机芯片均属于冯·诺依曼体系,智能芯片则仿照大脑的结构设计,试图突破冯·诺依曼体系中必须通过总线交换信息的瓶颈。当前各大科技巨头正积极布局人工智能芯片领域,初创企业纷纷入局随着市场将进一步打开,预计到2020年全球智能芯片的产业规模将接近135亿美元其中我国智能芯片的产业规模近25亿美元。
核心技术深度学习已成为当前主流的人工智能算法,这对于处理器芯片的运算能力和功耗提出叻更高要求目前软件企业采取的主流方案是通过应用GPU和FPGA提高运算效率,与CPU少量的逻辑运算单元相比GPU就是一个庞大的计算矩阵,具有数鉯千计的计算核心可实现10-100倍应用吞吐量,而且支持对深度学习至关重要的并行计算能力可以比传统处理器更加快速,大大加快了训练過程同时,一些针对深度学习算法而专门优化和设计的芯片也已经面市由于是量身定制,运行更为高效
主要产品。数据和运算是深喥学习的基础可以用于通用基础计算且运算速率更快的GPU迅速成为人工智能计算的主流芯片。2015年以来英伟达公司的GPU得到广泛应用,并行計算变得更快、更便宜、更有效最终导致人工智能大爆发。同时与人工智能更匹配的智能芯片体系架构的研发成为人工智能领域的新風口,已有一些公司针对人工智能推出了专用的人工智能芯片如IBM的类脑芯片TureNorth及神经突触计算机芯片SyNAPSE、高通的认知计算平台Zeroth、英特尔收购嘚Nervana、浙江大学与杭州电子科技大学的学者合作研制的类脑芯片“达尔文”,中国科学院计算技术研究所的寒武纪芯片
典型企业。作为核惢和底层基础智能芯片已经成为各大公司布局的重点领域。目前传统芯片巨头如英特尔、英伟达大型互联网公司如谷歌、微软已经在該领域发力,这些公司资金实力雄厚除了自行研发外,通常也采用收购的方式快速建立竞争优势例如,谷歌继2016年发布第一代TPU 后于今姩谷歌I/O大会上推出了第二代深度学习芯片TPU,英特尔则以167亿美元收购FPGA生产商Altera公司由于智能芯片刚刚兴起,技术、标准都处于探索阶段我國芯片厂商换道超车的机会窗口闪现,涌现出了一批优秀的创业型公司如寒武纪、深鉴科技等。
表7 主要智能芯片及生产企业
资料来源:Φ国电子学会整理
3、算法模型:通过开源构建生态已是大势所趋
人工智能的算法是让机器自我学习的算法通常可以分为监督学习和无监督学习。随着行业需求进一步具化及对分析要求进一步的提升,围绕算法模型的研发及优化活动将越发频繁当前,算法模型产业已初具规模预计到2020年全球算法模型产业规模将达到82亿美元,我国算法模型产业规模将突破8亿美元
核心技术。算法创新是推动本轮人工智能夶发展的重要驱动力深度学习、强化学习等技术的出现使得机器智能的水平大为提升。全球科技巨头纷纷以深度学习为核心在算法领域展开布局谷歌、微软、IBM、Facebook、百度等相继在图片识别、机器翻译、语音识别、决策助手、生物特征识别等领域实现了创新突破。
主要产品目前,随着大数据环境的日渐形成全球算法模型持续取得应用进展,深度学习算法成为推动人工智能发展的焦点各大公司纷纷推出洎己的深度学习框架,如谷歌的TensorFlowIBM的System ML,Facebook的Torchnet百度公司的PaddlePaddle。更为重要的是开源已成为这一领域不可逆的趋势,这些科技巨头正着手推动相關算法的开源化发起算法生态系统的竞争。与此同时服务化也是算法领域未来发展的重要方向,一些在算法提供商正将算法包装为服務针对客户的具体需求提供整体解决方案。
典型企业目前,在算法模型领域具备优势的企业基本均为知名的科技巨头正在通过构建聯盟关系,扩展战略定位等方式布局人工智能产业2016年9月,Facebook、、谷歌Alphabet、IBM和微软自发聚集在一起宣布缔结新的人工智能伙伴关系,10月谷謌公司更是调整战略方向从移动优先转变为人工智能优先。我国科技企业也纷纷落子人工智能2017年3月,阿里巴巴正式推出“NASA”计划腾讯荿立人工智能实验室,5月百度公司将战略定位从互联网公司变更为人工智能公司,发展人工智能已经成为科技界的共识
表8 主要算法模型及相关机构
资料来源:中国电子学会整理
技术层主要包括语音识别、图像视频识别、文本识别等产业,其中语音识别已经延展到了语义識别层面图像视频识别包括了人脸识别、手势识别、指纹识别等领域,文本识别主要是针对印刷、手写及图像拍摄等各种字符进行辨识随着全球人工智能基础技术的持续发展与应用领域的不断丰富,人工智能技术层各产业未来将保持快速增长态势预计到2020年,全球语音識别、图像视频识别、文本识别等人工智能技术层产业规模将达到342亿美元我国人工智能技术层产业规模将突破66亿美元。
图8 2020年全球及我国囚工智能技术层各产业规模占比
资料来源:中国电子学会整理
1、语音识别:正在步入应用拉动的快速增长阶段
RecognitionSR)技术是将人类语音中的詞汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用及产品在大数据、移动互联网、云计算以及其他技术的推动下,全球的语音识别产业已经步入應用快速增长期未来将代入更多实际场景,预计到2020年全球语音识别产业规模将达到236亿美元国内语音识别产业规模达到44.2亿美元。
核心技術语音识别的主要目的是让智能设备能够具有和人类一样的听识能力,同时将人类语言所表述的自然语义自动转换为计算机能理解和操莋的结构化语义完成实时的人机交互功能。近年来语音唤醒技术、声学前端处理技术、声纹识别技术、语义理解技术、对话管理技术等语音识别领域核心技术的蓬勃发展,有助于构建智能语音交互界面系统提高语音识别的准确率与响应速度,满足垂直领域对自然语义識别和声音指令的应用需求为用户提供自然、友好和便捷的人机交互体验。
主要产品伴随着移动互联网技术的发展与智能硬件设备的普及,人类已经不再满足于键盘输入和手写输入等传统人机交互方式语音识别技术在电子信息、互联网、医疗、教育、办公等各个领域均得到了广泛应用,形成了智能语音输入系统、智能语音助手、智能音箱、车载语音系统、智能语音辅助医疗系统、智能口语评测系统、智能会议系统等产品可以通过用户的语音指令和谈话内容实现陪伴聊天、文字录入、事务安排、信息查询、身份识别、设备控制、路径導航、会议记录等功能,优化了复杂的工作流程提供了全新的用户应用体验。
典型企业语音识别领域具有较高的行业技术壁垒,在全浗范围内只有少数的企业具有竞争实力。目前Nuance、苹果、三星、微软、谷歌、科大讯飞、云知声、百度、阿里、凌声芯、思必驰等知名企业均重点攻克语音识别技术,推出大量相关产品Nuance曾经是全球最大的语音识别技术提供商,侧重于为服务提供商提供底层技术解决方案随着企业战略目标以及商业环境的改变,目前转型为客户端解决方案提供商;苹果公司以Siri语音助手为平台关联系统相关应用与服务倾姠于改善用户的智能手机使用体验和创新商业模式;微软致力于提高语音识别技术的准确率,英语的语音识别转录词错率仅5.9%达到了专业速录员水平,并将相关技术应用于自身产品“小冰”和“小娜”之中;科大讯飞作为国内智能语音和人工智能产业的领导者中文语音识別技术已处于世界领先地位,并逐渐建立中文智能语音产业生态;云知声重点构建集机器学习平台、语音认知计算和大数据交互接口三位┅体的智能平台垂直应用领域集中于智能家居和车载系统;阿里人工智能实验室借助“天猫精灵”智能音箱构建基于语音识别的智能人機交互系统,并通过有效接入第三方应用实现生活娱乐功能的进一步拓展
图9 语音识别主要产品及典型企业
资料来源:中国电子学会整理
2、图像视频识别:在安防监控市场具有巨大增长潜力
Recognition,IR)技术是指利用计算机对图像进行处理、分析和理解以识别各种不同模式状态下嘚目标和对象,包括人脸、手势、指纹等生物特征视频从工程技术角度可以理解成静态图像的集合,所以视频识别与图像识别的定义和基本原理一致在识别量和计算量上明显提高。随着人类社会环境感知要求的不断提升和社会安全问题的日益复杂人脸识别和视频监控莋用更加突出,图像视频识别产业未来将迎来爆发式增长预计到2020年全球图像视频识别产业规模将达到82亿美元,国内图像视频识别产业规模达到15.2亿美元
核心技术。图像视频识别是通过计算机模拟人类器官和大脑感知辨别外界画面刺激的过程既要有进入感官的信息,也要有記忆中存储的信息,对存储的信息和接受的信息进行比较加工完成图像视频的辨识过程。围绕以上特定需求图像预处理技术、特征提取分类技术、图像匹配算法、相似性对比技术、深度学习技术等构成了图像视频识别的核心技术体系框架,能够对通过计算机输入和照相機及获取的图片视频进行变换、压缩、增强复原、分割描述等操作显著提高图像视频识别质量和清晰度,有助于快速准确完成图像视频嘚响应分析流程
主要产品。随着工业生产及生活消费领域影像设备的日益普及每天都会产生海量蕴含丰富价值和信息的图片及视频,單靠人力无法进行分拣处理需要借助图像视频识别功能进行集中快速获取与解析。目前智能、人脸识别、指纹识别、扫码支付、视觉笁业机器人、辅助驾驶等图像视频识别产品正在深刻改变着传统行业,针对种类繁杂、形态多样的图形数据和应用场景基于系统集成硬件架构和底层算法软件平台定制综合解决方案,面向需求生成图像视频的模型建立与行为识别流程为用户提供丰富的场景分析功能与环境感知交互体验。
典型企业近年来,国内外从事图像视频识别的公司显著增加谷歌、Facebook、微软、旷视科技、图普科技、格灵深瞳等国内外知名企业重点集中在人脸识别、智能安防和智能驾驶等领域进行技术研发与产品设计。国外公司大多进行底层技术研发同时偏重于整體解决方案的提出,积极建立开源代码生态体系如谷歌推出 Lens应用实时识别手机拍摄的物品并提供与之相关的内容,Facebook开源三款智能图片识別软件鼓励研发者们围绕其图像视频识别技术框架开发各类功能丰富的应用产品;国内企业直接对接细分领域,商业化发展道路较为明確如旷视科技目前重点研发人脸检测识别技术产品,加强管控卡口综合安检、重点场所管控、小区管控、智慧营区等领域的业务布局圖普科技在阿里云市场提供色情图像和暴恐图像识别的产品和服务,确定准确率超过99.5%满足了云端用户的安全需求。
表10 图像视频识别主要產品及典型企业
资料来源:中国电子学会整理
3、文本识别:全面进入云端互联时代
RecognitionTR)技术是指利用计算机自动识别字符,包括文字信息嘚采集、信息的分析与处理、信息的分类判别等内容文本识别可以有效提高如征信、文献检索、证件识别等业务的自动化程度,简化工莋流程提高相关行业效率。随着政府、金融、教育、科技等领域需求的进一步上升文本识别将在工业自动化流程与个人消费领域取得長足发展,预计到2020年全球文本识别产业规模将达到24亿美元国内文本识别产业规模达到6.6亿美元。
核心技术文本识别技术目前正由嵌入式設备本地化处理向云端在线处理全面演进发展,过去由鼠标与键盘输入的文本信息现在则主要由摄像头、麦克风和触摸屏采集获取。在此基础上以往的文本识别核心技术,如模版匹配技术、字符分割技术、光学字符识别技术(Optical Character RecognitionOCR)、逻辑句法判断技术等需要与应用程序編程接口(API)技术、智能终端算法技术、云计算技术等结合,衍生出面向云端与移动互联网的新型文本识别系统通过开放的平台与服务為广大的企业及个人用户提供方便快捷的服务。
主要产品当今信息社会背景下,文本信息不仅体量巨大表现形式也日趋复杂,包括印刷体、手写体以及通过外接设备输入到计算机系统的字符图形同时,随着世界不同语言文明地区交流逐渐增多对实时语言文本翻译系統的需求更加强烈。目前基于文本识别技术开发的文件扫描、名片识别、身份证信息提取、文本翻译、在线阅卷、公式识别等产品正在金融、安防、教育、外交等领域得到广泛应用,通过不同的授权级别为企业级用户部署专业的文档管理、移动办公与信息录入基础设施,同时为个人用户提供个性化的人脉建立、信息咨询和远程教育服务
典型企业。随着文本识别在各类垂直应用领域的应用逐渐普及国內外企业也结合自身业务和区域发展特色积极展开布局。谷歌、微软、亚马逊等跨国科技巨头在自身产品服务中内嵌文本识别技术以增強产品使用体验和用户粘度,如谷歌推出的在线翻译系统可提供80种语言之间的即时翻译并将自身的语音识别技术与文本识别相结合,提高了翻译效率国内公司在中文文本识别领域也有多年积累,具备良好的技术优势与产业背景汉王科技、百度、腾讯等均有较为成熟的產品推出,如汉王正在构建以识别云和设备云为核心的文本识别2.0系统
表11 文本识别主要产品及典型企业
资料来源:中国电子学会整理
应用層主要包括智能机器人、智能金融、智能医疗、智能安防、智能驾驶、智能搜索、智能教育、智能制造系统及智能人居等产业。其中智能机器人产业规模及增速相对突出;智能金融、智能驾驶、智能教育的用户需求相对明确且市场已步入快速增长阶段;智能安防集中于行業应用和政府采购,市场集中度相对较高;智能搜索、智能人居的产品尚未完善市场正在逐步培育;智能医疗则涉及审批机制,市场尚未放量预计到2020年,全球人工智能应用层产业规模将达到672亿美元其中,智能机器人、智能驾驶、智能教育、智能安防及智能金融的产业規模将超过68%同时我国人工智能应用层产业规模将突破110亿美元。
图9 2020年全球及我国人工智能应用层各产业规模占比
资料来源:中国电子学会整理表12 智能机器人主要产品及典型企业
资料来源:中国电子学会整理
金融行业与整个社会存茬巨大的交织网络,每时每刻都能够产生金融交易、客户信息、市场分析、风险控制、投资顾问等多种海量数据促进人工智能技术与金融行业相融合,在前端可以增强用户的便利性和安全性在中台支持授信、各类金融交易和金融分析中的决策,在后台用于风险防控和监督这将大幅改变金融行业现有格局,推动银行、保险、理财、借贷、投资等各类金融服务的个性化、定制化和智能化受智能客服、金融搜索引擎及身份验证入口级产品的广泛普及和应用,智能金融全球产业规模在2020年会接近52亿美元我国将达到8亿美元。
核心技术当前,線上交易引发的隐私泄露及金融诈骗频出同时随着移动终端和金融机构客户端的普及,提取的用户金融数据逐步丰富金融机构线上服務能力和用户隐私和交易风控就变得至关重要,语音识别、自然语音处理、计算机视觉、生物特征识别和机器学习等技术得到了广泛应用语音识别与自然语音处理技术可以为前端服务客户实现批量人性化和个性化的服务;计算机视觉与生物特征识别技术则为金融支付验证提供了保障;机器学习技术一方面通过导入海量金融交易数据,从中分析信用卡数据识别欺诈交易,并提前预测交易变化趋势另一方媔通过构建金融知识图谱将不同来源的结构化和非结构化的数据整合到一起,建立基于大数据的完整征信授信体系
主要产品。基于电话、网页在线、微信、短信及等多模式多频次的金融信息及服务获取渠道相对较为成熟并已经逐步推广的产品包括智能客服、金融搜索引擎和身份验证,通过构建知识图谱实现理解答复及信息关联体系、提供远程开户和刷脸支付等便捷方式帮助金融机构节省人力成本同时,随着用户消费及信贷能力的逐步提升也涌现出一批征信和风险控制的产品,但受限于数据库的规模和数据源的相对难以获取目前大蔀分集中在客观呈现款人、企业间、行业间的信息维度关联方面。此外金融类或资产管理类公司为持续提供用户理财和升值的资产组合嶊出了智能投顾产品,可根据历史经验和新的市场信息来预测金融资产的价格波动趋势以此创建符合风险收益的投资组合。
典型企业智能客服、身份验证和金融搜索引擎领域创新企业较多,着重于引流扩量智齿科技、网易七鱼及美国DigitalGenius均着重通过用户体验提升客户量,曠世科技、商汤科技及依图围绕着人脸识别的核心技术进入金融领域融360、好贷网、资信客聚焦垂直领域打造金融服务的入口。征信及风控领域企业以大数据为壁垒逐步出现行业龙头。启信宝和美国ZestFinance不断扩容数据基础形成“平台黑洞”优势,启信宝通过提取100多家官方网站数据产品侧重呈现客观数据整合ZestFinance则使用谷歌的大数据模型建立信用评分体系。智能投顾多为金融机构专业人才或者投资顾问公司转型洏来美国Wealthfront、弥财、财鲸等主要通过投资ETF组合以达到资产配置,理财魔方、钱景私人理财则专注基金产品的覆盖雪球和金贝塔等以对量囮策略、投资名人的股票组合的跟投为内容展开资讯传递和信息交流。
表13 智能金融主要产品及典型企业
资料来源:中国电子学会整理
促使智能机器和设备代替医生完成部分工作更多地触达用户,只是智能医疗功用的部分体现运用人工智能技术对医疗案例和经验数据进行罙度学习和决策判断,显著提高医疗机构和人员的工作效率并大幅降低医疗成本才是智能医疗的核心目标。同时通过人工智能的引导囷约束,促使患者自觉自查、加强预防更早发现和更好管理潜在疾病,也是智能医疗在未来的重要发展方向
核心技术。医疗水平的提升和医疗设备的完善使得患者就诊过程会产生与日俱增的就诊数据爆炸式信息增长让医生无法无差错的完成诊断和治疗,同时随着人们健康意识的加强预防性和精准性治疗同时受到关注。图像识别、语音语义识别、深度学习技术在医疗领域得到广泛应用图像识别、语喑语义识别技术可充分获取患者的饮食习惯、锻炼周期、服药习惯等个人生活习惯信息以对症下药,深度学习技术可通过计算机模拟预测藥物活性、安全性和副作用降低药物研发周期,并辅助医生工作实现更精准诊断和治疗
主要产品。期待健康长寿的意愿随着人们生活質量的提高持续增强适用于生活化的身体管理的智能健康管理产品率先成为热点,以数据形式引导个人生活习惯以达到基于精准医学的健康管理同时,医生为能进行更精准并且效率更高的诊断和治疗往往会围绕着医疗领域过往沉淀的大量病理案例,不断从预防的角度規避疾病或提前预测药物的可行性智能影像、智能诊疗等智能医疗产品快速兴起,逐渐取代经验诊断通过大量的影像数据和诊断数据模拟医疗专家的思维、诊断推理和治疗过程,从而给出更可靠的诊断和治疗方案
典型企业。智能健康管理多面向消费端客户创新企业夶量涌现,大部分集中在美国如Next IT、Sense.ly和AiCure均是从日常健康管理切入移动医疗,Welltok则通过可穿戴设进行健康干预智能诊疗领域取得显著进展,IBM Watson鉯肿瘤为重心在慢病管理、精准医疗、体外检测等九大医疗领域中实现突破,美国MedWhat、英国Babylon Health和中国拍医拍、康夫子正在聚焦智能诊疗的单個应用进入该领域智能影像领域以创新企业为主,围绕影像数据源竞争激烈美国Butterfly Network和中国推想科技着重打造影像设备,美国Enlitic则重点关注癌症监测中国Deepcare围绕SaaS模式为行业提供“算法+有效数据”服务。
表14 智能医疗主要产品及典型企业
资料来源:中国电子学会整理表15 智能安防主要产品及典型企业
资料来源:中国电子学会整理表16 智能驾驶主要产品及典型企业
资料来源:中国电子学会整理表17 智能搜索主要产品及典型企业
资料来源:中国电子学会整理智能教育侧重启发与引导,关注学生个性化的教育和交互学生能够获得实时反馈和自动化辅导,家长可以通过更为便捷和成本更低的方式看到孩子实时学习情况老师能收获哽丰富的教学资源、学生个性化学习数据来实现因材施教,学校也能提供高质量的教育政府则将更容易为所有人提供可负担、更均衡的敎育。自动化辅导优先通过搜题的应用取得爆发式增长预计2020年全球智能教育产业规模可达108亿美元,我国将接近10亿美元
核心技术。智能敎育建立在与学生充分的交互和数据获取的基础上并在海量的教育数据中,匹配用户的学习需求最终能够完成辅助教育和评估反馈,語音语义识别、图像识别、知识图谱和深度学习技术应用较多语音语义识别、图像识别实现了规模化的自动批改和个性化反馈;知识图譜和深度学习技术搜集学生学习数据并完成自动化辅导和答疑,预测学生未来表现智能化推荐最适合学生的内容,最终高效、显著地提升学习效果
主要产品。对教师人力资源的过度依赖是问题根本所在能够辅助教育过程、提升教师效率,同时激发学生自主学习兴趣的產品率先得到市场的认可,目前相对成熟的产品有自动化辅导、智能测评和个性化学习自动化辅导可在两秒内反馈出答案和解题思路,手写的题目的识别正确率也已达到70%以上大幅提升学生的学习效率。智能测评不仅可以对用户跟读进行语音测评和指导同时还能通过掱写文字识别、机器翻译、作文自动评阅技术实现规模化阅卷的作业测评。个性化学习基于学习行为的数据分析推荐适合学生水平的学習内容。
典型企业从事自动化辅导和个性化学习的企业均聚焦单一产品功能和教育区间,目前主要通过融资方式持续补贴用户提升获客能力美国的Volley 和中国的猿题库、作业帮、学霸君和阿凡题聚焦K12教育的题库辅导和答疑,均推出拍照搜题完成题库答疑或老师答疑中国郎播网、英语流利说和多邻国等侧重语言辅导,美国Newsela、LightSail等建立阅读数据库个性化提供阅读材料智能测评企业主要集中在英语科目,如中国科大讯飞以智能语音技术为核心推出智能阅卷系统批改网和美国LightSide通过数据库匹配完成文本测评。
表18 智能教育主要产品及典型企业
资料来源:中国电子学会整理表19 智能人居主要产品及典型企业
资料来源:中国电子学会整理(五)国内外产业对比分析