百度吴恩达:深度学习能给一个公司带来什么价值

百度吴恩达详解:人工智能和深度学习带来的变革
DoNews 3月23日消息 在2015年中国IT领袖峰会上,百度首席科学家吴恩达表示,人工智能正在促进大量用户、海量数据和优秀产品形成正循环,新的人工智能方法深度学习将为人类就业带来巨大变化。
吴恩达还表示,深度学习带来了巨大价值,并且这种价值将越来越深远。而在深度学习发展的过程中,图像、语音、行为三个领域发生着重大的创新。
人工智能的发展及趋势
吴恩达称,过去几年虽然技术已经取得了巨大的发展,然而人工智能的发展却一度比较低迷和缓慢。而在最近这几年,新的人工智能技术也就是深度学习的出现,让计算机学习人类的神经系统,来更好地解决类似图形识别的问题。
吴恩达介绍,在很多年前,当深度学习这个概念刚刚开始的时候,更多的是使用CPU技术,构建小规模神经元网络,只有100万或1000万的连接。
到了2008年,GPU技术的发展,让连接的数目也发生了巨大的增长。通过手机上、Pad上的GPU硬件,可以帮助你做计算,大家意识到硬件对我们加速深度学习非常重要。我们借助GPU可以构造越来越大的神经元网络。
“再往后,我们看到了更多大规模的发展,像谷歌的深度学习项目,使我们更多地了解相关的知识,我们有了更多的云,更多的CPU来推动相关的发展。”
吴恩达预测,下一阶段的趋势则是要从云技术,或者说仅仅利用纯技术跳到HPC或者叫高性能、超高性能的计算技术。
“比如计算机系统对人脸的识别,比如针对安全的目的,还有保安的目的,这都是在未来会越来越多的应用”,吴恩达称。
据吴恩达透露,目前百度在人脸识别领域和很多其他领域比其他国际上领先的大公司要做得好,百度在人脸识别只有0.3%的错误率。
吴恩达表示,现在的图片识别技术已经可以很好的实现让计算机对一幅图片进行文字场景描述了。现在很多计算机的读图能力已经超过了人眼所见的信息,这些技术给我们开启了无限的可能。比如对服饰的识别和搜索、对老年人的看护等等,可能都是未来的空间。
语音识别将推动物联网革命
进入移动互联网,大家将互联网的使用和手机越来越多的结合起来。过去用键盘、手机键盘来敲字的过程,逐渐演化成用语音来进行沟通,“所以语音识别是一个非常重要的发展方向。”
不过,吴恩达称,大家目前普遍反映在手机上进行语音通信时,如果手机离得比较远效果不是很好,要比较近的时候语音识别才做得比较好。因此,基本上所有做语音识别的公司都在使用非常复杂的方法来改善它的语音系统,突出声音特征。
“我们百度做的是什么事情呢?”吴恩达介绍,百度把所有这些东西用深度学习技术替代掉,很多公司依靠大量的数据,而百度的选择是忘掉那些数据,而是用以万为级别的数据集进行人工智能处理。
“人们之前从来不会想到能利用这么多的数据,我们使用神经元系统以及数据燃料,我们发布了这样一个结果,我们可以极大地提高语音识别的准确性。”
吴恩达表示,目前语音识别率已经可以达到95%,但如果能够达到99%的识别率,在实际场景运用中的用户体验与95%相比将是天壤之别,会彻底改变玩法。
“如果我们能真正做到99%,我们甚至可以把所有手机的接口做重新的设计和修改,使我们自己更加习惯于语音通话指令的发送方式,这可以推动这个领域的革新。你手里的东西将不是传统上的手机了。”
吴恩达认为,除了手机之外,语音识别还将推动物联网的革命,从汽车界面到家用设备,再到可穿戴设备都将发生很多改变。在未来几年时间内,人们将能够和电视通话,和更多的家电通话,将有很多的路由器内置到这些机器当中。
人工智能是下一场工业革命
目前,很多技术公司都能够通过获取到一些大数据,来了解人们在互联网的环境当中产生了什么样的行为,这种技术上的发展让技术企业可以从数据当中挖掘更多的价值。
吴恩达认为,很多行为数据给百度带来的机会,包括人的行为、机器的行为,可能比今天所了解到的还要广得多,而美国、中国和欧洲,现在已经越来越多使用深度学习来了解人的行为,了解机器的行为。“在IT世界当中以及IT世界之外挖掘更多的机会,这也推动了我们未来的成功。”
“深度学习之所以能带来更多的价值,就是因为人们现在可以从越来越多的数据当中受益,获得越来越好的结果,开发越来越多的潜能。”
吴恩达认为,深度学习确实改变着我们的生活,改变着传统的人工智能,使我们最终可以把发动机和燃料的连接做得特别好,把产品、大量用户和海量数据之间的连接做得更加通畅。
吴恩达表示,尽管自己只重点提及了图像、语音和行为三个方面,然而对于人工智能的机会来说远不止这三个方面,在自然语言处理、生物技术等方面,人工智能也有很多东西可以做,这些领域都有创新正在发生,人工智能也可以更多地被应用到机器人的开发。
最后,吴恩达指出,未来的工业革命带来的影响会非常深远。工业革命可以把人们从日常重复繁重的工作当中解放出来,把人性解放出来,把人的思想解放出来,使人们不再成为思想的奴隶。工业革命将会使生产力获得极大的提升。(完)
{{news.title}}三年了,百度深度学习成绩不佳 - 推酷
三年了,百度深度学习成绩不佳
2012年夏季,百度开始开展深度学习工作,并于2013年成立百度深度学习研究院(Institute of Deep Learning,IDL),李彦宏任院长,著名博士余凯任常务副院长。
IDL是百度历史上首个正式成立的前瞻性研究机构,它的建立意味着百度成为了继IBM、谷歌、微软三家企业之后的第四家设立了专门研究机构的企业,成功进入深度学习研究的第一阵营。
不可否认,李彦宏对IDL很用心,不仅让余凯任副院长,还特意从google挖走了行业顶尖的人工智能专家吴恩达,为了吸引全世界最顶尖的人才资源,百度把IDL设在了硅谷,并且计划在2015年年底前达到200人的规模,注资3亿美元。
然而,拥有了资金、人才和百度自身强大的数据链的IDL真的如李彦宏所愿,在语音、人脸识别、全网相似图像搜索等领域实现技术的全面提升,打造成“让计算机像人脑一样智能”的科学研究了吗?
三年了,IDL的表现似乎并不乐观。作弊被抓、人员出走、所宣称的技术上的进步也存在很多质疑,IDL前路几何,目前还不能下定论。
作弊被抓,遭受严重惩罚
ImageNet 比赛是一项备受关注的人工智能标准测试,赢得此项比赛意味着表明了自家企业该领域的领先地位,既能获得名望,也可以获得商业上的好处。为了超过谷歌、微软等竞争对手,百度的深度学习研究团队从日至日的近半年时间内,使用了超过30个帐号向测试服务器提交了至少200次,最终拿到了4.58%的错误率,低于微软的4.94%和谷歌的4.8%。而ILSVRC 明确规定了参赛方每周至多只能提交2次测试,百度的行为被主办方发现之后,ImageNet 官方做出了严厉的惩罚措施:1.百度团队的测试结果完全失效,不能和其他团队进行对比;2.百度在未来12个月内将不得向 ImageNet 提交测试。
如果只是简单把这次作弊归结为百度的好胜心未免太过天真了。百度IDL的计算平台建设是由著名的计算机博弈专家吴韧负责的,其目的是实现互联网服务的终极智能提供高性能计算能力。一旦成功,意味着百度可以在不影响收敛速度的条件下计算速度图像和语音的都可以提升若干倍,在算法领域获得Google难以企及的优势。但是很显然,百度没有做到,这不是吴韧在致歉信中的一个“失误”可以掩饰的,这足以表明百度已经开始急功近利,而他的算法研究这几年并没有实质性的进展。
余凯离职,IDL面临人才危机
余凯是中组部“千人计划”国家特聘专家,于2012年4月加入百度,是IDL的重要创建者。5月22日,他提出离职,并于6月初完成离职。从时间上看,貌似百度方面没有挽留,但是同时也表明了余凯去意已决。余凯写给IDL员工的内部邮件更表明了三个问题:
1、“……同时我也在协助Robin和Andrew,为IDL寻找一位有技术视野和领导力的负责人。……”虽然余凯职位由吴恩达暂代,但是现在IDL还没有找到更合适的负责人,群龙无首,难免人心涣散。
2、余凯在邮件中情深意切的表达了对IDL的爱但是依然毅然离开,虽然对外声称是要独立创业,搞什么“大脑芯片”,但是理论上IDL也是致力于人工智能领域的,与余凯的理想并不冲突,而且百度拥有雄厚的资金和自有的持续而稳定的数据链,又网罗了全球很多高精尖人才,很显然余凯没有离开的理由。那么这次离职,很可能是由于IDL进展不如人意,余凯看不到希望才选择自主创业,当然也有可能是余凯与Robin等人发生了不可调和的冲突。
3、在邮件的最后,余凯这样说“别忘了咱们的约定,说好的限量版自行车呢?还有说好的更酷更实用的图像技术呢?还有说好的Lite版本BaiduEye呢? 还有说好的基于深度学习的QA系统?3D的室内定位和三维建模?哦,还有说好的要在高速上奔跑的自动驾驶车?加油吧,奔跑吧,小伙伴们!!”这足以表明余凯上述所说的一切,IDL都没有做到。所以,与其说余凯离职是为了追逐梦想,倒不如说是心灰意冷,寻求安慰去了。
余凯离职,我想除了他会干什么和他为什么走,大家最关心的应该就是他从百度带走了什么吧!在这方面,目前还没有得到一些实质性线索,但是也可以从一些蛛丝马迹分析一下。首先,余凯曾带领过语音技术团队、深度学习技术团队和图像技术团队,并且取得了不俗的战绩,据了解余凯不仅个人技术过硬而且善于管理,人际关系十分好,所以就算这些团队都和他走也没什么可意外的吧,最重要的是,余凯虽然去创业了但是没有离开人工智能领域,所以这些人也可以继续发挥自己的长处。而且,余凯和吴恩达私交甚好,吴恩达当年是由余凯拉入百度的,虽然他离职的可能性不大,但是他现在暂代余凯的位置,难免不会为余凯的自主创业提供帮助。
IDL三年来未更多取得实质性创新与突破
IDL当初的目标主要是进行深度学习、机器人、自动驾驶、人机交互、3D视觉、图像识别,自然语言理解等方面的研究。
对于由计算机组成的数据处理分析平台而言,如何获取到持续,稳定和真实的数据链为“百度大脑”提供学习素材,将会决定“百度大脑”是否可以真正成长为可以被实际应用的人工智能产品。但是目前来看,对于更为精确的,以个体或自然小团体为参考样本的数据链并未受到更多的重视,因而百度算法提升缺乏坚实的基础。
让李彦宏颇为骄傲的百度深度语音识别实质上也并没有吹嘘的那么好。通常衡量语音识别技术的几个技术指标有准确率、反应时间以及处理性能。目前中文的通用语音连续识别准确率能达到95%,距离业界公认从目前水平提升至99%甚至100%的路还很长。而且环境环境噪声干扰,对语音识别有严重影响,尤其是出现多个人声将对正常识别造成很大干扰,这些问题百度语音识别也没哟做出很大完善。只能说,吴恩达加入之后,这个领域的确有在前进,但绝没有吹嘘得那么多,那些说百度的深度学习已经超过谷歌的说法更是无稽之谈。
总而言之,余凯离职的最后一封邮件说明了一切,那些“说好……呢?”无论是推出的还是没推出的,目前都没有完成和成熟。
已发表评论数()
请填写推刊名
描述不能大于100个字符!
权限设置: 公开
仅自己可见
正文不准确
标题不准确
排版有问题
主题不准确
没有分页内容
图片无法显示
视频无法显示
与原文不一致推荐这篇日记的豆列
······

我要回帖

 

随机推荐