如何评价 Google 发布的 Google Home 智能音响概念股

对文章打分
传谷歌将推出高端智能音箱 - Google Home “Max”
(window.slotbydup=window.slotbydup || []).push({
id: '945055',
container: s,
size: '300,250',
display: 'inlay-fix'
(window.slotbydup=window.slotbydup || []).push({
id: '649316',
container: s,
size: '300,250',
display: 'inlay-fix'
阅读 (21710) 评论 (2)
阅读 (21131) 评论 (2)
阅读 (20092) 评论 (17)
阅读 (45364) 评论 (6)
阅读 (31162) 评论 (6)
阅读 (28604) 评论 (10)
Advertisment ad adsense googles&p&小爱能够成功,是因为雷军在2014年就开始布局小米生态链,布局智能家居。之前智能家居炒概念的时候,真正走下来,走出规模的也就小米了。人工智能和机器学习的介入,会让小米锦上添花。京东和阿里,甚至亚马逊的智能音响设备,都不如小米的这个还没有正式上市的产品,能够立竿见影的让一般家庭变成智能家庭。而这全靠小米所有的生态链产品作为支撑,而这些,不管是阿里还是京东,甚至是亚马逊都不具备。就算阿里奋起直追,小米也已经走的太远。&/p&&p&甚至很可能,京东和阿里的智能设备,最终因为没有足够多的设备支持而昙花一现。就像智能电视,智能盒子,老大还是小米。&/p&&p&值得注意的是,这些都是2014甚至2014年之前,雷军布的局。&/p&&p&&br&&/p&&p&为什么小米生态链新零售开始发威,14年声称要做全球生态的乐视倒闭了,提出所谓智能计划全线对抗小米的魅族依然是others,阿里、华为也在做智能产品结果却不尽人意,人工智能号称国内最强的百度,还需要靠卖贴吧苟活。&/p&&p&简单来说就是方向问题。不知道自己要做什么,想做什么,需要怎么做。&/p&&p&雷军从小米创办之初,一直在强调硬件软件和服务。小米的核心思想一直是提高行业效率,利用互联网思维砍掉中间商,成本定价,做感动人心的好产品。这么多年初心未变,小米也在不断践行这一信条。到后来的智能家居,新零售,都是从小米的核心发出的枝条,小米模式就是一个树形结构,从核心出发,开放包容布局更大的市场。后来的小米生态链,智能家居,小米新零售,都是从小米的核心中顺其自然生长出来的。也是别的厂家根本难以复刻和撼动的。核心未变,枝节的调整,产品线的增加和减少,都不会影响小米继续茁壮的发展。&/p&&p&手机是移动互联网的入口,是智能家庭的遥控器,这是雷军进入这个行业时就提出的概念。很明显,雷军已经在思考智能家庭的未来,并且已经开始一步步的布局。而这个时候,友商看到的只是小米手机卖的火,卖手机是风口,然后一堆人冲进来,做手机,做rom,想要复刻他们理解的小米模式。结果就是这些企业一个个的倒掉,除了有庞大资金实力和渠道优势的同行能够幸存。小米仍然是小米,朝着自己的布局往前走,而所谓的的“造手机的”风口,风停了,该死的,就得死。&/p&&p&14年小米如日中天的时候,雷军开始了智能家居的布局,而同一时代,借着小米风口崛起的魅族,甚至提出了自己的所谓智能家居联盟,要全线死磕小米。苹果,谷歌和一些造穿戴设备的公司也开始欣欣向荣。结果,智能家庭,可穿戴设备的风潮一过,走出来的还是小米。&/p&&p&现如今,亚马逊率先推出的智能音箱风靡一时,仅仅是停留在手机和电脑里的语音助手开始和手机电脑之外的世界产生了联系。阿里京东顺势而为,也赶紧退出了自己的智能音箱产品,在可见的未来,百度和华为也有可能推出自己的类似产品。但是最终留下来的, 也是只有小米。&/p&&p&大的企业,诸如阿里和华为,甚至苹果,有大企业的毛病。他们有雄厚的资金和影响力,使的他们认为,可以用资金和影响力介入每一个市场,从而不愿意做小事情,要么打算做一整套解决方案,一次做出整个生态系统,要么就打算等市场成熟了,抄袭也好,跟随也好,甚至是直接收购,迅速成为行业老大。但是,智能家庭涉及的领域,产品太多,除了“能自己生产全部产品的百货商店”没有人可以直接成为老大,苹果虽然有钱,要么推出行业标准,利用核心硬件强制其他外围企业和产品接入它的系统,要不然想靠自己做一套智能家庭仍然是由难度的。除非苹果或者阿里能够控制电冰箱、洗衣机、扫地机、台灯、马桶、电饭煲、电动牙刷等等所有的家居生活用品的生产企业。这显然不可能。另外一个,大企业也不会去专心做一件和自己主要业务无关的小事,例如去生产一个智能插座。原因是很显然的,甚至不需要去说明。&/p&&p&但是,小米和小米生态链却愿意做一些小事。小米能成为智能家居的巨头,正是因为他愿意做每一件小事。小米之前做智能插座,做智能灯泡,被人说是不务正业,甚至嘲笑小米做个破插座还敢说自己做智能家庭。当时小米做路由器,要做家庭的控制中心时,聪明人早就看出来小米要打造一整套互联互通的生态系统,而无知的还在黑小米手机信号不好,路由器一样垃圾。小米一直有自己的主线,而且从来未曾改变。现在,阿里京东跟着亚马逊做一个智能音箱玩玩票的时候,小米帝国已经开始浮出水面。&/p&&p&很多人想智能家居应该是像科幻片给人的感受一样,太cool,太震撼。但是,就在小米步步为营建立生态链的时候,未来已来。&/p&
小爱能够成功,是因为雷军在2014年就开始布局小米生态链,布局智能家居。之前智能家居炒概念的时候,真正走下来,走出规模的也就小米了。人工智能和机器学习的介入,会让小米锦上添花。京东和阿里,甚至亚马逊的智能音响设备,都不如小米的这个还没有正式上…
我对Echo的SmartHome功能尝试的比较多。家里有智能窗帘,开关,插座(控制各种电器),灯泡,甚至安防系统和门锁。都和ifttt连了起来,可以通过Siri和Alexa进行控制(除了门锁只读,否则你跑我家楼下喊一嗓子门就开了还搞个屁。。)。主要感受就是,啊,好方便。以前做智能家居,感觉主要分成四个阶段:&br&&ul&&li&一开始用的是app。要开个灯得掏出手机,打开app,等加载完成,找到要控制的灯,点一下。这么折腾一遍半分钟过去了。我特码还不如走过去,把灯打开只要一半时间。&br&&/li&&li&后来学会了用ifttt + workflow + launch center。从屏幕顶端划出today widget,半秒。点一下相关的按钮,一两秒搞定(见下图左)。这才有了点智能家居的意义。但有时候还是不爽啊。比如周末赖床,看着到中午了想开窗帘让太阳进来。找半天手机,解锁,找按钮,虽然其实也不慢,但人总是懒惰的不是?要能在床上叫“老婆帮我把窗帘打开”,窗帘就开了,多好。&/li&&/ul&&img src=&/b9f84c12cdcea_b.jpg& data-rawwidth=&1200& data-rawheight=&1067& class=&origin_image zh-lightbox-thumb& width=&1200& data-original=&/b9f84c12cdcea_r.jpg&&&ul&&li&说到老婆,自然就想到了用Siri。支持HomeKit的东西有不少,Hue, August等等都能直接用Siri调用(见上图右)。用了一段时间,感觉不是很爽。一方面如果手机在口袋里,需要把它拿出来,按下按钮,说话,才能调用功能。这有时候还不如直接按按钮方便。一方面如果手机在充电,虽然可以直接用Hi Siri触发Siri,但离得远了,Siri经常听不见或者听错。还是得走过去。实在蛋痛。&/li&&li&好在有了Alexa二老婆!Amazon这个设计实在不错,时刻听你说话,不用按按钮触发。同时麦克风设计的相当赞,我不论在哪个房间,Alexa都可以听见。有时候离得实在太远,只要稍微提高一点声音就好了。这下躺床上了才发现厨房灯没关,只要说声二老婆帮朕关灯,她就嗻地一声给你办了。或者早上赖床,喊一声Alexa开窗帘,窗帘就开好了。可以随便用命令的语气,还不用跪搓衣板。下面贴了个视频,演示二老婆开窗帘的全过程(视频删掉了中间等待的过程,实际有个延时)。同时可以和ifttt连起来,支持的设备就更多了,比如Wemo这些不服Siri管的设备,Alexa也能治得服服帖帖的。而且可以出一些中(dou)二(bi)向的指令,比如Alexa trigger Ping, Alexa trigger ga, Alexa trigger excited!等等。。&/li&&/ul&&a class=&video-box& href=&///?target=http%3A///v_show/id_XMTcxMzY2OTkyMA%3D%3D.html& target=&_blank& data-video-id=&& data-video-playable=&& data-name=&Alexa Raise Office Blind—在线播放—优酷网,视频高清在线观看& data-poster=&/CCFEE& data-lens-id=&&&
&img class=&thumbnail& src=&/CCFEE&&&span class=&content&&
&span class=&title&&Alexa Raise Office Blind—在线播放—优酷网,视频高清在线观看&span class=&z-ico-extern-gray&&&/span&&span class=&z-ico-extern-blue&&&/span&&/span&
&span class=&url&&&span class=&z-ico-video&&&/span&/v_show/id_XMTcxMzY2OTkyMA==.html&/span&
&/a& 总而言之,在智能家居方面,Echo是个非常理想的的产品。目前除了ifttt偶尔延时比较厉害以外,我还没发现什么缺点。用来当大内总管非常合适。&br&echo还有个不是太多人知道的功能,就是你可以事先设置一些联系人,在紧急情况(比如老人摔倒了站不起来)下可以通过语音alexa alert all my friends等等来让echo通知你的朋友。这对于独居老人是非常贴心的。&br&&br&更多关于智能家居的介绍,欢迎移步我的文章:&a href=&/p/& class=&internal&&自己动手改造智能家居生活 - grapeot的文章 - 知乎专栏&/a&
我对Echo的SmartHome功能尝试的比较多。家里有智能窗帘,开关,插座(控制各种电器),灯泡,甚至安防系统和门锁。都和ifttt连了起来,可以通过Siri和Alexa进行控制(除了门锁只读,否则你跑我家楼下喊一嗓子门就开了还搞个屁。。)。主要感受就是,啊,好…
&p&以我的一点经验,这产品要火,可以依此计行事:&/p&&p&①先请几个大手画师,搞几套妹子人设,画风一定要好看,设计好性格台词,再去请几个声优,多配几套御姐、傲娇、冰山、萝莉等等等的声线;&/p&&p&②再然后编故事,不断扩展设定和故事,出漫画,出广播剧,记得po到B站去。微博开几个账号天天卖萌撒娇圈粉;&/p&&p&③然后卖胶,卖插画,卖抱枕,卖各种周边;&/p&&p&④把live2d立绘加进米家APP,放到小米电视和小米手机上,争取放到steam上;&/p&&p&⑤大力发展小米VR;&/p&&p&⑥小米商城再上架个3d全息投影机,定价一定要贼贵,最好拿九号平衡车当底座,实在不行扫地机器人改改也凑合;&/p&&p&⑦最后把她们印到所有智能家居产品上,比普通版加价20%,初回限定加50%送一堆周边,套装送塑料小人,一家里集齐某个妹子全套开启特殊台词特殊着装,两个妹子间可以开启互动台词。&br&然后逢年过节出个限定语音限定立绘;&/p&&p&⑧各种家居产品也要娘化,上线智能家居collection抽卡手游,可以抽卡,也可以直接去买相应产品获得兑换码,越贵的产品稀有度要越高。&/p&&p&&br&&/p&&p&根据评论区提醒,新产品首发要有预约特典和初回限定。&/p&&p&⑨出日语版,进军海外。&/p&&p&&br&&/p&&p&不赚翻你来找我。&/p&&p&————————————&/p&&p&⑩暗搓搓去和I社合作,人工少女5honeyselect2支持小米VR,找人假装民间人士上传高还原人物存档。&br&xx杯厂商也要合作。&br&娃娃厂商也是,暗中合作。&br&官方打死不认。&br&(以上段落为猫滚键盘打出,本人不知情)&/p&&p&————————————&/p&&p&&br&&/p&&p&&br&&/p&&p&所以说你们小米的工程师不能太实诚,不能说智能家居就智能家居。&/p&&p&天天上B站,当然要多学学怎么赚死宅的钱。&/p&&hr&&p&emmm,感谢 &a class=&member_mention& href=&///people/ea46c93f3bcef48e684de0& data-hash=&ea46c93f3bcef48e684de0& data-hovercard=&p$b$ea46c93f3bcef48e684de0&&@月神&/a& 给补的图&/p&&img src=&/v2-8fa2bcb4d43e_b.png& data-rawwidth=&1080& data-rawheight=&1920& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-8fa2bcb4d43e_r.png&&&p&附微博观光链接:&a href=&///?target=http%3A////FlLEQrzvk& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&微博-小米探索实验室&i class=&icon-external&&&/i&&/a&&/p&
以我的一点经验,这产品要火,可以依此计行事:①先请几个大手画师,搞几套妹子人设,画风一定要好看,设计好性格台词,再去请几个声优,多配几套御姐、傲娇、冰山、萝莉等等等的声线;②再然后编故事,不断扩展设定和故事,出漫画,出广播剧,记得po到B站…
&p&Echo在2014年11月推出,今年6月第三方机构CIRP的统计显示,它的销量已经超过300万台。Echo在推出后并没有立即上市,实际销售时间只有一年左右。考虑到它的销售时长和产品定位,这个销售成绩是很出色的。&/p&&br&&p&除了销量,CIRP还统计了Echo在亚马逊消费者中的认知度。去年3月至12月,Echo的认知度从20%上升至47%,提升了两倍多。&/p&&br&&img src=&/87b5ca0fe43b1881f4beb_b.jpg& data-rawheight=&415& data-rawwidth=&690& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&/87b5ca0fe43b1881f4beb_r.jpg&&&br&&p&难能可贵的是,Echo还拥有非常好的用户口碑。它在亚马逊的页面下拥有超过40000条用户评论,评分达到4.4星。&/p&&br&&p&&b&如何评价Echo?综合上面的销量、用户认知、口碑,可以说,&/b&&b&Echo是一款&/b&&b&成功产品。&/b&&/p&&br&&p&彭博和Business Insider都披露了Echo开发的内幕故事,但没有太多总结Echo成功的原因。在Echo之前,苹果和谷歌都推出智能语音产品,但都不太成功。Echo比苹果、谷歌的产品晚了两三年,但推出后仍能赢得市场,证明亚马逊开发Echo是经过深思熟虑的。&/p&&br&&p&亚马逊的哪些考虑促成了Echo的成功?我认为有三个:&/p&&br&&ol&&li&&b&围绕语音交互设计产品;&/b&&/li&&li&&b&定位于家庭,找对产品的消费环境;&/b&&/li&&li&&b&开放系统,为产品赢来源源不断的第三方服务。&/b&&/li&&/ol&&br&&p&详细描述下这三点。&/p&&br&&p&&b&1. &/b&&b&围绕语音交互设计产品&/b&&/p&&br&&p&如何让用户使用语音服务?苹果、谷歌采用了相同的方案。它们将语音服务整合进手机系统,通过高使用频率的手机来带动用户使用语音服务。&/p&&br&&p&但事实上,这个方案是存在问题的。&b&智能手机拥有非常成熟的输入方案,人机互动?使用输入法就行了。输入法便捷、高效又准确,用户有什么动力去使用语音呢?&/b&研究机构Creative
Strategies调查了300名手机用户,发现62%的安卓用户很少或偶尔使用语音助手,iPhone为70%。&/p&&br&&p&&b&为了“强迫”用户使用语音,亚马逊Echo使用了更取巧的方案——只提供语音一种交互方案。&/b&除了扬声器和麦克风,Echo没有其它交互接口。(亚马逊最初还提供遥控器,用户可以用它来语音操控Echo。但遥控器的使用率很低,很快就被砍掉了。)&/p&&br&&p&Echo对交互的限制保证了语音交互的纯粹性和持续性:用户只能使用语音,不会被其它输入方式带走。习惯养成之后,用户会持续不断地用语音与设备互动。&/p&&br&&p&&b&2. &/b&&b&定位于家庭,找对产品的消费环境&/b&&/p&&br&&p&不过只提供语音交互也有一种风险,如果体验不好的话,用户可能会直接放弃使用。&/p&&br&&p&&b&苹果和谷歌把语音服务装载在手机内,希望通过手机的高频使用来推广语音服务。但问题是,手机作为个人设备,大多数情况下是在公开场合下使用的。公开场合下用语音对手机发号施令,很容易让人犯尴尬症。&/b&&/p&&br&&p&这个结论是有数据支持的。上面提到的Creative
Strategie还调查了手机用户在公开场合下使用语音助手的情况,结果发现安卓用户中,只有12%会在公开场合下使用语音助手;iPhone的比例更低,只有3%。&/p&&br&&p&你看,&b&产品和使用场景没有恰当匹配,使用时很容易让人陷入尴尬,结果就是用户不再用你的产品。&/b&&/p&&br&&p&Echo采用了不同的产品定位,避开了用户使用语音助手的尴尬。它从一开始就定位于家庭设备——体积大,不方便随身携带;没有独立电池,必须连接室内电源才能使用。尽管对着机器说话仍然怪异,但家庭环境缓解了使用压力。因为用户面对的是熟悉的家人而非公共环境里的陌生人。&/p&&br&&p&&b&3. &/b&&b&开放系统,为产品赢来源源不断的第三方服务&/b&&/p&&br&&p&在明确Echo的交互方式和产品定位之后,亚马逊对它进行了针对性的硬件和软件优化。&/p&&br&&p&为了能让用户在家中的任何位置都能唤醒Echo,亚马逊设计了一个名为“ARS”的自动语音识别处理系统。ARS由七个麦克风和一个音频信号过滤系统构成。七个麦克风组成的列阵能让Echo捕捉到环境中的细微声音,音频信号过滤系统过滤掉环境噪音,从而辨别出人声。使用ARS后,即使用户在25英尺(7.62米)之外发出命令,Echo也能够准确识别。&/p&&br&&img src=&/d2f473b15efccd2b27055b_b.png& data-rawheight=&400& data-rawwidth=&534& class=&origin_image zh-lightbox-thumb& width=&534& data-original=&/d2f473b15efccd2b27055b_r.png&&&p&(Echo的7枚麦克风)&/p&&br&&p&识别之后,如何理解用户的语音命令?亚马逊又设计了“关键词识别”系统。Echo收到的语音命令被系统拆分为多个字段,它们与云端储存的关键词模型逐一比对,匹配度最高的部分被认为是用户发出的语音命令。&/p&&br&&p&在先后增加对多款智能家电的支持之后,2015年6月,亚马逊推出了语音服务“Alexa”开发包,正式开放Echo。2015年Echo整合的第三方服务只有14项,今年已经上升至950项。&/p&&br&&p&今年3月,亚马逊又推出两款面向中、低端市场的智能音箱:Tap和Dot。Echo家族设备和服务都在不断壮大。&/p&&br&&p&亚马逊的语音技术开始于2011年。2011年收购语音公司Yap,开始研究语音转文字;2012年收购语音技术公司Evi,强化语音识别在商品搜索上的应用;2013年收购波兰音技术公司Ivona Software,为Kindle Fire平板的文本语音转换功能、语音命令和“Explore by Touch”功能提供了技术支撑。Echo也使用了Ivona Software的技术。&/p&&br&&p&语音是人工智能的核心应用之一,能够用在汽车、通讯、企业服务多个领域。Echo在亚马逊在智能语音市场占据了一席之地,将来在车联网、物联网都大有作为。&/p&
Echo在2014年11月推出,今年6月第三方机构CIRP的统计显示,它的销量已经超过300万台。Echo在推出后并没有立即上市,实际销售时间只有一年左右。考虑到它的销售时长和产品定位,这个销售成绩是很出色的。 除了销量,CIRP还统计了Echo在亚马逊消费者中的认知…
&p&Cortana终于有身体了。可是为什么不是长这样的?&/p&&br&&img src=&/v2-c9faea91e611da01df34052c5acb4df4_b.png& data-rawwidth=&997& data-rawheight=&2048& class=&origin_image zh-lightbox-thumb& width=&997& data-original=&/v2-c9faea91e611da01df34052c5acb4df4_r.png&&
Cortana终于有身体了。可是为什么不是长这样的?
Echo能,其他未必。&br&&br&Echo在美国据说卖的不错,去年下半年至今年春节3M台左右(各路传言我个人归一化后的数据)。为了回答这个问题,需要定义什么是“超级产品”?我不想拿Echo跟iPhone比,iPhone是“神级产品”,三千年一开花,三千年一结果,三千年一成熟,需要日月星辰的造化(扯远了)。超级产品比如Wii,比如Walkman,比如Nest等,这些已经是现象级的产品了,可以开拓一个方向,打开一片蓝海。&br&&br&从这个意义上讲,我认为Echo是超级产品,因为TA把一种新的交互以新的产品形态商业化了,起步还蛮成功。如果你说Google Now & Siri也是新的交互,但其交互方式是为手机这个移动计算设备打造的,其交互方式是基于Touch触屏这个基础交互之上的。Echo首次把语音和自然语言理解的交互以崭新的产品形态呈现给消费者,得到了消费者的认可(截至此时,Echo在亚马逊有36177个评论,4.5颗星)。当然,Echo的尝鲜门槛是极低的,Amazon Prime会员$99就可以,这个价格在国内都是没有门槛的。&br&&br&Echo的产品设计也是及其用心出色的:圆柱形的身体,黑色喷漆,简单大方,符合亚马逊一贯的硬件气质。音量的控制用最直觉的旋钮(yes, Sugr Cube方糖音箱也是这样设计的),旋钮巧妙的与机身融合一体。灯光的反馈配合波束成形和声源定位算法,这是给人十足信心的人机交互设计。通体只有一根圆形电源线从底部开口引出。简洁的可以适配任何房间。声学设计是其最大的挑战,怎么在全向声音采集,音乐的播放和音质之间达到平衡,到目前为止Echo应该是给出了最佳答案,以至于跟随者们就直接抄之。当然,从一个音响产品的角度,Echo还远不能称为一个好的音响,其音质让普通消费者听歌是足够了。Amzon新出的Dot/Tap,一定程度上可以实现Echo全部功能,且可以连接家中已有的各种档次的音响,算是可以部分解决音质的问题。Echo开放API给其他智能家居厂家,可以声控飞利浦的灯等其他产品。相信会有越来越多的厂家加入Echo的平台。Echo最惊艳的是响应速度,真的快,超出预期,及时在国内使用也能做到秒级的响应。这是产品成功的基点。&br&&br&今天恰好有朋友问我为什么Google, Microsoft, Apple没有出Echo&Alexa这样的产品,反倒是AMZN抢先了。我觉得这挺简单,Google, Microsoft和Apple习惯了设设设设计计计计产品(此处强调设计)。他们对产品外观、材质、交互等等的设计强调到了很高的高度,甚至为了设计而设计(以前在MS的时候,工业设计师的地位短短几年迅速提高,在这种环境里面一般产品从水底浮到水面给决策者看到的机会是不大的),而忽略了产品的本质。Amazon向来是一家从不过度设计的公司(Kindle,Fire...),而语音交互类产品也恰恰是一个不需要过度设计的产品。因为你不需要摸TA,甚至不需要看TA(好悲催的产品,是捡来的孩子吗?),有事问他一下就好。在这样一个品类里面,AMZN抢个先机也不奇怪。&br&&br&Echo的硬件赋予了他强健的骨骼和肉体,其实真正的实力在TA的最强大脑Alexa,而且这个大脑是在成长的。目前Alexa还有许多问题(比如无法记忆上下文,知识库狭窄等),比起Google和Siri其实还很幼龄,但我相信开放会让TA快速成长。在AMZN强大的AWS和数据能力加上老贝这个战略偏执狂的支持下,Alexa前途会很光明。&br&&br&很快,估计Google, Microsoft也会以各自的产品形态加入这样的战场,蓝海变红海的速度是不是也要有个类似摩尔定律的公式了?不论如何,历史总是惊人的相似,革掉一个行业命的往往是外来者,不妨简单回顾一下:iPod vs 唱片发行,iPhone vs Nokia。所以音响行业伙伴们和同行们应该都动起来了,Fortune(&a href=&///?target=http%3A////sonos-players-streaming/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Sonos Layoffs: Firm Refocuses on Paid Music Streaming, Voice Tech&i class=&icon-external&&&/i&&/a&)报道过知名Wi-Fi音响品牌Sonos已经在裁员。&br&&br&Echo的产品、设计、逻辑看上去都没有什么大问题,前途光明。就像无人机,VR每个浪潮一样,国内的同行们自然不会放过每一个掘金的机会,一直都有大大小小的公司在这个领域布局。有的玩玩就走了,有的在挂靠各种概念(机器人,智能家居,智能音响),也应该有在认真打磨产品提供体验的。我认为Echo&Alexa类的产品在有中国特色的市场还不够成熟:&br&&br&1. Siri & Google Now在美国已经有极高的使用率,在国内很少。语音输入法也没有被很好的使用。&br&2. 美国中产的居住环境跟国内差别很大,房间的面积、数量,电器的使用情况和习惯差别很大(温控,电控,取暖,车库等)&br&3. 文化习惯的差异,美国人对背景音乐(BGM)需求是比较普遍的,可能是汽车文化导致收音机广泛收听的原因。而中国人的听歌习惯更多是从磁带、CD、专辑、歌单这样演化的。所以Echo更适合在某种电台、频道或者曲风下面连续的播放,而更有针对性(歌手、曲目)等的听歌方式还是适合在屏幕上操作(视觉反馈)。&br&4. (这个是我拿不准的)两边文化的差异,会不会导致人们使用语音产品也有差异。老美普遍爱说(你看《老友记》《The Big Bang Theory》应该会感受到),有什么事就开口说。中国人在儒家文化影响下平均不爱开口。我不知道这种文化差异会不会带来使用语音产品的需求和习惯差异。&br&&br&再加上新产品新形态从美国发源到国内接棒,通常有个时滞效应(当然,这个延迟越来越短),所以国内的Echo应用还需要创新者们积极的探索和思考。&br&&br&补充: 5月18日,Google I/O大会上发布了Google Home,直接对标Amazon Echo的产品&a href=&///?target=https%3A///& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a& 从域名的级别来看,可以算是Google的战略级产品了。从那时至今没有任何动静,让我们拭目以待吧。&br&&br&补充:今日凌晨,Google新硬件发布会终于揭开了Home基本功能的面纱,虽然没有详细说软硬件配置,但100%对标Echo的模仿也算是对Echo的充分致敬和开足火力竞争了。
Echo能,其他未必。 Echo在美国据说卖的不错,去年下半年至今年春节3M台左右(各路传言我个人归一化后的数据)。为了回答这个问题,需要定义什么是“超级产品”?我不想拿Echo跟iPhone比,iPhone是“神级产品”,三千年一开花,三千年一结果,三千年一成熟…
&b&被逼的!&/b&&br&&br&&img src=&/6ea6fdd7c1dc7_b.jpg& data-rawwidth=&500& data-rawheight=&375& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/6ea6fdd7c1dc7_r.jpg&&&br&&br&你看嘛 ~
亚马逊做了一款Echo, 主打远距离语音操控, 控制智能家居设备, 语音服务Alexa, 还开放了设备商接入平台AVS(Amazon Voice Service) 和 开发者平台 ASK(Amazon Skills Kit)。 &a href=&///?target=https%3A///alexa& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Alexa&i class=&icon-external&&&/i&&/a&&br&&br&&img src=&/2cb21fb276dee7bd355c1f_b.jpg& data-rawwidth=&1000& data-rawheight=&1000& class=&origin_image zh-lightbox-thumb& width=&1000& data-original=&/2cb21fb276dee7bd355c1f_r.jpg&&&br&亚马逊在美国市场大肆推广, 广告都做进超级碗了,进了大大小小的店铺和渠道, 销量蹭蹭蹭奔1000w去了(供应链的数据)。。。支撑亚马逊股价的除了AWS就是这货了, 风头尼玛都被这货给抢了, 这谁能忍, 尤其是对于谷歌, 天然的基因做系统+数据服务平台。&br&&br&所以, &b&谷歌坐不住了&/b&。 &br&&br&同样坐不住的还有苹果,微软,Facebook。。。整个硅谷圈都坐不住了, 这背后, 是亚马逊给大家带来的新的启示: Voice Assistant。&br&&br&这或许会开启下一个千亿的市场, 此刻还是蛮荒之地!&br&&br&我们看看这几家大boss手里的牌:&br&&ol&&li&谷歌: Nest;API.AI; &b&Google Home 音箱&/b&; 路由器; Chrome Cast;聊天机器人Allo&/li&&li&微软: 小冰聊天机器人;微软小娜语音助手(已经集成进win 10系统)&/li&&li&亚马逊: Echo系列设备(Echo一代;Tap便携版;Dot缩小版);ALexa服务;TV+平板+Kindle(据说也内置了Alexa服务);Alexa阵营:1000w的智能音箱销量+围绕的大量ASK开发者平台+排队过Alexa认证的大大小小音箱产品&/li&&li&Facebook: facebook messenger AI 平台&/li&&li&苹果: Siri(ios 10可以锁屏是“嘿 siri”唤醒);Airpods; Apple TV/Box;Mac Pro 10.12已经内置了Siri;&/li&&/ol&结论: 谁手里的牌都不差, 此刻还是一片蛮荒之地。。。&br&&br&这是一套围绕&b&“Voice First&语音交互的系统服务&/b&。 比起手机的触屏操作、电脑的按键, 语音交互更快, 解放双手, 让大脑focus的事务的形态描述和需求表达上。 恰恰最难的在于: 语义的理解(NLP)。&br&&br&这部分恰恰是各家服务落地的杀手锏, 也是目前整个产业的瓶颈所在。回想下苹果Siri出来那么久, 此刻的体验还是屎一样。用户拿来调戏它, 也是一种无奈。&br&&br&那么, 亚马逊的ECHO 和 谷歌的Google Home, 能解决这个问题? &br&&br&答案是, 不能! &br&&br&需要新的机器学习平台, 需要更大量的数据模型验证, 需要各种不同类型的性格产品去迭代更新验证市场和消费者。 目前的基于规则的NLP模型, 已经搞了多年, 即便是多轮对话形态, 也无法让计算机去满足人。 而不同性格的产品落地, 缩小固定场景, 优化体验到可用商用, 或许是一个思路。&br&&br&回到谷歌发布的Google Home, 为啥以音箱落地?&br&&br&&b&像素级抄袭&/b&: 亚马逊推出的ECHO是带麦克风阵列的音箱。&br&&img src=&/f2f8edae2c7d395bbe623c_b.jpg& data-rawwidth=&500& data-rawheight=&375& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/f2f8edae2c7d395bbe623c_r.jpg&&&br&&br&音箱已经是非常成熟的产业链, 市面上价格从十几块到几十万不等, 做个音箱没啥难度。 老美喜欢听音乐, 音箱的认知感非常强。 &br&&br&这个产品形态应该是: 可以语音交互(麦克风), 可以播放(speaker),
可以交互(灯 或者 display), 联网。&br&&br&围绕这几个点, 产品就能落地了: 智能音箱。&br&&br&是不是其他厂商也都会推出智能音箱? 或者谷歌后期以智能音箱为重?&br&&br&当然不是!&br&&br&几个领域, 会井喷:&br&&ul&&li&智能家居: 音箱以及其他智能型设备的联动(音箱做为互联网声音的出口)&/li&&li&聊天机器人(Chatbots)服务引导型&/li&&li&可穿戴设备:智能手表;智能耳机(Airpods背后有大学问)&/li&&li&各种APP或者平台&/li&&li&Display: 电视、盒子新的交互形式, 背后服务的整合&/li&&/ul&&br&多说几句NLP平台, 我更看好的是API.AI, 已经被谷歌收购。&br&&br&这个平台的完美形式, 如下(API.AI):&br&&img src=&/964fb3da0bd31e6ff8ddcb_b.png& data-rawwidth=&1556& data-rawheight=&974& class=&origin_image zh-lightbox-thumb& width=&1556& data-original=&/964fb3da0bd31e6ff8ddcb_r.png&&语音识别+语义理解+不同domain实现+语音合成
合成到了一个平台里。&br&&br&他的优势在于, 可以通过conversational UX来设计不同的场景。 把上下文设计
不同领域的服务实现隔离开来。 专注在音乐领域的和专注在外卖服务领域的, 有一天可以把两个场景服务集成进一个产品, 酷吧, 这就是谷歌。&br&&br&看看这个服务以及在多少平台集成:&br&&img src=&/77fe2e246ec99f205bd69e1b0f783f1c_b.png& data-rawwidth=&1530& data-rawheight=&1276& class=&origin_image zh-lightbox-thumb& width=&1530& data-original=&/77fe2e246ec99f205bd69e1b0f783f1c_r.png&&&br&&br&围绕类似的平台, 对话式聊天机器人, 会加速各种产品落地:&br&&img src=&/cb51b20fb33eaf568d2ceb_b.png& data-rawwidth=&690& data-rawheight=&1175& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&/cb51b20fb33eaf568d2ceb_r.png&&&br&(图片出自微博)&br&&br&说到这里, 我看见一脸懵逼的Sonos:&br&&img src=&/d4e252ca6f3f1b40139f9_b.jpg& data-rawwidth=&564& data-rawheight=&335& class=&origin_image zh-lightbox-thumb& width=&564& data-original=&/d4e252ca6f3f1b40139f9_r.jpg&&&br&做wifi音箱的鼻祖, 起个大早赶个晚集。&a href=&///?target=http%3A///news/201506/nvD8DbOicOfEo2uO.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&苹果确认Sonos将于年底前支持Apple Music&i class=&icon-external&&&/i&&/a&&br&&br&还有谷歌花了大价钱收购的Nest:&br&&img src=&/4aa31d23b262dcdb4bfdf1_b.jpg& data-rawwidth=&564& data-rawheight=&403& class=&origin_image zh-lightbox-thumb& width=&564& data-original=&/4aa31d23b262dcdb4bfdf1_r.jpg&&&br&或许很快, 这哥俩的组合拳才是最屌的:&br&&img src=&/4ac9b80ada_b.jpg& data-rawwidth=&474& data-rawheight=&474& class=&origin_image zh-lightbox-thumb& width=&474& data-original=&/4ac9b80ada_r.jpg&&+++++++&br&&img src=&/dc6c067a31e0c82b6f02_b.jpg& data-rawwidth=&574& data-rawheight=&359& class=&origin_image zh-lightbox-thumb& width=&574& data-original=&/dc6c067a31e0c82b6f02_r.jpg&&&br&而电视上的展示形态, 应该是这样:&br&&img src=&/1fbcefdc7b6d_b.jpg& data-rawwidth=&2040& data-rawheight=&1360& class=&origin_image zh-lightbox-thumb& width=&2040& data-original=&/1fbcefdc7b6d_r.jpg&&&br&&br&辣么, 国内的大形势怎么样呢? &br&&br&国内的商业模式更清晰, 商业前景更好, 路不好走, 请持续关注我们。
被逼的! 你看嘛 ~ 亚马逊做了一款Echo, 主打远距离语音操控, 控制智能家居设备, 语音服务Alexa, 还开放了设备商接入平台AVS(Amazon Voice Service) 和 开发者平台 ASK(Amazon Skills Kit)。
亚马逊在美国市场大肆推广, 广告都做进超级碗了,…
Jan.16 更新&br&Echo连接Ifttt控制智能灯泡已经完成。&br&&br&一开始想用HUE,后来觉得也许可以有性价比更高的解决方案,于是在网上找了下,发现小米家的Yeelight 应该也行,而单个智能灯泡的价格只有HUE的1/5不到,实在是我等贫苦百姓的首选。&br&&br&&img data-rawwidth=&1707& data-rawheight=&1280& src=&/v2-71c3d3c36db3b5f3c14a14ba8c8a07b6_b.jpg& class=&origin_image zh-lightbox-thumb& width=&1707& data-original=&/v2-71c3d3c36db3b5f3c14a14ba8c8a07b6_r.jpg&&&br&&br&&br&操作过程没有什么技术含量,在IFTTT上按部就班设置就行。&br&&br&在If this 里找到Alexa 的 say a special phrase,填个你喜欢的词,记得要全部小写。&br&&br&&img data-rawwidth=&1242& data-rawheight=&2208& src=&/v2-af2f2a7ea88e35a28b69b6c6f7802d6c_b.png& class=&origin_image zh-lightbox-thumb& width=&1242& data-original=&/v2-af2f2a7ea88e35a28b69b6c6f7802d6c_r.png&&&br&&br&接着在then that 里找到Yeelight。&br&&img data-rawwidth=&1242& data-rawheight=&2208& src=&/v2-f9e8e2ec8a2bc9fc08e7baf_b.png& class=&origin_image zh-lightbox-thumb& width=&1242& data-original=&/v2-f9e8e2ec8a2bc9fc08e7baf_r.png&&&br&&br&&br&&br&很简单,就完成了。像这样&br&&br&&img data-rawwidth=&1242& data-rawheight=&2208& src=&/v2-56c4bfee7110af25aacc3a_b.jpg& class=&origin_image zh-lightbox-thumb& width=&1242& data-original=&/v2-56c4bfee7110af25aacc3a_r.jpg&&&br&&br&&br&试了下,echo的延迟没有期待中那么大,语音指令发出后,echo会给你个回应,指令发给IFTTT了,然后灯就亮了或者灭了,实用性还是不错的。&br&&br&在这里要吐槽下小米:大陆账户是不能享受这个服务的,只有注册在新加坡服务器上的用户才可以,我是找朋友注册了新加坡小米账户后,才可以连接这个服务。&br&&br&--------------------------&br&&br&娱乐时间: 让echo听懂中文的尝试。&br&&br&按下图设置了下,echo就听懂了我&开台灯&的中文命令。嘿嘿&br&&br&&img data-rawwidth=&1242& data-rawheight=&2208& src=&/v2-9eec6c9c8d2ad6d99634b_b.png& class=&origin_image zh-lightbox-thumb& width=&1242& data-original=&/v2-9eec6c9c8d2ad6d99634b_r.png&&&br&&br&关灯可以用&quantum &,亲测有效。&br&=============================&br&&br&&br&Jan.4 更新&br&&br&1.只要完成注册,用国内线路还是比较稳定,偶尔卡顿,我是上海电信线路。&br&&br&2.丢在客厅做语音定时器不错,只要说 echo(我把唤醒词改成echo了,感觉比alexa好读),set timer x minutes 。从此做平板,烤面包,监督女儿作业完成时间只要开开口就能搞定。&br&&br&3.女儿学习英语的好帮手,只要说 echo How to spell 某个单词,echo就会用字正腔圆的美音拼出来。小朋友玩的不亦乐乎。&br&&br&下一步准备试着连接Ifttt。树莓派已经入手,尝试连接照明系统。&br&&br&更新下,已经完成。&a href=&/p/& class=&internal&&&span class=&invisible&&https://&/span&&span class=&visible&&/p/24&/span&&span class=&invisible&&922139&/span&&span class=&ellipsis&&&/span&&/a&&br&&br&========================&br&入手两天,简单说下感受。&br&&br&设置需要Alexa app或者用笔记本在网页上设置和注册。&br&&br&我是iphone,所以先注册了一个美国apple store的apple ID用来下载Alexa app,因为中国store没有上架。&br&&br&进入设置后,echo需要一个美国ip才能完成注册,否则设置界面会一直跳出一个registration failure的出错信息。&br&&br&我用了个笨办法,用自己的手机运行Alexa app,用另一台手机翻墙做热点,让echo连接,就可以完成设置和注册了。&br&&br&注册成功后,可以update wifi,记得不要勾选save password to amazon,就可以用没翻墙的国内宽带连接了。&br&&br&最大感受:语音识别准确度很高,房间外面对着她说Alexa stop也能很快有反应。&br&&img data-rawwidth=&720& data-rawheight=&960& src=&/v2-3b9e216d6fcdf44f33ae_b.jpg& class=&origin_image zh-lightbox-thumb& width=&720& data-original=&/v2-3b9e216d6fcdf44f33ae_r.jpg&&
Jan.16 更新 Echo连接Ifttt控制智能灯泡已经完成。 一开始想用HUE,后来觉得也许可以有性价比更高的解决方案,于是在网上找了下,发现小米家的Yeelight 应该也行,而单个智能灯泡的价格只有HUE的1/5不到,实在是我等贫苦百姓的首选。 操作过程没有什么技术…
&p&我的研究领域是麦克风阵列信号处理,从2013年开始做远场语音识别的信号处理部分,目前也有了一些经验,分享下我的看法,欢迎指正。&/p&&p&我认为远场语音识别技术难点可以分为3个部分,第一个是多通道同步采集硬件研发,第二个是前端麦克风阵列降噪算法,第三个是后端语音识别与前端信号处理算法的匹配。&/p&&p&首先多通道同步采集硬件是研究前端降噪算法的前提,只有先拿到一些麦克风阵列的数据,才能根据实际采集的数据进行算法的研发和调优。目前市面上主流的codec芯片最多支持4通道同步采集,这对于麦克风阵列来说是不够的,比如echo音响,采用了7个麦克风,再加上一个喇叭的参考信号,所以它至少需要8通道同步采集,即2个4通道的codec芯片。为了使两个codec芯片同步,需要一颗FPGA芯片来协助完成,同时麦克风还需要一些配套的模拟滤波放大电路,中间有很多都是经验性的东西,并且在echo以前,消费电子上很少有集成4个麦克风的情况,所以研究的人很少,这也增加了该硬件的研发难度。当然如果仅仅是为了研究可以直接购买一些多通道同步采集设备,节省硬件研发周期。&/p&&p&其次是麦克风阵列降噪算法的研发。目前影响远场语音识别的难点是播放状态下打断,房间混响和非平稳噪声干扰等。播放状态下打断是指设备在播放音乐或tts的时候可以对它再次下达指令,这就需要回声消除技术,将设备自身播放的声音从麦克风接收到的信号除去,这个技术在手机上已经非常成熟了,比如上面@Kent Zhang提到的speex和webrtc的开源软件中都有该算法,但这两个开源软件为了达到更大的回声抑制效果,使用了大量的非线性处理手段,因此如果直接用在远场语音识别领域,效果并不好(我们已经做过测试)。在研究中我也发现,语音识别引擎对于语音信号的非线性处理非常敏感,简单的说就是语音失真少一些即使背景噪声有残留,也不会影响语音识别率。房间混响会造成麦克风接收到的信号有很长的拖尾,让人听起来感觉发闷,在实际中人耳具有自动解混响的能力,所以人在实际房间中相互交流并没有影响反而觉得声音饱满,但是这个对于语音识别来说是致命的,我觉得可能的原因是房间的冲击响应太长,一般有400ms-1000ms,而语音识别一帧的长度只有50ms,即使DNN有记忆能力,但也有限,所以在混响中语音识别率下降。远场语音识别以前,由于需求不大,对于去混响研究的不多,一般以倒谱平均、谱减法为主,但这类方法对远场语音识别率提升不大,目前比较好的去混响算法是日本NTT部门研究的多步线性预测方法,有兴趣的可以尝试一下。非平稳噪声干扰主要是利用波束形成去除,在做波束形成之前需要先知道说话人的方向,这就需要测向功能,即波达方向估计,学术上的论文一般研究如何提高测向的精度和分辨率,但这些指标在实际中意义不大,实际中更需要解决的是如何在混响的条件下提高波达方向估计的鲁棒性。知道方向之后,就可以做波束形成,抑制周围的非平稳噪声,由于消费产品价格和尺寸的限制,麦克风的个数间距有限,因此必须用自适应波束形成算法,简单说就是保护主方向说话人的同时,自动在噪声方向形成零点,对噪声进行抑制。经过测试,波束形成算法可以大幅提高语音识别率。&/p&&p&最后就是语音识别引擎要和前端降噪算法进行匹配。目前的识别算法还是训练数据和测试数据越匹配效果越好。目前各家的语音识别引擎主要是利用手机上收集的语音进行训练的,因此只适用于近讲情况。同样道理,为了提升远场语音识别,就需要用远场的语音数据训练声学模型,而远场语音数据又太复杂(混响、噪声),这就需要信号处理的手段让数据尽量变的单一一些,最佳的方法就是利用麦克风阵列采集的信号经过前端降噪算法后的数据去训练语音识别引擎,效果应该会有大幅提升。&/p&&p&此外,目前远场语音识别也分为两派,一派认为利用深度学习的办法也可以实现去混响降噪声的目的,另外一派是用麦克风阵列信号处理的方法去除混响和噪声,从目前的产品上看麦克风阵列信号处理的方式在实际中用的更多一些,echo用了7个麦克风,叮咚用了8个麦克风,google home也用了两个麦克风。个人觉得在远场语音识别这块,麦克风阵列信号处理还是一定需要的,因为人有这么聪明的大脑还长了两个耳朵,而目前DNN和人脑差别又很大,所以更需要多个麦克风做辅助,相信随着DNN的发展应该有一天可以只用两个麦克风就可以彻底解决远场语音识别问题,但这个时间估计还会很长。&/p&
我的研究领域是麦克风阵列信号处理,从2013年开始做远场语音识别的信号处理部分,目前也有了一些经验,分享下我的看法,欢迎指正。我认为远场语音识别技术难点可以分为3个部分,第一个是多通道同步采集硬件研发,第二个是前端麦克风阵列降噪算法,第三个是…
已有帐号?
无法登录?
社交帐号登录

我要回帖

更多关于 小米智能音响 的文章

 

随机推荐