大师加下我微信好友恢复大师 有事找你关于acl策略

云数据库 TencentDB
互联网中间件
域名与网站
开发者工具
云智AI应用服务
云智AI平台服务
云智大数据基础服务
云智大数据可视化服务
云智大数据应用服务
行业解决方案
大数据与AI解决方案
物联网解决方案
安全与运维解决方案
微信解决方案
微信小程序
服务与培训
微信小程序解决方案
一站式部署小程序资源套件,简化开发、提升效率;更有丰富的小程序模板,满足电商/餐饮/O2O等多场景定制化需求。
一步步教你搭建微信小程序
4搭建小程序
小程序通用架构
丰富的案例实践与专属云产品,助你灵活应对各种应用场景
通用架构分析
攻克微信小程序的难点
小程序现有的 SDK/DEMO 缺乏对云端的支持,依赖开发者逐个模块搭建云端服务,过程冗繁;
必须通过 HTTPS 完成与服务端通信,依赖开发者自行完成证书申请部署,效率不高;
鉴权流程安全性要求高,开发者高效安全的完成会话管理难度较大;
提供 WebSocket 长连接通信的客户端 API,但缺乏服务端配套支持,开发者自行实现难度较大;
我们的优势和解决方案
一键构建具备云端能力的专属小程序,提高小程序开发的效率;
原生支持 HTTPS/WSS,证书申请部署对开发者透明,减少开发者不必要的麻烦;
提供完整的鉴权会话管理服务,保证帐号安全同时提升小程序开发的效率;
提供 PaaS 级的 WebSocket 信道服务,降低开发者使用 WebSocket 通信的门槛;
实战场景分析
使用解决方案解决实际问题
三木聊天室
我们提供了一个聊天室的场景,来说明解决方案如何应用到实际业务场景中。对于每一个打开聊天室的微信用户,我们需要鉴别请求加入聊天室的是哪个用户。由于小程序实质上并不是 Web 应用,所以无法使用 Web 网站中通过 Cookie 跟踪会话的方案。解决方案提供了会话服务,完成微信小程序会话的创建和跟踪过程。用户加入聊天室后,需要使用 WebSocket 来建立双向通信,此时解决方案的信道服务也能提供优质的支持。除此之外,解决方案提供自动化部署,快速解决业务的起步架构和部署问题。
提供会话服务和信道服务,解决小程序开发难点
提供快速自动化部署,完成复杂的架构初始化工作
快速注册,便捷管理,域名防劫持,保障微信小程序的域名安全;一键解析,快速稳定,提供域名免费备案支持。
一键式地提供了安全套接字层(SSL)证书的申请、管理、部署功能,与定级的数字证书授权(CA)机构和代理商合作,提供微信小程序的Https解决方案。
高性能高稳定的云虚拟机,支持自定义配置的机型及快速扩容,与微信接口使用专属BGP链路,内网通信,高速互联,同平台无缝对接,访问微信接口优势明显。
分布式存储架构,承载QQ邮箱超大文件等日十亿级上传下载的存储服务,支持自动化扩容,多地多机房备份,完善的ACL权限控制,轻松实现电子票据、影像的云端存储。
一键式地提供了安全套接字层(SSL)证书的申请、管理、部署功能,与定级的数字证书授权(CA)机构和代理商合作,提供微信小程序的Https解决方案。
高性能高稳定的云虚拟机,支持自定义配置的机型及快速扩容,与微信接口使用专属 BGP 链路,内网通信,高速互联,同平台无缝对接,访问微信接口优势明显。
分布式存储架构,承载 QQ 邮箱超大文件等日十亿级上传下载的存储服务,支持自动化扩容,多地多机房备份,完善的 ACL 权限控制,轻松实现电子票据、影像的云端存储。
全球 500+ 强大节点,20Tbps 带宽能力,顶尖加速能力超同类产品 30%,保证微信小程序的资源加载速度。
一键式地提供了安全套接字层(SSL)证书的申请、管理、部署功能,与定级的数字证书授权(CA)机构和代理商合作,提供微信小程序的Https解决方案。
高性能高稳定的云虚拟机,支持自定义配置的机型及快速扩容,与微信接口使用专属 BGP 链路,内网通信,高速互联,同平台无缝对接,访问微信接口优势明显。
分布式存储架构,承载 QQ 邮箱超大文件等日十亿级上传下载的存储服务,支持自动化扩容,多地多机房备份,完善的 ACL 权限控制,轻松实现电子票据、影像的云端存储。
一键式地提供了安全套接字层(SSL)证书的申请、管理、部署功能,与定级的数字证书授权(CA)机构和代理商合作,提供微信小程序的Https解决方案。
高性能高稳定的云虚拟机,支持自定义配置的机型及快速扩容,与微信接口使用专属BGP链路,内网通信,高速互联,同平台无缝对接,访问微信接口优势明显。
分布式存储架构,承载QQ邮箱超大文件等日十亿级上传下载的存储服务,支持自动化扩容,多地多机房备份,完善的ACL权限控制,轻松实现电子票据、影像的云端存储。
汇聚腾讯强大视频处理能力,提供一站式视频点播服务,拥有遍布全国的BGP网络,覆盖17+运营商,400多个CDN视频加速节点,提供极致加速体验,超过10000台分布式转码集群提供强悍的转码能力。
开发者资源
为所选平台获取你开发语言需要的 SDK 和工具
Wafer2 Demo + SDK
常见问题 FAQs
他们也在使用腾讯云小程序解决方案
腾讯云小程序解决方案是开发者们抢跑小程序的高效助力
腾讯云小程序帮助解决高弹性、个性场景化等实际需求
富途牛牛股票
腾讯云支持证券类小程序,海量数据实时、准确、稳定
富途牛牛股票
还可以访问微信小程序,了解更多小程序的开发指南
3元购买小程序解决方案规则说明:
1、本活动仅针对新购用户,已购买过的用户不再享有此优惠。
2、3元购的用户必须是通过小程序认证的用户。
3、购买路径:通过微信公众平台——设置——开发设置跳转到腾讯云购买页面。
4、此活动时间为4月1日——12月31日。
5、腾讯云保留最终解释权。
关注公众号,移动管理云服务
长按识别或截图保存关注公众号,移动管理云服务智造观点今年10月在佳士得的全球拍卖会上,一幅AI画作将被首次进行公开拍卖,这引发的话题是,在音乐、建筑、科学、美术等这些富含创造性的活动中,AI同样在扮演着越来越重要的角色,比如化身画布、画笔,甚至是乐器,创作出一幅幅极具艺术气息的画作和一首首悦耳动听的歌曲。 但AI画作的出现,却也导致赝品的泛滥,这让数百万元的作品变得毫无意义。与此同时,用于鉴别画作真伪的AI技术又出现,但这似乎有陷入了自产自“销”的怪圈。那对艺术来说,人工智能究竟是新鲜血液还是未来杀手呢?文/灰灰来源/人工智能观察(ID:Aiobservation)艺术是什么? 从心理学的角度来说,艺术可以引起人们对过去事件的回忆,在一定程度上,是人们进行情感交流与展开教育的一种手段,也是用来理解自我,表达某些不可言传的意境的一种方式。 回想3万或4万年前,人类还没有学会进行情感上的自我反思,因为那时候的人们一直都在打猎、战斗,为自己取暖的同时还要保证自己的安全。换句话说,一直在为生存斗争。 后来在人类学会收集食物,不必为狩猎所累后,这种情况有所改变。所以,克鲁马努人部落(旧石器时代晚期在欧洲的高加索人种)选择了定居。这一次,坐在篝火旁,看着深洞墙上投下的影子,他们想到的不再只有食物,而是比生存更重要的东西。于是,他们拿起了树枝,开始作画。进一步讲,如果没有祖先通过狩猎发展起来的认知能力,人类就学不会制造和使用工具,甚至也不能出现记忆,形成语言,具备表达能力,也不会学会识别周围环境的成长模式,让自己得以生存。 而现在,它们成为了我们试图用机器来模拟的能力:记忆、语言、理解、推理、学习、表达、以及模式识别。这些都是人工智能的核心组成部分。于是,人工智能成为了一个“模拟艺人”,我们开始用AI创造艺术。但开始之初,人工智能学会的只是理解和复制人类的艺术,当时这项技术被称为“风格转移”(Style Transfer),通过使用深层网络来复制、再创造混合了不少艺术风格的作品。 随着技术的不断提高,或许艺术创作已不仅仅是人类的专属品了。一幅将公开拍卖的AI画作不可否认,艺术的历史总是与技术的发展交织在一起的。事实上,艺术家以及艺术运动通常是由可用的工具来定义的。比如,燧石刀的精度(石器时代的高技术)使人类能够从猛犸象牙中雕刻出第一批具象艺术;古典大师(Old Master)用暗箱(camera obscura)渲染出了具有特殊深度的场景。现在,荧光显微镜、3D生物打印、混合现实等都成为了艺术家们表达自我的工具,但最具代表性的技术是人工智能。在佳士得的伦敦市中心画廊的白墙上,挂着一个金色的画框,画中是一个穿着清教徒式的黑色衣服,面带些许忧郁的男子。这幅画看起来似乎是某位古代大师的作品,但在它的右下角却有一个让人意想不到的署名:一个草书体算法。据了解,这是法国艺术组织Obvious名为Edmond de Belamy的画作,或者更准确地说是Obvious设计的算法的画作,将于10月作为佳士得代表Obvious举行的Prints & Multiples拍卖活动上进行拍卖。 Obvious成立于2017年4月,以“艺术创造不只是人类的专属品”为座右铭,通过教授计算机艺术史并向它展示作品的打造过程,来创作艺术作品。根据该组织联合创始人高蒂尔·维尼尔(Gauthier Vernier)的说法,“整个过程旨在让人类尽量少参与作品创作。”目前,Obvious在人工智能的帮助下创作了11幅艺术作品。 为了让AI更好的创作,该团队通过艺术百科全书Wiki Art收集了15000幅横跨14世纪到19世纪的画像,并将它们输入到GAN算法。GAN算法包括两个部分:生成器和鉴别器。生成器学习了画像的规则,比如人有两只眼睛和一个鼻子,然后它会开始根据这些规则创建新图像。 鉴别器的工作是鉴别图像,推测哪些是来自于数据集的“真实”画像,哪些是来自生成器的“虚假”画像。当生成器骗过鉴别器时,它会从失败中学习。而当它成功骗过鉴别器时,这个过程就完成了,就会生成一个新图像。值得一提的是,整个过程并不是并不是对现有的15000幅图像的简单复制或者拼凑,而是一个原创图,对此,研究员将这项新艺术运动称作“GAN主义”。尽管Obvious的这一举措很酷,但其作品暂时还不能确定是不是可以被称为“艺术”。不过,答案并不是很重要,重要的是人们对其作品的浓厚兴趣感到惊讶,不管是喜欢和讨厌,没有人对此毫不在意。那人工智能会是大量产出艺术作品的人类替代品吗? 在Obvious负责技术工作的AI博士生雨果·卡塞勒斯`杜普雷(Hugo Caselles-Dupré)并不这么认为,他将今天的AI实验比作19世纪中期摄影的出现,当时微型肖像艺术家失业了,“当时人们说摄影不是真正的艺术,拍照的人就像机器。而现在,我们都一直认为,摄影已经成为真正的艺术分支。” 既然现在人工智能创作的画作已经可以让人感觉是某位古代大师的佳作,那我们是不是可以理解为AI也可以模仿一些名作,达到以假乱真的效果?众所周知,这种情况的出现,只会让“赝品”疯狂,让收藏家蒙受金钱损失。这种情况应该如何应对呢?自产自“销”,AI成辨别伪造艺术新工具除了人工智能的画作,在艺术领域,赝品已经变得越来越猖狂。今年3月底,德国威斯巴登的一名法官扮演了一次艺术评论家的角色,两名男子被指控伪造了包括卡济米尔·马列维奇(Kazimir Malevich)和瓦西里·康丁斯基(Wassily Kandinsky)在内的艺术家的作品。该案件已经进行了三年半,被许多人视为一种考验:一场成功的起诉可能有助于结束一场“赝品”的流行,这是一个一直困扰俄罗斯艺术市场的问题。除此以外,今年1月,比利时根特美术博物馆被迫撤下了24幅作品,因为一个报道指出,这些作品全部是伪造的;前不久,在意大利热那亚举办的莫迪里亚尼展览(Modigliani Exhibition)上,展出的21幅作品被没收,同时打上了赝品的标签。价值数百万美元的作品突然成为毫无价值的东西,让人大跌眼镜。于是,在经历了一系列丑闻之后,该市场变得紧张起来。 于是,辨画真伪的人工智能工具应运而生。来自新泽西罗格斯大学(Rutgers University)的研究员,现在正在探索一种方法,试图开启艺术认证新阶段。摒弃了传统的对作品的昂贵材料做分析的方法,研究员开发的技术功能十分强大,甚至都不用接触到最原始的作品,只需一张数码照片就可以搞定,其中人工智能是最大的功臣。 在去年11月该团队发布的一份论文中,详细记载了其AI系统如何将毕加索,马蒂斯,莫迪利亚尼和其他著名画家的画作分解为8万多个单独笔画,在这些笔画的数据集的基础上,研究员利用一种机器算法来寻找绘画作品中的特定特征,如笔画中线条的形状、笔画的轻重、通过这两种分析方法的结合,人工智能有80%的几率来有效的识别出伪造的赝品。更令人叹服的是,该人工智具有仅通过单一笔触便可甄别每幅呈现于它面前的作品是否为伪作的能力。 对此,该研究团队的Ahmed Elgammal博士表示,“笔画是一种无疑意识的动作过程。艺术家专注于构图、肢体动作、画笔等,但笔画也是其中的一个明显迹象。”现在这份研究还在进行中,如果成功将会是对该领域的一个很有价值的补充。实际上,通过笔画来识别艺术家的想法可追溯到20世纪50年代,这是荷兰艺术史学家Maurits Michel Van Dantzig发明的一种技术。在他看来,每件艺术品都是出自人类之手的产物,而每只手都是不同的,所以应该有可能通过这些明显的笔触来识别作者身份。 不过,问题在于,数据太多了。即使是一幅简单的图画,也包含了成百上千的笔画,所有这些要通过人眼识别,这很不切实际。但是,人工智能可以做到人类无法完成的一些事情,所以现在研究员试图通过AI找到解决办法。到目前为止,该系统已经对某个时期的一些艺术家的画作进行了识别与测试。就挑战难度而言,是那些古老的画作,因为其中包含了很多层的修复或过度绘画。 虽然Ahmed Elgammal对这项技术充满了信息,但仍有人表示怀疑。比如,康奈尔大学计算艺术史教授Charles R Johnson表示,与其说我怀疑的是人工智能,倒不如说我怀疑的是这项理论背后的假设,毕竟笔画很少是个性化的,同时,艺术家在自己的职业生涯的不同时期也会有所改变。同时,许多艺术家的作品本质,我们是不了解的,所以计算机分析的重点最好是画布或者纸张,才能得到更严格的验证。 不过,Ahmed Elgammal还是坚持着自己的方法,现在该团队正在研究毕加索等印象派画作,希望明年公布结果。在他们看来,即使有了图纸,机器也不能自己去学习;通常算法需要人工调整,以确保正确的属性正在被检查,同时,那些产出不多,无法创建有效数据集的艺术家也是一个挑战。 不过,在小智君(ID:Aiobservation)看来,这项技术的困难还是挺多的,比如现在赝品的出现,如果收集了假的数据,导致整个数据库受到污染,便有可能让其算法变得扭曲。当然,面对这些问题,还有人提出了用区块链技术来保证数据来源,其他人则呼吁提高数据的透明度。 总的来说,人工智能与艺术,不管是创作还是辨别真伪,都是一个极具哲理的问题。很难想出一个比艺术更具个性化或者说人性化的东西,因为它是我们作为一个物种的自我表现的定义。但归根结底,人类并不擅长将虚假和真实的东西区分开来。 抛开自动驾驶汽车,以及试图将自己的声音变得更像人类的虚拟助理Alexa,或许人工智能会比我们自己更了解艺术天才的秘密——尽管现在机器创造的作品能不能称为艺术还是一个未知数,但在其“欣赏”作品时候的好奇心,我们不能否认。而人类,在涉及复杂的食物组合面前,表现总不会很好,因为我们会犯太多的错误......(文中图片来自网络)近期热文:投稿、约访、合作,联系邮箱添加微信aixiaozhijun,更多交流或进AI观察团
yahoo开源了用于检测图片是否包含不适宜工作场所(NSFW)内容的深度神经网络项目https://github.com/yahoo/open_nsfw,GitHub 库中包含了网络的 Caffe 模...
来源:芯师爷概要:2017年,我们被AI公司的融资信息一次次刷屏,从2千万到1亿美金,让我惊诧道,AI的黄金年代真的来了吗?2017年,我们被AI公司的融资信息一次次刷屏,从2千万到1亿美金,让我惊诧...
一、赛程安排
平台会在9月4日10:00开放训练数据集以及验证数据集,参赛选手可以自行下载数据,在本地进行算法设计、模型训练及评估。
众所周知,深度学习属于计算密集型,模型中参数众多,占用很大的存储空间。这一特点,在嵌入式终端上应用时,因为硬件资源有限,就成了制约实际应用的瓶颈。
因此,减少模型需要的存储空间有着迫切的理论及现实意...
本文系网易新闻-智能工作室出品
聚焦AI,读懂下一个大时代!
网易年度AI人物评选——2017网易AI英雄风云榜,自荐提名进行中!
奖项设置:技术创新人物TOP 10,商业创新人物T...
FashionAI全球挑战赛-服饰属性识别赛后技术分享(欢迎指正)...
原作 Jackie Snow
Root 编译自 Technology Review
量子位 出品 | 公众号 QbitAI
鉴别画作真假的难度非常大,还特别烧钱。
当艺术史大神都看不出...
Notes:本文盘点未收录 CVPR、ACL、ICLR 和 EMNLP 等计算机视觉 自然语言处理细分领域的重要大会。
Notes:本文盘点未收录 CVPR、ACL、ICLR 和 EMNLP 等计算...
关注ITValue,查看企业级市场最新鲜、最具价值的报道!
国外科技巨头公司都在纷纷加速人工智能领域的布局,中国AI生态的力量也在迅速崛起。在今年夏天,中国政府绘制了一份2030...
没有更多推荐了,you have been blockedyou have been blocked深度学习即将攻陷的下一领域:NLP—ACL2016优秀论文解读
日06时06分来源:
深度学习的出现让很多人工智能相关技术取得了大幅度的进展,比如语音识别已经逼近临界点,即将达到Game Changer水平;机器视觉也已经在安防、机器人、自动驾驶等多个领域得到应用。而自然语言处理(NLP)被视为深度学习即将攻陷的下一个技术领域,在今年全球顶级的NLP学术会议ACL上,我们也看到大量的在深度学习引入NLP方面的探索研究。让我们跟随阿里的科学家们一起去探求深度学习给NLP带来些改变。
一、会议概要
ACL年8月7日至12日在德国柏林洪堡大学召开,本届参会人数在1200人左右。其中,8月7日是Tutorial环节,8月8日-10日是正会,8月11日-12日是若干主题的workshop。本届ACL2016 Lifetime AchievementAward winner是来自斯坦福的Joan Bresnan教授,词汇功能文法的奠基人。
参会的阿里巴巴同学们
二、Tutorial总结
1、《Computer Aided Translation》
这个tutorial的报告人是约翰霍普金斯大学的Philipp Koehn教授,他是统计机器翻译领域的领军学者之一,在基于短语的机器翻译模型方面做了很多影响深远的工作,主持了著名的开源统计机器翻译系统Moses的开发。最近几年,Koehn教授重点关注如何借助机器翻译技术来帮助译员如何更有效率地完成翻译工作,即计算机辅助翻译技术(CAT),并得到了欧盟CASMACAT项目资助,这个tutorial也算是整个CASMACAT项目的总结。在这个报告中,Koehn介绍了在这个项目中开发的一系列新的CAT技术及其实际效果。与在线术语库、记忆库、译后编辑等传统手段不同,CASMACAT结合了SMT的大量研究成果,例如置信分(confidence score)、复述(paraphrasing)、可视化词对齐(visualization of word alignment)、翻译选项阵列(translationoption array)等,为译员提供了更加丰富的信息,从而为辅助翻译提供了更好的灵活性。
图1、翻译选项阵列
这个项目实现了一套完整的在线CAT系统(CASMACAT),通过对大量译员的实际使用情况进行数据统计,并结合眼部跟踪(eye tracking)等认知分析,证明这些新的CAT方法的确能够提升译员的工作效率,提升产出。
总体上,这个报告的内容属于比较偏应用型的工作,学术上的创新工作不多,因此受到的关注不如其它学术性报告多,但它是一个非常完整的实用性工作,通过把机器翻译的新技术与CAT场景进行创新的结合,并通过大量真实用户的使用验证这些技术的有效性。
2、《NeuralMachine Translation》
这个tutorial的报告人是斯坦福大学的Christopher Manning教授、他的博士生Thang Luong以及纽约大学的助理教授Kyunghyun Cho。Manning教授在NLP领域的影响力非常大,是统计NLP领域的领军学者之一,最近几年也逐渐转向深度学习,在递归神经网络、句法分析、词向量、神经机器翻译等领域做了很多开创性工作。Luong和Cho也是近几年暂露头角的青年学者,尤其是在将深度学习应用于NLP领域做了不少创新的研究。
这个tutorial对目前神经机器翻译的研究进展做了一个阶段性的总结。虽然NMT真正开始兴起的时间不到3年(大致从2013年Kalchbrenner和Blunsum发表《Recurrent continuous translation models》开始算起),但迅速在研究界掀起了新的热潮,并取得了巨大进展,在一些语言上的效果已经超越了传统的方法。报告首先回顾了最近20年占统治地位的SMT方法,然后介绍了几年之前将神经网络作为新特征集成到传统解码器的思路,接下来重点介绍了大家非常关注的端到端的神经机器翻译(End2end NMT)。报告中以一个具体的NMT实现为例,详细描述了一个NMT的序列到序列框架及相关的最大似然估计和beam-search解码过程。报告最后描述了NMT研究近期的发展趋势,包括引入LSTM和attention机制,以及如何通过sub-word或基于字符解码来尽量减少受限词表对最后翻译效果的影响等。
图2、一个典型的encoder-decoderNMT框架
总的来说,这个报告对于我们更好理解NMT基本原理,了解当前面临的主要问题以及最新的研究成果都非常有帮助。
图3、Manning教授、Luong和Cho在Tutorial上
3、《SemanticRepresentations of Word Senses and Concepts》
来自罗马大学的J Camacho-Collados,I Iacobacci,R Navigli,以及剑桥大学的MT Pilehvar共同带来了这次《词义和概念的语义表示》的Tutorial分享。
Word(词)是句子、文章、文档的重要组部分,但是Word Representation有比较大的局限性,例如:一词多义以及词义消歧等,因此本文详细介绍基于语义表示(Sense Representation)技术,而此领域作为一个基础领域可以在众多领域进行广泛的应用,例如:语义相似度、语义消歧、信息挖掘、语义聚类等等领域进行应用。并且系统的通过基于知识库(knowledge-based)和无监督(unsupervised)两个不同的技术体系与方案进行相关领域成果及方法系统的介绍。整个Topic虽无特别创新的地方,但是实用性较高,基于知识以及无监督的方法大部分在工业场景都可以借鉴,可以一读。
Slides下载地址:http://wwwusers.di.uniroma1.it/~collados/Slides_ACL16Tutorial_SemanticRepresentation.pdf
4、《UnderstandingShort Texts》
短文本理解的主题从字面意思理解就非常接地气。在日常的很多领域中都会产生大量的短文本,包括搜索、问答以及对话、推荐等领域,而短文本带来的问题也非常明显,包括稀疏问题、噪音问题以及歧义问题。因此这里就会产生大量的工作以及有意思的工作。
本次报告的分享人是来自前微软亚洲研究院(MSRA)的研究员王仲远(目前已经在Facebook)以及来自Facebook的王海勋(前Google以及前MSRA高级研究员)。可能是因为本次Topic分享人来自于企业界,加上相对接地气的分享主题,因此本次分享吸引了不少产业界以及学术领域的同学前来参加,包括Amazon、Yelp、讯飞、百度、微软等。
本文在短文本的理解技术上从文本语义明确(Explict)表示与隐性(Implict)表示将处理的方法技术分成了两种类型:ERM(Explict Representation Model)和IRM(ImplictRepresentation Model)。
图4、EMR and IMR
ERM还是基于结构化知识库或者知识图谱,切分成为单实例和上下文多实例的两种类型分别进行短文本的理解;
单实例的处理方式:单实例的查询是否有歧义,无歧义既返回,有歧义进行基础基础的概念模型进行归一和分类,最终进行语义相似度的方法进行倾向性理解的方法;
多实例短文本的方式:语义分词处理与切分(文中提到了有监督和无监督N-Gram的方式,而在实际场景这个问题相对会更加成熟,可以参考中文分词技术),实体及结合上下文的实体识别、消歧和类型标注,到实例之间的关系标注,到最终的语义相似度计算;
IRM更多基于embedding和deep learning的方法做短文的理解与计算。本文还是有不少实际工业可以借鉴的地方,可以关注并读一下。
slides下载地址:
http://www.wangzhongyuan.com/tutorial/ACL2016/Understanding-Short-Texts/
三、会议详细内容
1、机器翻译方向
《Multimodal Pivots for Image CaptionTranslation》,这篇论文入选了本届会议的杰出论文,作者是德国海德堡大学的Julian Hitschlerand ShigehikoSchamoni和Stefan Riezler,所做的工作比较有新意。论文工作要解决的问题是改进图片标题的翻译质量,但并不是通过扩大双语句对、优化解码器等方法实现,而是先用图像检索的方法在目标语言图片库中检索与源语言图片相似的图片,然后用其所带的标题和机器翻译输出的译文组合之后进行重排序,从而显著提升了标题翻译的质量。对于改进机器翻译质量,这个工作并没有试图直接硬碰硬地去改进核心算法,而是另辟蹊径,反而取得了更好的结果。
《Modeling Coveragefor Neural Machine Translation》,这篇论文的作者是来自华为诺亚方舟实验室的涂兆鹏博士和李航博士,其核心思想是要解决之前基于注意力(attention)的NMT框架中由于缺少已翻译范围指引而导致的过翻(over-translation)或欠翻(under-translation)问题。论文引入了一个覆盖向量来跟踪NMT的attention历史,并在解码过程中反馈给attention模型,帮助后者不断调整未来的attention,从而从全局上记录哪些词已翻,哪些词未翻。这个工作解决了之前NMT框架中一个比较明显的缺口,对于NMT系统的实用化具有很好的价值。
《Phrase-LevelCombination of SMT and TM Using Constrained Word Lattice》,这篇论文的作者是来自于都柏林大学ADAPT中心的刘群教授、Andy Way和李良友。文中使用了一种受限词图结构,将输入的短语和由记忆库施加的约束条件编码到一个向量里,从而将SMT和TM在句子级实现了融合。这是众多NMT论文中为数不多的仍然以传统SMT和记忆库(TM)为主题的工作。考虑到TM在实用系统中仍是不可缺少的部分,这个工作也是具有一定的应用前景的。
图5、Phrase-Level Combination of SMT and TM UsingConstrained Word Lattice
2、机器阅读与理解
机器阅读理解是约在5、6年前逐渐为人关注的领域,它可以说是自然语言理解的终极形态。这个领域的研究形式是让机器先处理一篇文章(新闻文章或短篇故事),然后回答跟文章内容相关的填充题,要填充的一般都是某个实体的名字。(注:为了避免利用外部资源来作弊,常用做法是把实体名字替换成’@entity1’等特殊符号。)
本届ACL会议正好有一篇优秀论文(“A Thorough Examination ofthe CNN/Daily Mail Reading Comprehension Task”)是关于阅读理解的。该论文的重点在于借助一个基于CNN和每日邮报新闻数据的评测数据集去探讨当前阅读理解技术所能解决的范围。论文作者实现了两个相当标准的系统,一个基于传统分类器,另一个基于神经网络,然后对两个系统的表现作抽样调研。调研结果是:(i) 只需要字面匹配就能解答的问题是两个系统都能百分百回答正确的;(ii) 大部分阅读理解问题的关键在于同义表达的理解和若干程度的文本、常识推理,这方面基于神经网络的系统能达到90%上下的水平;(iii) 牵涉到代词指代和需要消化多个句子信息的问题,两个系统的表现都只达到50%左右;(iv)连一般人都难以回答的问题,机器也同样没辙,只能偶尔蒙中一两题而已。换言之,这篇论文一方面印证了神经网络确实是解决同义表达和简单文本推理的一个良好框架,但同时亦指出了要机器阅读理解的未来方向在于篇章级的理解方法。
另外一篇论文“Text Understanding with theAttention Sum Reader Network”在这个CNN/每日邮报数据集上使用了另外一套基于神经网络的方法,也得到几乎一样的准确率,印证了顶尖研究者都已经达到一样的水平了。
3、语言与视觉
这个又名“language grounding”的领域是NLP和computer vision的交叉领域,近年来也越来越受到关注。今年ACL有两篇论文对现实产品有相当意义。第一篇是“Learning Prototypical EventStructure from Photo Albums”。这篇论文指出不少照片簿其实都是关于一个大主题(例如婚礼),这个大主题往往由好几个小主题组成(例如交换戒指、新郎亲吻新娘、抛花球、切结婚蛋糕),而这些小主题往往也有一个时序。(见图6)论文作者于是提出一套方法,利用照片图像之间的相似度/差异度、照片标题的相似度/差异度、主题之间的顺序关系来对照片簿进行切分,并利用图像分类和文本分类对每个切分出来的部分给出一个主题标签。
图6、照片簿的自动切分和分类
第二篇值得注意的论文是来自微软研究院的“Generating Natural Questions about an Image”。论文指出目前的image captioning(自动赋予图片标题)研究通常都会对照片给一个很客观但也很干巴巴、‘没有人文关怀’的标题,例如对于图7中的照片,一般的系统都会给出“有个人在摩托车旁边”或类似的标题。这种标题抓不住整张图片的重点,因此也不能引起读者兴趣。这篇论文应该是关于Tay(英文版微软小冰)的一个功能,就是用户上传一张如图7的照片,然后聊天机器人回应一句像“发生什么意外了?”或“司机受伤了吗?”的回应。论文作者收集了并人工标注了一个相关的数据集,也提出生成式和检索式的两套方法。
图7、自然与不自然的相片标题
还有关于对话系统、句法分析等精彩内容,请点击阅读原文进行查看哦~
戳原文,更有料!

我要回帖

更多关于 微信好友恢复大师 的文章

 

随机推荐