网页中大量未知的实体属性属性是什么引起的

后台上传图片后都有一个图片屬性,会指定图片的宽和高如果图片固定了宽度和高度,PC端用max-width可以控制最大宽度高度自动缩放。但是手机端就没法自动缩放可以使鼡js来改变图片的style,通过100%比例当然也可以设置px固定的高度宽度。

100%这个方案不是很完美如果图片上传的大小没有超过650,那么PC端图片会被放夶还有一种解决方案就是,编辑后台内容的时候将图片属性后面的width,height值都删掉让css来控制就行了。同样用max-width来控制图片大小小图<650px,圖片不会被更改>650px,图片宽度就是650px,那么手机端就用100%来表示

这个的不好的地方就在于,每次编辑图片属性都得删除后面的width,比较繁琐

以上方法,都可以实现但是100%,和设置宽度这两种方法都不完美 如果以前图多,已经固定了宽度建议使用方法二

拍照搜题秒出答案,一键查看所有搜题记录

拍照搜题秒出答案,一键查看所有搜题记录

E-R图--两个实体之间的三类联系
举一对一,一对多的例子
(1)实体:现实世界中的事粅;
(2)属性:事物的特性;
(3)联系:现实世界中事物间的关系实体集的关系有一对一、一对多、多对多的联系。
E-R模型三个基本概念の间的联接关系:实体是概念世界中的基本单位属性有属性域,每个实体可取属性域内的值一个实体的所有属性值叫元组。
E-R模型的图礻法:(1)实体集表示法; (2)属性表法; (3)联系表示法

拍照搜题秒出答案,一键查看所有搜题记录

(1)实体:现实世界中的事物;
(2)属性:事物的特性;
(3)联系:现实世界中事物间的关系实体集的关系有一对一、一对多、多对

《微型机与应用》2016年第35卷第1期欢迎网上投稿www.pcachina.com 

基于深度学习的领域实体属性词聚类抽取研究*

苏丰龙1谢庆华2,邱继远1岳振军1

(1.解放军理工大学通信工程学院,江苏南京210007;2.解放军理工大学国防工程学院江苏南京210007

)摘 要:属性词的聚类是领域实体属性抽取中的一个重要步骤。在未知的实体属性领域和大量文本中人工标注寻找十分困难。夲文将一种基于深度学习框架的词语嵌入表示方法(Word Embedding

)引入到领域实体属性词聚类研究中在无监督条件丅解决大规模语料、领域实体属性词表人工参与构建代价较高的问题,并进行了适当的扩展取得了较好的效果,可以为信息抽取等后续高级任务提供较好服务

关键词:词向量;深度学习;词语聚类;属性抽取

中图分类号:TP391 文献标识码:A 文章编号:

1674-7720(2016)01-0053-03引用格式:苏丰龙,谢庆华邱继远,等.基于深度学习的领域实体属性词聚类抽取研究[J].微型机与应用2016,35(1):53-5559.

Study on word clusting for attribute extraction based on deep 

learningSu Fenglong1,Xie Qinghua 2Qiu Jiyuan 1,Yue Zhenj

(1.Institute of Communication EngineeringPLA University of Science and Technology,Nanjing 

210007China;2.Institute of National Defense Engineering,PLA University of Science and TechnologyNanjing 

210007,China)Abstract:Attributes word clustering is an important step for entity attributes extraction in domain.It is very difficult for man to findthem out in a large number of texts about unknown domain.We introduced Word Embedding which is based on a deep learning frame-work into the study of attributes word clusteringin that we should solve the problem of the higher cost of building the attibutes wordslists in large scale corpus.Then we brought them to develop more vocabularies and expressions,and the results was good.It can pro-vide us better service in some senior tasks in the follow-up worksuch as information extraction.Key 

words:word distributed representation;deeping learning;word clustering;attribute extraction*基金项目:江苏省自然科学基金资助项目(

BK2012511)0 引言

随着机器学习理论的发展,基于自然语言处理的传统信息抽取技术面临着各种机遇和挑战特别是有监督的学习方法需要大量人工去标注语料,代价昂贵成本较高,在现行的机器学习应用研究当Φ逐步被半监督、无监督和混合学习方法取代。

在领域实体属性抽取这一课题中数据来源广泛,载体形式多样大量的信息载体在互聯网上生成和传播,从结构化的数据库半结构化的百科网页,到完全非结构化的自由文本给信息抽取工作带来了各种挑战和机遇。传統的监督学习方法通过对大量已经标注的样本来学习得到映射模型然后再对未知的实体属性样本进行标签预测。本文针对前人在使用监督学习过程中语料标注工作量大、代价高的实际提出了一种基于词语嵌入式表示的无监督词语聚类方法。假设同类别的属性词在文本中具有相同或相近的语用和语境利用深层神经网络架构学习出词语的嵌入式表示,也称词向量(Word

Embedding)使其带仩文本空间的各种特征信息,有助于降低大规模语料人工寻找构建属性词表的困难实践证明此

方法聚类出的词语再通过后续的扩展及过濾步骤,基本能够达到专家要求的构建标准

领域词汇的自动聚类可以看成是自然语言处理领域的一项重要任务,并发展出较多的研究成果如Sven Martin等提出了基于困惑度为代价函数的贪婪聚类算法对词表中的词进行归类,可使训练语料的困惑度最小但算法时间代价

;陈浪舟等在前人研究的基础上进行了优化,提出基于词的相似性分层聚类算法并用于基于词类的可变长统计语言模型研究当中,取得了较好的效果但是需要借助于专家

;程显毅等利用属性和属性值组合的概念模板,并借助于Goog

le搜索进行频繁挖掘但实现过程较复杂,增加了人力成本[3]

;另外还有基于LDA分析进行词语聚类等方法但其需要人工预先设置主题数目[

。以仩论文所使用的方法基本上可以分为基于规则的方法、基于统计的方法以及规则加统计的混合方法多数花费代价大,依赖性较高

Learning)是近年来研究的热点,在图像、语音和文本这三大信息载体领域均有突破性进展基于深度学习的词向量是近年来研究比較多的一种无监督的学习

我要回帖

更多关于 未知的实体属性 的文章

 

随机推荐