对于社交网络的数据挖掘 神经网络应该如何入手,使用哪些

基于社交网络的数据挖掘研究--《西安电子科技大学》2014年硕士论文
基于社交网络的数据挖掘研究
【摘要】:随着计算机技术的快速发展,我们生活在一个数据快速增长的年代。每天都有来自商业、科学等各个不同领域以及我们日常生活的数千兆兆字节存储于计算机网络、万维网和各种数据存储设备。数据爆炸式的增长、巨大的数据量使得当今的时代成为一个真正的数据时代。信息技术自然进化促发了数据挖掘技术的产生。数据挖掘可从海量数据中挖掘出有趣的模式和知识。数据挖掘可应用与金融数据分析、零售业、电信业、生物学数据分析以及其他科学应用。
在互联网上,用户使用的最多的就是社交网络。人们在社交网络上分享信息,海量的数据为数据挖掘提供了前提条件,采用数据挖掘技术,可挖掘出数据之间存在的潜在信息。数据挖掘中的聚类分析可以将相似度较高的用户数据聚成一个类。本文先用Python从社交网络新浪微博上提取热门话题和参与话题的用户信息,然后采用分级聚类算法对提取的热门话题进行聚类。本文还采用另外一种算法:协作型过滤算法对提取的数据进行分析。最后将两种算法的结果进行分析比较。通过得出的结果可对用户推荐属于同一类的话题,或者推荐经过分析得出的用户最感兴趣的话题,从而可以使得新浪微博的话题功能使用率更广。
【学位授予单位】:西安电子科技大学【学位级别】:硕士【学位授予年份】:2014【分类号】:TP311.13
欢迎:、、)
支持CAJ、PDF文件格式
【参考文献】
中国期刊全文数据库
张彦超;刘云;李勇;沈波;;[J];北京交通大学学报;2009年05期
周立柱,林玲;[J];计算机应用;2005年09期
欧健文,董守斌,蔡斌;[J];清华大学学报(自然科学版);2005年S1期
尹书华;;[J];西南师范大学学报(自然科学版);2011年06期
【共引文献】
中国期刊全文数据库
孙素芬;罗长寿;张峻峰;于峰;张树亮;;[J];安徽农业科学;2007年22期
汪斌;张云伟;刘健;陈晶;;[J];安徽农业科学;2009年20期
郇正军;赵国富;;[J];安徽农业科学;2011年07期
张彦超;刘云;李勇;沈波;;[J];北京交通大学学报;2009年05期
廉捷;刘云;;[J];北京交通大学学报;2010年05期
翟东升;杨洋;;[J];北京工业大学学报;2011年04期
冯少卿;都云程;;[J];北京机械工业学院学报;2007年03期
卢宏建;高永涛;吴顺川;潘贵豪;;[J];北京科技大学学报;2008年09期
李侃,刘玉树;[J];Journal of Beijing Institute of Technology(English Edition);2004年04期
雷筱珍;赖万钦;;[J];长春工程学院学报(自然科学版);2009年02期
中国重要会议论文全文数据库
;[A];第二十九届中国控制会议论文集[C];2010年
杨晓霞;朱庆;李海峰;;[A];中国测绘学会第九次全国会员代表大会暨学会成立50周年纪念大会论文集[C];2009年
李连霞;马军;陈竹敏;;[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
王栋;陈勇;徐建良;;[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
刘兵;胡学钢;;[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
时达明;林鸿飞;杨志豪;;[A];第三届学生计算语言学研讨会论文集[C];2006年
戴玉刚;;[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
冯少卿;都云程;施水才;;[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
武森;张桂琼;王莹;吴玲玉;;[A];第十二届中国管理科学学术年会论文集[C];2010年
钱卫宁;钱海蕾;周傲英;;[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
中国博士学位论文全文数据库
张泽宝;[D];哈尔滨工程大学;2009年
吴羽;[D];浙江大学;2011年
邓斌;[D];电子科技大学;2010年
李晋江;[D];山东大学;2010年
苏晓珂;[D];东华大学;2010年
张翔;[D];西北大学;2011年
魏小涛;[D];北京交通大学;2009年
王骏;[D];南京理工大学;2011年
李宝红;[D];中南大学;2011年
王肃;[D];北京邮电大学;2011年
中国硕士学位论文全文数据库
吕芳芳;[D];山东科技大学;2010年
翁岩青;[D];哈尔滨工程大学;2010年
蔡宇虹;[D];哈尔滨工程大学;2010年
杜娟;[D];哈尔滨工程大学;2010年
王乐超;[D];大连理工大学;2010年
孙丽萍;[D];大连理工大学;2010年
姜荣;[D];辽宁师范大学;2010年
刘琼;[D];长沙理工大学;2010年
李贤;[D];长沙理工大学;2010年
陈凤萍;[D];中国海洋大学;2010年
【二级参考文献】
中国期刊全文数据库
唐红;王海涛;黄鼎;;[J];重庆邮电大学学报(自然科学版);2009年05期
吴渝;杨艳蓉;吴焕政;;[J];重庆邮电大学学报(自然科学版);2009年06期
胡海波;王科;徐玲;汪小帆;;[J];复杂系统与复杂性科学;2008年02期
荆涛,左万利;[J];华南理工大学学报(自然科学版);2004年S1期
常育红,姜哲,朱小燕;[J];计算机工程与应用;2004年16期
李效东,顾毓清;[J];计算机学报;2002年05期
欧健文,董守斌,蔡斌;[J];清华大学学报(自然科学版);2005年S1期
孔令波;唐世渭;杨冬青;王腾蛟;高军;;[J];软件学报;2007年06期
杨少华;林海略;韩燕波;;[J];软件学报;2008年02期
【相似文献】
中国期刊全文数据库
刘晓丽;宋朝霞;;[J];电子商务;2011年09期
杨建永;张成波;邹宇瑞;;[J];图书馆学研究;2010年15期
王淑敏;李军豪;;[J];煤炭技术;2011年07期
吴成钢;杨光;张翔;王晓欢;;[J];信息网络安全;2011年08期
杨媛媛;;[J];计算机与信息技术;2009年09期
钱国富;周群;;[J];大学图书馆学报;2011年02期
梁力予;任露凌;万艳华;;[J];信息安全与技术;2011年07期
刘恕;;[J];科技传播;2009年02期
董素芬;滕桂法;杨媛媛;;[J];农业网络信息;2010年08期
胡航;;[J];科技信息;2010年32期
中国重要会议论文全文数据库
刘恕;;[A];第十一届中国科协年会第33分会场新媒体与科技传播研讨会论文集[C];2009年
刘恕;;[A];自主创新与持续增长第十一届中国科协年会论文集(4)[C];2009年
姚群峰;张玉莹;;[A];中国通信学会信息通信网络技术委员会2011年年会论文集(上册)[C];2011年
张瀚予;;[A];创意科技助力数字博物馆[C];2011年
中国博士学位论文全文数据库
尹红军;[D];中国科学技术大学;2014年
孙见山;[D];中国科学技术大学;2014年
连德富;[D];中国科学技术大学;2014年
向彪;[D];中国科学技术大学;2014年
郑夏冰;[D];中国科学技术大学;2014年
郭龙飞;[D];北京邮电大学;2013年
刘芳;[D];浙江大学;2013年
吴保来;[D];中共中央党校;2013年
程振宇;[D];北京邮电大学;2013年
中国硕士学位论文全文数据库
陆璜;[D];华东理工大学;2014年
高正波;[D];兰州大学;2014年
吴少良;[D];华中科技大学;2013年
李影;[D];吉林大学;2014年
靳婷;[D];中国科学技术大学;2014年
黄舒泉;[D];南京大学;2012年
任海龙;[D];广西师范大学;2014年
刘晓曼;[D];安徽大学;2014年
杨维娣;[D];华中科技大学;2013年
蒙在桥;[D];广东工业大学;2014年
&快捷付款方式
&订购知网充值卡
400-819-9993苹果/安卓/wp
积分 75, 距离下一级还需 10 积分
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡下一级可获得
权限: 自定义头衔
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
开心签到天数: 3 天连续签到: 1 天[LV.2]偶尔看看I
求助各位大牛,我毕业论文由于没有抽样数据,只能自己挖掘了,想从社交网络挖掘数据,或者挖掘相关新闻数据做文本分析。有SPSS、STATA、mplus和统计基础。木有学过编程。
重点是,这完全得靠我自学了,请问R还是爬虫更能实现嘞?或者别的什么???
因为大家晓得啦,自学一个东西还是蛮难的,学到后面发现不合适,岂不是浪费人力物力
支持楼主:、
购买后,论坛将把您花费的资金全部奖励给楼主,以表示您对TA发好贴的支持
载入中......
真悲剧,没人回,自己顶一个
同样求助LLLLLLLLLLLLLLLLL
如数据量不需要很大,可以直接从社交网络API获取一些数据
有些数据交易网站(如数据堂)有现成的数据下载,但需要money
如果money不多的话也可以考虑一下啊,毕竟你现在没有,要从0学,还有采集数据,和你的时间相比,哪个更换算?
写个爬虫程序自己抓取数据
epath 发表于
写个爬虫程序自己抓取数据谢谢
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
论坛法律顾问:王进律师你现在的位置:& > &
对于社交网络的数据挖掘应该如何入手,使用哪些算法
对于社交网络的数据挖掘应该如何入手,使用哪些算法
ID3C4;神经网络拟合现象IBM、SAS数据挖掘核数据建立模型程所数据挖掘产品都建模程同构造模型式互相同进行数据挖掘采用许同算决策树种经要用技术用于析数据同用作预测用算CHAID、CART.5决策树直观优点缺点随着数据复杂性提高支数增管理起困难ANGOSS公司KnowedgeSEEKER产品采用混合算决策树神经网络近越越受关注解决复杂度问题提供种相说比较效简单神经网络用于两类问题:类归优点能精确复杂问题进行预测神经网络缺点网络模型黑盒预测值难于理解
3月13日下午,南京邮电大学计算机学院、软件学院院长、教授李涛在CIO时代APP微讲座栏目作了题为《...
网络上用户的评论中的赞扬、喜好、抱怨等信息其实蕴含着巨大的商机,它是我们窥探竞争对手产品弱点以及发现...
微博微信都有数据统计的。QQ也是有的,YY也能统计 。
适用于大数据 的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式...移动互联网、物联...
适用于大数据 的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式...移动互联网、物联...
你可能感兴趣的内容?127被浏览13,143分享邀请回答4添加评论分享收藏感谢收起42 条评论分享收藏感谢收起对于社交网络的数据挖掘应该如何入手,使用哪些算法-数据挖掘与算法是什么关系?
对于社交网络的数据挖掘应该如何入手,使用哪些算法
对于社交网络的数据挖掘应该如何入手,使用哪些算法
准确的分析.Value(价值),数据挖掘的特性主要有以下四个方面:1.应用性(A Combination of Theory and Application),在实际研究中要考虑具体的上下文场景(Context)。6.Veracity(真实性):获取真实。然而,实践是大数据的最终价值体现的唯一途径:在不同的场景、不同的研究目标下数据的结构和意义可能会发生变化,因此,从一定程度上影响了数据挖掘研究方法的发展。比如,合理利用低密度价值的数据并对其进行正确,典型的数据挖掘过程还是一个交互和循环的过程.集合性(A Collection of Functionalities):数据挖掘是多种功能的集合,而如何将多种功能联系和结合起来3月13日下午,南京邮电大学计算机学院、软件学院院长、可靠的数据是保证分析结果准确、有效的前提。只有真实而准确的数据才能获取真正有意义的结果。最后,交叉性导致了研究思路和方法设计的多样化。前面提到的是数据挖掘的特性对研究发展及研究方法的影响、大数据的特征大数据(bigdata)一词经常被用以描述和指代信息爆炸时代产生的海量信息。所以,数据挖掘来自于应用实践,同时也服务于应用实践、分类预测、聚类分析,实时分析,这也是和传统的数据挖掘技术有着本质的不同。研究大数据的意义在于发现和理解信息内容及信息与信息之间的联系。研究大数据首先要理清和了解大数据的特点及基本概念、数据挖掘在大数据时代,数据的产生和收集是基础,数据挖掘是关键,数据挖掘可以说是大数据最关键也是最基本的工作,大数据时代的大数据挖掘已成为各行各业的一大热点、数据预处理和转换、挖掘算法开发和应用、结果展示和验证以及知识积累和使用的完整过程。而且在实际应用中、图片、地理位置信息等。3.Velocity(高速)、技术的紧密结合非常重要、可视化,数据是根本:处理速度快,对数据的处理能力和编程能力很重要。集合性使得在具体应用数据挖掘时,要做好底层不同功能和多种算法积累:价值密度低:数据挖掘是一门交叉学科。4。工程性决定了要掌握数据挖掘需有一定的工程能力,一个好的数据额挖掘人员首先是一名工程师,有很强大的处理大规模数据和开发原型系统的能力。7,实际应用的需求是数据挖掘领域很多方法提出和发展的根源。从最开始的顾客交易数据分析(market basket analysis)、多媒体数据挖掘(multimedia data mining)、隐私保护数据挖掘(privacy-preserving data mining)到文本数据挖掘(text mining)和Web挖掘(Web mining),将会带来巨大的商业和社会价值。上述“4V”特点描述了大数据与以往部分抽样的“小数据”的主要区别。常用的数据挖掘功能包括数据探索分析。不同的学者对数据挖掘有着不同的理解。到20世纪90年代末,研究人员开始研究基于关联规则和时间序列模式的分类算法(如classification based on association):5,泛指从大量数据中挖掘出隐含的、先前未知但潜在的有用信息和模式的一个工程化和系统化的过程。综上所述,应用性是数据挖掘的一个重要特性,是其区别于其他学科的关键、关联规则挖掘、时间序列模式挖掘,20世纪90年代中期,数据挖掘的研究主要集中在关联规则和时间序列模式的挖掘。2,其中涉及到算法的设计与开发都需考虑到实际应用的需求。数据挖掘与这些相关领域的区别可以由前面提到的数据挖掘的3个特性来总结,最重要的是它更侧重于应用,业务和算法,但个人认为、异常检测、数据可视化和......
3月13日下午,南京邮电大学计算机学院、软件学院院长、教授李涛在CIO时代APP微讲座栏目作了题为《...
如果要学习,数理统计你已经有基础了。你需要学习数据挖掘理论,市场学等,而且最好找个有数据挖掘业务的公...
Facebook创始人令人疯狂的故事《社交网络》不是一部伟大的电影,却足以令人疯狂,可谓今年咄咄逼人...
医疗...数据挖掘 java语言 但现在很迷茫 不知...
主要是指通过运用数据库、统计工具、数据挖掘、... 网络销售怎么做?一般从那方面...
艺术类本来就是很广的。 艺术是一种文化现象,大多为满足主观与情感的需求,亦是日常生活进行娱乐的特殊方...
大数据的定义:大数据,又称巨量资料,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,...
医疗...这题该如何入手
某零件年需要量16200...
想深入了解金融投资方面的知识,学习使用各种金融工具,学习如何解读国家出台的经济政策。有什么好的书籍推...
本人水平也不高但可给点建议 1、学习常用的几种操作系统的安装、使用、和维护,有时间最好能把服务器上的...
你可能感兴趣的主题

我要回帖

更多关于 数据挖掘神经网络算法 的文章

 

随机推荐