数据挖掘有什么专业认证云南考试培训认证网?国内。

只需一步,快速开始
扫一扫,访问微社区
后使用快捷导航没有帐号?
CelebFaces Attributes Dataset (CelebA)is a large-scale face attributes
  日前,《福布斯观察》联合麦肯锡咨询公司发布有关大数据分析状态的调查报告,调查
这次抓取了110万的用户数据,数据分析结果如下:
从结果可以看到,知乎的男女分布
  在 Nordstrom 数据实验室度过了两年美好时光以后, 我获得了一个亚马逊网络服务 S3
  招聘和人力资源专家 Robert Half Technology 发布了美国年度科技薪资指南,研究表
123412345678910
3422次 3次
3008次 2次
2984次 0次
4585次 9次
3342次 2次
3318次 4次
3108次 1次
2542次 1次
2796次 0次
2749次 2次
7086 次 2 次
1、海量日志数据,提取出某日访问百度次数最多的那个IP。  首先是这一天,并且是访
3113 次 0 次
  数据分析能带给我们什么?我们希望通过数据分析做什么决策?  除了维持基本的店
2990 次 0 次
【“啤酒+尿布”的关联规则是怎么来的】关联,其实很简单,就是几个东西或者事件是经
2484 次 0 次
对于大数据领域的应用,当然是最多用户数的互联网三大巨头掌握数据最多了。那么,现在
2179 次 0 次
亚马逊选择68种DVD碟片进行动态定价试验,试验中根据潜在客户的人口统计资料、在亚马
2061 次 2 次
  网上爆红的蓝翔技校,学技术那家强,中国山东找蓝翔,O(_)O~最近在网上被网友们调
2010 次 0 次
  奔波儿灞案:这简直是80后父母的写照:明明对于名字的审美高度雷同,基本上来源不
1820 次 1 次
第一个部分,是看历史数据,发现规律。以社区中的活动和电商中的促销为例,这些都是常
1687 次 0 次
在下沙,有一位名叫林福广的80后创业者,掌管着淘宝第一家女鞋金冠店,同时还运营着“
1678 次 0 次
施福莱 王海艳1. CRM的定义CRM(Customer Relationship Management),即客户关系管理
1668 次 0 次
@车品觉 用户研究上来讲大数据给予的力量是还原用户真实需求➋李霈:大数据和互
1597 次 0 次
  随着经济学奖揭晓,2014年诺贝尔奖各个奖项终于花落有主。加上今年,瑞典皇家科学
1490 次 0 次
  作为全球顶级赛事,网球四大公开赛伴随着兴奋与激情,然而,它们也是将大数据转化
1485 次 0 次
要解决数字孤岛,现在的核心问题不是技术问题,而是管理问题,法律问题。上海超级计算
1397 次 0 次
  时至今日,大型企业中有超过80%的员工依赖数据来做出重要的商业决策。为了让 员工
425 次 0 次
最近学习的重点不在机器学习上面,但是现代的学科就是这么奇妙,错综复杂,玩着玩着,
717 次 0 次
前言推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,
701 次 0 次
Excel是大家非常熟悉的表格工具,借助它可以实现日程工作中最原始的数据处理的基本的
779 次 0 次
数据挖掘:What?Why?How?这个问题思考了很久,作为过来人谈一谈,建议先看下以前的
708 次 0 次
数据挖掘(Data mining),又译为资料探勘、数据挖掘、数据采矿。它是数据库知识发现(英
749 次 0 次
“店铺运营数据分析”单从这名字看起来,很多人会以为很深奥,小卖家看一眼就觉得自己
984 次 0 次
怎样利用微博数据从股市中掘金?气象台怎样预报天气并发布预警?Google如何通过搜索行
968 次 0 次
作者:Orangeprince我觉得从事数据挖掘工作,尤其是在互联网行业,主要需要三个方面的
995 次 0 次
埃森哲对数据分析人才的定义
2484 次 0 次
对于大数据领域的应用,当然是最多用户数的互联网三大巨头掌握数据最多了。那么,现在
1397 次 0 次
  时至今日,大型企业中有超过80%的员工依赖数据来做出重要的商业决策。为了让 员工
1010 次 0 次
着手写关于数据展示的文章时,我想起了许多年前第一次听到的一句话:机遇钟爱有准备的
1485 次 0 次
要解决数字孤岛,现在的核心问题不是技术问题,而是管理问题,法律问题。上海超级计算
1132 次 0 次
  看过三国演义的朋友想必都知道草船借箭这个典故,是说诸葛亮可以提前预测到三天后
2010 次 0 次
  奔波儿灞案:这简直是80后父母的写照:明明对于名字的审美高度雷同,基本上来源不
12345678910
12345678910
12345678910
会员进步榜
|会员总排行
1. 2. 3. 4. 5. 6. 7. 8.
1. 2. 3. 4. 5. 6.
  免费!拥有超过500种数据可视化效果,提供全行业大数据解决方案!推出云平台版、基
CelebFaces Attributes Dataset (CelebA)is a large-scale face attributes
  日前,《福布斯观察》联合麦肯锡咨询公司发布有关大数据分析状态的调查报告,调查
这次抓取了110万的用户数据,数据分析结果如下:
从结果可以看到,知乎的男女分布
  在 Nordstrom 数据实验室度过了两年美好时光以后, 我获得了一个亚马逊网络服务 S3
  招聘和人力资源专家 Robert Half Technology 发布了美国年度科技薪资指南,研究表
  美国的农场可能并不是遭遇大数据变革的首个场所。然而,今天的农场主正在频繁使用
  著名杂志《哈佛商业评论》曾经撰文称数据科学家是21世纪最性感的工作。现在,数据
  奔驰联合比亚迪创建新能源汽车品牌腾势,宝马7系走入电子门,特斯拉打入国内市场
  即使是知识渊博的数据科学家也能提升他们的技术水平。当谈及到分析你编纂的数据时
  考上市里的公务员后,学姐的人生目标已完成大半。但一直以来,她还有一个更为伟大
  毫无疑问,伊斯兰国(ISIS )目前是这个星球上最令人憎恶的组织之一,自 2014 年他
  大数据不仅仅是一个营销词汇,大数据是一种思维,一种技术。一言以蔽之,大数据最
  大数据已经不仅仅是一个时髦词语,大数据是国防部内部机构优先考虑的内容,向承包
  所有优秀的数据可视化依赖优异的设计,并非仅仅选择正确的图表模板那么
  微信运营,到底是什么鬼东西?周末约了几个朋友聊天,大家讨论微信怎么做,目前大
  今年流行互联网+概念,其实我认为大数据+才是我们需要重视的思维,无论是企业还是
  最近在B站恶补了一部几年前的英剧。《黑镜》(Black Mirror)。
  这片子风格奇
  关注几日科技类媒体头条,不乏资本寒冬阿里缩招创业为什么失败等山河日下的靡靡之
  公路、铁路和航线上的交通堵塞,浪费时间、增加污染,造成极高的社会成本。来往于
Powered by数据挖掘_爱数据网()-国内大数据领域最专业的学习社区
ICDM是数据挖掘领域的顶级会议之一,在数据挖掘理论与应用领域具有相当影响力。 Classification ============== #1. C4.5 Quinlan, J. R. 1993. C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers Inc. Google Scholar Count in October 200
所有伟大的产品,都离不开用户的追随与期待。 诸葛io的用户群体画像是产品用户增长的利器之一它能够帮您探究产品指标数字背后的原因。 通过诸葛io,我们已经能够持续的监测产品运营状况,比如:观察产品关键指标的变化、关注用户到目标的转化趋势、分析用户
文/源自凤凰网 摘要:宜人贷会请用户将自己的个人信息进行授权,然后通过智能大数据风控系统,全自动地对信用相关的数据进行抓取解析,作为审核参数。 宜人贷不仅仅是抓取实时信息,还会核对从第三方收集到的用户数据,结合用户申请行为和历史,进行交叉验证
在银行做了两年的数据分析和挖掘工作,较少接触互联网的应用场景,因此,一直都在思考一个问题,互联网和金融,在数据挖掘上,究竟存在什么样的区别。在对这个问题的摸索和理解过程中,发现数据挖掘本身包含很多层次。并且模型本身也是存在传统和时髦之分的
特异群组挖掘在证券金融、医疗保险、智能交通、社会网络和生命科学研究等领域具有重要应用价值。特异群组挖掘与聚类、异常挖掘都属于根据数据对象的相似性来划分数据集的数据挖掘任务,但是,特异群组挖掘在问题定义、算法设计和应用效果方面不同于聚类和异
说到中国的银行风控,大家可能都会想到两个概念,一个是央行的征信系统,还是一个就是美国的FICO。 FICO的信用评分系统究竟有多牛?为什么世界100强银行中,就有三分之二在使用它,为什么在美国没有FICO的信用评分卡就会寸步难行呢?为什么几乎全中国的银行
《推销员之死》中陷入困境的主人公威利罗曼(Willy Loman)绝对不会想到今天就职于 GuideSpark 公司的推销人员可以借助技术的帮忙来开展销售工作。 加州门洛帕克销售区域内的一家人力资源软件公司借助十多项数字技术以提升员工的销售成果,其中一项用于分析
你的模型准么? 你的模型真的有用么? 你的模型对风控有价值么? 在为P2P公司建立风控评分模型过程中,这是最常见的问题。为了回答这一问题,我们想先讨论下如何从实际业务出发,以怎样的开发流程才能建立一个有效、有用、有价值的模型,希望读后能给你一定
【编者按】机器学习是如今人工智能领域中进展最大的方面,更多的初学者开始进入了这个领域。在这篇文章中,机器学习与NLP专家、MonkeyLearn联合创始人CEO Ral Garreta面向初学者大体概括使用机器学习过程中的重要概念,应用程序和挑战,旨在让读者能够继续探
在拿破仑希尔的名著《思考与致富》中讲述了达比的故事:达比经过几年的时间快要挖掘到了金矿,却在离它三英尺的地方离开了! 现在,我不知道这个故事是否真实。但是,我肯定在我的周围有一些跟达比一样的人,这些人认为,机器学习的目的就是执行以及使用2 3组
爱数据微信国内大学有哪些大学开设了关于数据挖掘的研究生专业?PPVKE 社区
大数据未来发展前景如何?
数据分析这个行业是在大数据这个大背景下发展起来的,各行各业都可以通过培养专业数据分析人才为其企业服务。这个行业在中国职场将是一个大缺口。
Gartner预测,到2015年,全球将新增440万个与大数据相关的工作岗位;据IDC预测,美国到2018年深度数据分析人才缺口达14万-19万人,还需要数据需求和技术及应用的管理者150万人;中国能理解与应用大数据的创新人才更是稀缺资源;2013.2月份数据:数据岗位需求在上海是5万多,北京则10万多!
数据分析师是做什么的?
数据分析在企业中发挥的价值在于能够利用已有的数据资料(一手或二手的)进行观测,实验,研究分析出背后的一套规律为企业进行优化决策。业务层面的员工需要写出数据报告给老板看,如果你的分析结果对企业决策(如营销计划)有改善从而提高了业绩,那么待遇肯定是意想不到的。我经常举SPSS Modeler老师讲的台湾的例子,一个数据挖掘工程师为台新银行做挖掘每年为银行节省10几个亿的坏账呆账,那个工程师说道每年给我一个亿就行了。在职业发展方面,最初可能会是数据分析员从基层开始做起,有团队有人带,到后面逐渐上升为分析师,工程师,架构师;但是有两个方向选择,一个是走向业务层面,需要具有强大的业务管理能力来解决实际问题;另一个是走向技术层面,专门研究算法模型,为企业建立更强大的分析系统。
数据分析师职业前景是怎样的?
数据分析在国内算是刚刚起步的年头,随着所谓的13年"大数据元年"的兴起,数据分析已逐渐被企业各领域所重视。之前与一名在德国工作近10年的数据工程师聊到,在国外,如欧美发达地区,数据分析已发展到较为成熟的地步,无论是学术研究还是企业部门,对数据分析、数据库及数据挖掘等方面有着先进的技术和应用;而在国内,我也经常会接到一些中小企业的咨询,许多还没有重视甚至完全不知道有着数据分析的部门和岗位,除了像BAT一类的巨头和ZF扶持的西咸新区大数据产业园能玩玩大数据、云计算之外,国内几乎很少有能玩得动大数据的企业了。
究其原因,一方面是我国传统型企业未能打破新式的运营管理模式,一方面我国的相关人才还非常欠缺。最近,人民大学牵头组织各高校开展关于应用统计,数据分析的专业设置,却发现最大的问题是没有典型的教学案例,于是集结各方人才在今年开展了一个数据分析案例自创比赛,也谓没有资源,集思广益创造资源来促进教育发展。由此可见,数据分析在国内说方兴未艾也太早,而顺应全球的趋势,这个行业还是具有着光明的前途。无论在互联网,金融,零售,通信,ZF等各领域,数据分析将发挥着巨大的价值。
据不完全统计,数据分析师的平均薪资比同等工作经验的开发人员要高20-30%,也从另外一个侧面反映了企业对数据分析师的需求。
想转行做数据分析师,怎么入门?
第一步:统计概率理论基础
这是重中之重,千里之台,起于垒土,最重要的就是最下面的那几层。统计思维,统计方法,这里首先是市场调研数据的获取与整理,然后是最简单的描述性分析,其次是常用的推断性分析,方差分析,到高级的相关,回归等多元统计分析,掌握了这些原理,才能进行下一步。
第二步:软件操作结合分析模型进行实际运用
关于数据分析主流软件有(从上手度从易到难):Excel,SPSS,Stata,R,SAS等。首先是学会怎样操作这些软件,然后是利用软件从数据的清洗开始一步步进行处理,分析,最后输出结果,检验及解读数据。
第三步:数据挖掘或者数据分析方向性选择
其实数据分析也包含数据挖掘,但在工作中做到后面会细分到分析方向和挖掘方向,两者已有区别,关于数据挖掘也涉及到许多模型算法,如:关联法则、神经网络、决策树、遗传算法、可视技术等。
第四步:数据分析业务应用
这一步也是最难学习的一步,行业有别,业务不同,业务的不同所运用的分析方法亦有区分,实际工作是解决业务问题,因此对业务的洞察能力非常重要,而这个能力是需要在工作之中一点一滴的积累,也许目前是做零售,会用到一些相关回归方法,但转行做电商,又会用到其他的挖掘等方法。业务虽千变万化,但是分析方法却万变不离其宗,所以掌握好技术用到任何一个环境靠的只有是业务经验的积累。
CDA数据分析师认证课程是总结了大量的企业招聘要求,按照目前的状况,经过论坛长期以来的研究和实践,开发了这样一套系统学习方案。在学习过程中需要注意保持正确的心态,内容比较多,知识点比较广,例如软件操作的部分有些复杂,大家需要的是学会科学的学习方法,对于理论模型,只需要掌握背后的一套原理,对于软件操作,需要牢记一些命令,对于分析结果的解读验证,需要判断一些指标,下来反复看看同步视频,只有不断的循环练习,掌握规律,方能熟练技能。
数据分析师有国家认可的职业资格考试吗?
这个问题也经常有学员咨询到,但是大家都陷入了一个误区。有国内认可的证书吧?没有!既然数据分析在国内刚起步,很多企业都是在自己摸索前进,所以目前国内并没有类似CFA,注会等国家认可的证书。
证书的作用或许可以做一个敲门砖,但是大家不要陷入了这样的一个依赖,更不要被社会上靠打着唯一认证证书名义的机构所误导。了解自己最需要充电的内容,加强学习,方为上计。
目前国内比较有影响的是CDA和CPDA两个行业协会的认证标准,前者侧重技术和实践,后者侧重工程和管理,可以根据个人情况选择对应的机构。
CDA证书如何获得?
CDA培训课程完成后会获得CDA数据分析师培训证书。
CDA数据分析师等级认证证书,则需要参加全国统考,一年两次,此认证证书为CDA数据分析师唯一认证证书,可以作为企业事业单位选拔和聘用专业人才的任职参考依据。
PPV课提供什么课程?
PPV课开设的课程有:
CDA数据分析师认证课程:包括基础理论课程、中级工具使用课程、高级项目实践课程。
CDA数据分析师认证课程详情请查看
Hadoop分析师认证课程: Hortonworks Apache Hadoop 开发者认证 (HCAHD)、Hortonworks Apache Hadoop 管理员认证(HCAHA)、数据科学家HDP Data Science。
Hadoop认证课程详情请查看。
如何报名参加PPV课?
在PPV课的选课中心,选择你想要参加的课程,注册登录之后,点击报名链接,了解详细的课程介绍,如果是在线课程,可以直接学习,如果是线下培训课程,填写本人的报名信息,或者电话联系报名参加。
PPV课供免费下载吗?
PPV课上面资料可以提供免费下载的。你只要通过积分下载就可以。积分的获得可以查看。
PPV课线下有培训班吗?
PPV课是采用线上和线下双教学模式,导师会根据教学需求,前往全国各地进行课程培训。具体时间安排见官方通知栏广告。
参加PPV课之后能推荐就业吗?
PPV课大社区将作为与大数据职业对接平台,提供大数据需求企业发布招聘信息,为学员优先提供求职信息的发布。
如果你还有更多的问题,可以直接通过以下方式跟我们联系:
电话:&&&&1&&&&江老师
资料修改成功!
邮箱/昵称:
使用其他账号登录
还没有有PPV课账户
确认密码:
角色选择:
数据分析师大数据工程师数据挖掘工程师
保持登录(一个月)
阅读并已同意
已有PPV课账户如何系统地学习数据挖掘?
虽然是本科毕业,但是在看数据挖掘方面的算法理论时经常感觉一些公式的推导过程如天书一般,例如看svm的数学证明,EM算法..,感觉知识跳跃比较大, 是我微积分学的不好还是中间有什么好的教材补充一下,数据挖掘系统的学习过程是怎么样的,应该看那些书(中文最好)?
按投票排序
数据挖掘:What?Why?How?这个问题思考了很久,作为过来人谈一谈,建议先看下以前的一些回答。磨刀不误砍柴工。在学习数据挖掘之前应该明白几点:数据挖掘目前在中国的尚未流行开,犹如屠龙之技。数据初期的准备通常占整个数据挖掘项目工作量的70%左右。 数据挖掘本身融合了统计学、数据库和机器学习等学科,并不是新的技术。数据挖掘技术更适合业务人员学习(相比技术人员学习业务来的更高效)数据挖掘适用于传统的BI(报表、OLAP等)无法支持的领域。 数据挖掘项目通常需要重复一些毫无技术含量的工作。如果你阅读了以上内容觉得可以接受,那么继续往下看。学习一门技术要和行业靠拢,没有行业背景的技术如空中楼阁。技术尤其是计算机领域的技术发展是宽泛且快速更替的(十年前做网页设计都能成立公司),一般人没有这个精力和时间全方位的掌握所有技术细节。但是技术在结合行业之后就能够独当一面了,一方面有利于抓住用户痛点和刚性需求,另一方面能够累计行业经验,使用互联网思维跨界让你更容易取得成功。不要在学习技术时想要面面俱到,这样会失去你的核心竞争力。 一、目前国内的数据挖掘人员工作领域大致可分为三类。1)数据分析师:在拥有行业数据的电商、金融、电信、咨询等行业里做业务咨询,商务智能,出分析报告。2)数据挖掘工程师:在多媒体、电商、搜索、社交等大数据相关行业里做机器学习算法实现和分析。3)科学研究方向:在高校、科研单位、企业研究院等高大上科研机构研究新算法效率改进及未来应用。二、说说各工作领域需要掌握的技能。 (1).数据分析师需要有深厚的数理统计基础,但是对程序开发能力不做要求。需要熟练使用主流的数据挖掘(或统计分析)工具如(SAS)、、EXCEL等。需要对与所在行业有关的一切核心数据有深入的理解,以及一定的数据敏感性培养。经典图书推荐:《概率论与数理统计》、《统计学》推荐David Freedman版、《业务建模与数据挖掘》、《数据挖掘导论》、《SAS编程与数据挖掘商业案例》、《Clementine数据挖掘方法及应用 》、《Excel 2007 VBA参考大全》、《IBM SPSS Statistics 19 Statistical Procedures Companion》等。(2).数据挖掘工程师需要理解主流机器学习算法的原理和应用。需要熟悉至少一门编程语言如(Python、C、C++、Java、Delphi等)。需要理解数据库原理,能够熟练操作至少一种数据库(Mysql、SQL、DB2、Oracle等),能够明白MapReduce的原理操作以及熟练使用Hadoop系列工具更好。经典图书推荐:《数据挖掘概念与技术》、《机器学习实战》、《人工智能及其应用》、《数据库系统概论》、《算法导论》、《Web数据挖掘》、《 Python标准库》、《thinking in Java》、《Thinking in C++》、《数据结构》等。(3).科学研究方向需要深入学习数据挖掘的理论基础,包括关联规则挖掘 (Apriori和FPTree)、分类算法(C4.5、KNN、Logistic Regression、SVM等) 、聚类算法 (Kmeans、Spectral Clustering)。目标可以先吃透各自的使用情况和优缺点。相对SAS、SPSS来说R语言更适合科研人员,因为R软件是完全免费的,而且开放的社区环境提供多种附加工具包支持,更适合进行统计计算分析研究。虽然目前在国内流行度不高,但是强烈推荐。可以尝试改进一些主流算法使其更加快速高效,例如实现Hadoop平台下的SVM。需要广而深的阅读世界著名会议论文跟踪热点技术。如,,,,等等;还有数据挖掘相关领域期刊:,,,等。可以尝试参加数据挖掘比赛培养全方面解决实际问题的能力。如,等。可以尝试为一些开源项目贡献自己的代码,比如 ,等(具体可以在或上发现更多好玩的项目)。经典图书推荐:《机器学习》 《模式分类》《统计学习理论的本质》《统计学习方法》《数据挖掘实用机器学习技术》《R语言实践》,英文素质是科研人才必备的《Machine Learning: A Probabilistic Perspective》《Scaling up Machine Learning : Parallel and Distributed Approaches》《Data Mining Using SAS Enterprise Miner : A Case Study Approach》《Python for Data Analysis》等。三、以下是通信行业数据挖掘工程师的工作感受。真正从数据挖掘项目实践的角度讲,沟通能力对挖掘的兴趣爱好是最重要的,有了爱好才可以愿意钻研,有了不错的沟通能力,才可以正确理解业务问题,才能正确把业务问题转化成挖掘问题,才可以在相关不同专业人才之间清楚表达你的意图和想法,取得他们的理解和支持。所以我认为沟通能力和兴趣爱好是个人的数据挖掘的核心竞争力,是很难学到的;而其他的相关专业知识谁都可以学,算不上个人发展的核心竞争力。说到这里可能很多数据仓库专家、程序员、统计师等等都要扔砖头了,对不起,我没有别的意思,你们的专业对于数据挖掘都很重要,大家本来就是一个整体的,但是作为单独一个个体的人来说,精力有限,时间有限,不可能这些领域都能掌握,在这种情况下,选择最重要的核心,我想应该是数据挖掘技能和相关业务能力吧(从另外的一个极端的例子,我们可以看, 比如一个迷你型的挖掘项目,一个懂得市场营销和数据挖掘技能的人应该可以胜任。这其中他虽然不懂数据仓库,但是简单的Excel就足以胜任高打6万个样本的数据处理;他虽然不懂专业的展示展现技能,但是只要他自己看的懂就行了,这就无需什么展示展现;前面说过,统计技能是应该掌握的,这对一个人的迷你项目很重要;他虽然不懂编程,但是专业挖掘工具和挖掘技能足够让他操练的;这样在迷你项目中,一个懂得挖掘技能和市场营销业务能力的人就可以圆满完成了,甚至在一个数据源中根据业务需求可以无穷无尽的挖掘不同的项目思路,试问就是这个迷你项目,单纯的一个数据仓库专家、单纯的一个程序员、单纯的一个展示展现技师、甚至单纯的一个挖掘技术专家,都是无法胜任的)。这从另一个方面也说明了为什么沟通能力的重要,这些个完全不同的专业领域,想要有效有机地整合在一起进行数据挖掘项目实践,你说没有好的沟通能力行吗?数据挖掘能力只能在项目实践的熔炉中提升、升华,所以跟着项目学挖掘是最有效的捷径。国外学习挖掘的人都是一开始跟着老板做项目,刚开始不懂不要紧,越不懂越知道应该学什么,才能学得越快越有效果。我不知道国内的数据挖掘学生是怎样学的,但是从网上的一些论坛看,很多都是纸上谈兵,这样很浪费时间,很没有效率。另外现在国内关于数据挖掘的概念都很混乱,很多BI只是局限在报表的展示和简单的统计分析,却也号称是数据挖掘;另一方面,国内真正规模化实施数据挖掘的行业是屈指可数(银行、保险公司、移动通讯),其他行业的应用就只能算是小规模的,比如很多大学都有些相关的挖掘课题、挖掘项目,但都比较分散,而且都是处于摸索阶段,但是我相信数据挖掘在中国一定是好的前景,因为这是历史发展的必然。讲到移动方面的实践案例,如果你是来自移动的话,你一定知道国内有家叫华院分析的公司(申明,我跟这家公司没有任何关系,我只是站在数据挖掘者的角度分析过中国大多数的号称数据挖掘服务公司,觉得华院还不错,比很多徒有虚名的大公司来得更实际),他们的业务现在已经覆盖了绝大多数中国省级移动公司的分析挖掘项目,你上网搜索一下应该可以找到一些详细的资料吧。我对华院分析印象最深的一点就是2002年这个公司白手起家,自己不懂不要紧,一边自学一边开始拓展客户,到现在在中国的移动通讯市场全面开花,的确佩服佩服呀。他们最开始都是用EXCEL处理数据,用肉眼比较选择比较不同的模型,你可以想象这其中的艰难吧。至于移动通讯的具体的数据挖掘的应用,那太多了,比如不同话费套餐的制订、客户流失模型、不同服务交叉销售模型、不同客户对优惠的弹性分析、客户群体细分模型、不同客户生命周期模型、渠道选择模型、恶意欺诈预警模型,太多了,记住,从客户的需求出发,从实践中的问题出发,移动中可以发现太多的挖掘项目。最后告诉你一个秘密,当你数据挖掘能力提升到一定程度时,你会发现无论什么行业,其实数据挖掘的应用有大部分是重合的相似的,这样你会觉得更轻松。四、成为一名数据科学家需要掌握的技能图。(原文:)人一能之,己十之;人十能之,己千之。果能此道矣,虽愚,必明;虽柔,必强。与君共勉。以上,祝各位挖掘到自己的快乐和金矿:)
谢邀。你的情况很正常,本科毕业的学生并不能完全看懂大部分算法的证明。本科学的概率论或者是统计学都是基础,而且我不得不说,这个基础很不牢固,我个人当初就是花了很多时间补那些当初本科课程里面没有讲但是后面研究很重要的“基础”知识。这么说吧,凡事当初概率论老师课上不讲的,后面研究都是有用的。因为本科的教育目的不是让所有人都读博士,所以老师对讲义内容的选取也是可以理解的,这个就需要你自己研究了。我之前回答过相关的问题,你可以去我的回答看。不过我觉得我之前的回答比较宽泛,并不一定能够完全回答你的问题。对于知识跳跃比较大的问题,没有好办法,你什么不会,就去看哪块。说起来很简单,其实挺耗费时间的,但是一旦踏实地学了进去,你的收获一定是大大的。另外一种可以稍微省力一些的方法是去搜索,现在有很多机器学习研究者会写一些浅显入门的内容,关于SVM的就有很多,你只要在Google里面搜一下,我想一定会找到很多图文并茂,深入浅出的内容的。对于最后的括号内容(中文最好),我劝你放弃这个想法。虽然说现在教材出版已经很快了,但是教材这个东西都不是最新的内容,甚至是英文教材。教材都是把经典的方法讲出来,当作既成事实,而一本出名的英文教材翻译成中文,再出版发行,这里面的时间间隔是按年为单位计算的。另外,很遗憾的说,本土出版的、质量优秀、被业界公认的、原创数据挖掘教程还没有(till 日,说不定将来会有呢)。所以,放弃这个念头吧。下面推荐一些资源供你参考。公开课。个人认为最好的系统学习机器学习和数据挖掘的方法是去参加公开课的学习。强烈推荐的是Andrew Ng的 Machine Learning课程,再coursera上有的,据说搜狐公开课也翻译了,不过没去搜狐看过,不知道翻译质量如何。除了Coursera之外,还有很多国外优秀大学的公开课平台供你选择。国外大学关于机器学习和数据挖掘课程的主页。比如Andrew Ng在coursera上Machine Learning的前身就是Stanford CS229。美国欧洲的知名大学都有机器学习课程,课程主页上都有详细的syllabus,还有非常多非常棒的资源提供。而且国外的课程内容都是会每年更新的,所以跟这种课程也能学到很多东西。具体有哪些,你可以自己搜一下,on the top of my head,CMU Andrew Moore的课程很老很经典,Eric Xing的课程很新很棒!Jerry Zhu的CS 731 Advanced Artificial Intelligence,还有 Stanford CS369M Algorithms for Massive Data Set Analysis。。这个好像知乎上提的很少,大多数研究者也不太清楚。摘抄一下:龙星计划----计算机科学技术学术交流系列活动是一个杰出的海外华人教授回国系统讲授研究生课程的计划。由中国科学院资助,龙星计划委员会负责,
设在中国科学院计算技术研究所的龙星计划办公室提供日常服务。个人极力推崇的是2010年Eric Xing教授和Feifei Li教授在上海那期的机器学习课程,两位老师都非常负责任,内容极为翔实。听说2012年的内容也不错,网上也有视频,你可以找来听听。哦,上面的内容都不是看书,具体看什么书,我之前也写过,你自己看一下我的回答吧。我不想每个回答里面都贴自己之前回答的链接。-------------------------------------------------------------------------------------如果你觉得我的答案对你有帮助,可以考虑向我付费:
你选的入门书太难。推荐这本书相对于Jiawei Han的书来说,更合适入门。
关于数据挖掘算法的学习,推荐《数据挖掘导论》实际应用中,最关键的是对数据、业务的正确理解,算法有时候并不是那么重要(入门时很容易陷入各种fantasy的算法而不自知)
很难系统,你可以是搞计算机应用出道的,比如图像和视觉,也可以是数据库,当然你还可以是搞统计学和金融工程出道的,还可以是搜索等技术转向数据挖掘。由于方法在互相渗透,技术在不断融合,所以找到立足点处理数据就好了。
谢邀。以上说的都很全面了,大家可以参考着看,提点个人看法。我就不TMD一坨一坨的写了1,教材还是很重要的。写进教科书的都是非常基础、非常经典、非常有用的算法,你在paper上看到非常牛的算法,可能在现实工程里渣的一逼;教科书里面讲的东西,是作为基础中的基础,是继续阅读和研究的前提。熟悉了经典算法之后,你会发现,很多(not all)paper里的东西,哎呀妈呀,全TMD灌水炒冷饭。2,数据挖掘,大数据,这些词还是相当宽泛的。不同的目标,需要掌握不同的知识。归纳起来说,其实就四种:数据采集,数据挖掘,数据计算,数据存储。数据采集:就是抓数据了,主要是写爬虫。数据挖掘:涉及机器学习、推荐系统等等,从数据里挖出有用的信息。数据计算:计算框架和平台,比如Hadoop,spark,vw等数据存储:mysql、oracle、oceanbase以及nosql,以及分布式存储等。我觉得我这个分类是独创的,是全面的,是有见识的。我曾经回本科母校做了一个talk,对以上四类做了一定的介绍。可以参看:
其实我觉得数据挖掘有实际意义应该从自己的工作入手,配合自己的专业知识,适时补充拓展各种技能。
建议还是多跟项目,毕竟结合业务才学得快
说句实话。如果真的想把一个证明看懂,数学实在是太难了。用的话,找个包用一用就熟了。机器学习到底需不需要完全了解证明。目前真的存在很大争议。我的答案是需要,至少懂的越多越好。

我要回帖

更多关于 云南考试培训认证网 的文章

 

随机推荐