做数据分析书籍不得不看的书有哪些

当前位置: &
6,855 次阅读 -
我讲数据分析分为四个主要部分和一个额外部分,请看下图:
这是我给所有新人第一次接触数据分析同学的建议。 任何一门知识的学习都是循序渐进,有由简入难。 下面是我针对每一个部分给出的详细书单。在给出书单前我(想说几句:
书籍大部分都是全英文版本的,只有少量趣味书籍是中文的(因为中文书籍优秀的真的不多)。 至于为什么要用全英文,我会在下面给出一些简单的说明
核心篇是最最最最最重要的,你可能需要看两遍,三遍,甚至四遍,五遍。。。在以后的中级或者高级学习中,你还需要不断的回顾核心篇内容!我本人至少看了有10遍,现在有时还是需要回到书本当中翻阅。
中级篇当初我首先推荐R。原因很多,我就只说一个:免费
为什么要用英文呢? 我用几句最简单的话来说一下原因(原谅我中文不好,说不出高大上的原因)。请看图:
下面请看书单:
中级篇:三个部分
第一部分: SAS
第二部分: SPSS
第三部分: R
走到这里,实属不容易。原本我想继续推荐书籍,可是我发现当大家真的走到高级这一步的时候,其实已经不需要书籍的引导了。 虽然如此,我还是强烈推荐一本书:
又是WIELY 出品,质量不用怀疑。我可以担保,如果你真的能弄清楚这本书上的每一个模块,那么数据挖掘建模你基本上已经搞定了。
额外:这是针对网页分析的,我只推荐三本书: 作者Avinash Kaushik,请大家谷歌一下,然后看一下右面的介绍就OK。 文字形容这个家伙都是多余的,曾经来我们学校开讲座的时候,队伍是排到酒吧门口的(校园的酒吧)。
书籍就这么多。 当然,还有更多经典的书籍值得我们学习,但是每个人的时间是有限的。比如说R,我觉得这方面的资料和书籍你这辈子也看不完, 我推荐的R in action, 大家可以去看看评价(请记住: 我说的是英文)。 我觉得,学完知识最重要的还是要去不断的实践,不断的去思考。书看太多未必是好事,有时会迷失在一个理论里而走不出来,我当初学神经网络,差点把自己搞成神经病!!
这里增加三本书籍,主要是针对火的不行的两门开源语言:R和PYTHON
这本书也是我最近一直研读的书籍,作者是Pandas包的开发者,其对python的见解非常深厚。该书介绍了python中常用的几个数据分析包,学完这本书,基本上数据处理这一块你就能驾驭了!!
推荐指数:五星
可视化是数据分析的一门艺术,在R语言里有一个神一样的包叫做ggplot2,其以绘图简单,优美,灵活,简称信达雅而出名,这也是我现在还继续使用的R的最主要的原因。 而这本书是绝对是市面上最好的学习ggplot的教材,大量的实战案例,让你学的根本就停不下来。
推荐指数:四星
大头系列的书在国内已经很流行了,这本书我依旧继承了大头特色,简单,生动。缺点还是那句话,废话有点多。
推荐指数:三星
作者:知乎
知乎原帖》》/question/
注:转载文章均来自于公开网络,仅供学习使用,不会用于任何商业用途,如果侵犯到原作者的权益,请您与我们联系删除或者授权事宜,联系邮箱:contact@dataunion.org。转载数盟网站文章请注明原文章作者,否则产生的任何版权纠纷与数盟无关。
相关文章!
不用想啦,马上 发表自已的想法.
做最棒的数据科学社区
扫描二维码,加微信公众号
联系我们:新手掌柜不得不看的数据分析_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
新手掌柜不得不看的数据分析
上传于||文档简介
&&现​在​网​上​做​生​意​,​都​得​懂​点​儿​数​据​分​析​才​玩​得​转​。
阅读已结束,如果下载本文需要使用2下载券
想免费下载本文?
定制HR最喜欢的简历
你可能喜欢|沙龙精选自网站分析公会入门读物:深入浅出数据分析 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。难易程度:非常易。啤酒与尿布 通过案例来说事情,而且是最经典的例子。难易程度:非常易。数据之美 一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和做法非常有帮助。难易程度:易。数学之美 这本书非常棒啦,入门读起来很不错!数据分析:SciPy and NumPy 这本书可以归类为数据分析书吧,因为numpy和scipy真的是非常强大啊。Python for Data Analysis 作者是Pandas这个包的作者,看过他在Scipy会议上的演讲,实例非常强!Bad Data Handbook 很好玩的书,作者的角度很不同。适合入门的教程:集体智慧编程 学习数据分析、数据挖掘、机器学习人员应该仔细阅读的第一本书。作者通过实际例子介绍了机器学习和数据挖掘中的算法,浅显易懂,还有可执行的Python代码。难易程度:中。Machine Learning in Action 用人话把复杂难懂的机器学习算法解释清楚了,其中有零星的数学公式,但是是以解释清楚为目的的。而且有Python代码,大赞!目前中科院的王斌老师已经翻译这本书了 机器学习实战 这本书本身质量就很高,王老师的翻译质量也很高。难易程度:中。我带的研究生入门必看数目之一!Building Machine Learning Systems with Python 虽然是英文的,但是由于写得很简单,比较理解,又有 Python 代码跟着,辅助理解。数据挖掘导论 最近几年数据挖掘教材中比较好的一本书,被美国诸多大学的数据挖掘课作为教材,没有推荐Jiawei Han老师的那本书,因为个人觉得那本书对于初学者来说不太容易读懂。难易程度:中上。Machine Learning for Hackers 也是通过实例讲解机器学习算法,用R实现的,可以一边学习机器学习一边学习R。稍微专业些的:Introduction to Semi-Supervised Learning 半监督学习必读必看的书。Learning to Rank for Information Retrieval 微软亚院刘铁岩老师关于LTR的著作,啥都不说了,推荐!Learning to Rank for Information Retrieval and Natural Language Processing 李航老师关于LTR的书,也是当时他在微软亚院时候的书,可见微软亚院对LTR的研究之深,贡献之大。推荐系统实践 这本书不用说了,研究推荐系统必须要读的书,而且是第一本要读的书。Graphical Models, Exponential Families, and Variational Inference 这个是Jordan老爷子和他的得意门徒 Martin J Wainwright 在 Foundation of Machine Learning Research上的创刊号,可以免费下载,比较难懂,但是一旦读通了,graphical model的相关内容就可以踏平了。Natural Language Processing with Python NLP 经典,其实主要是讲 NLTK 这个包,但是啊,NLTK 这个包几乎涵盖了 NLP 的很多内容了啊!机器学习教材:The Elements of Statistical Learning 这本书有对应的中文版:统计学习基础 。书中配有R包,非常赞!可以参照着代码学习算法。统计学习方法 李航老师的扛鼎之作,强烈推荐。难易程度:难。Machine Learning 作者Kevin Murrphy教授是机器学习领域中年少有为的代表。这书是他的集大成之作,写完之后,就去Google了,产学研结合,没有比这个更好的了。Machine Learning 这书和上面的书不是一本!这书叫:Machine Learning: An Algorithmic Perspective 之前做过我带的研究生教材,由于配有代码,所以理解起来比较容易。Pattern Recognition And Machine Learning 经典中的经典。Bayesian Reasoning and Machine Learning 看名字就知道了,彻彻底底的Bayesian学派的书,里面的内容非常多,有一张图将机器学习中设计算法的关系总结了一下,很棒。Probabilistic Graphical Models鸿篇巨制,这书谁要是读完了告诉我一声。Convex Optimization 凸优化中最好的教材,没有之一了。课程也非常棒,Stephen老师拿着纸一步一步推到,图一点一点画,太棒了。小编告诉你,以上的书小编没有全部读过!小编也只是知道开始的入门书籍,所以大家选择的话可以仔细查找资料,看看是不是真的适合自己!实战经验(shizhanjingyan) 
 文章为作者独立观点,不代表微头条立场
的最新文章
6月2日凌晨,有“互联网女皇”之称的Mary Meeker今天在美国Code大会上发布了2016年的互联网趋真实的故事。要想生存下来,最好的策略是什么呢?最好的策略是不管身处高潮还是低谷,相信这一切都是暂时的。最重要的一点是当你经历过一切,你便能成长很多。当你的人生真正开始,困惑或迷茫那些零七碎八,才不会再困扰你。“人生最大的痛苦不是我输了,而是我差点赢了。”滴滴与Uber中国的用户中,重合比例达到37%;
双方用户忠诚度均高,保持品牌独立运营是必然选择。低收入群体和高收入群体,对医保依赖度差别有多大?
电视和互联网,那一个渠道对老年人求医影响更大?
多少用户在心理上对抗拒就医?
……一个草根女子,成就了一段传奇经历年底了,有一阵子没更新,就给大家推荐一些好书吧。花样新媒体,别样新公关在小地方工作,像是领到了一张50年后的死亡通知书。在大城市工作,像是拿到了一张虚构的藏宝图。如何做网络品牌营销前两天写工作日志,在看一些纪念性的小东西。其中一张今年3月从上海到北京的火车票,多少勾起了我对当时的回忆。望人生的痛苦在于追求错误的东西。所谓追求错误的东西,就是你在无限趋近于它的时候,才猛然发现,你和它是不连续的。跨部门沟通是一件绕不开的职场之事!如何通过自学,成为数据挖掘“高手”?22岁创业、25岁财务自由的女CEO:我只相信数据,而不是任何人的判断来源:王冠雄(微信号:wang-guanxiong) 开门见山,我基本同意刘强东的判断。这便是,未来五年内的来源:特大号一分钟看懂2C和2B创业的区别▼创始人卖的产品用户商业模式做客户的方式产品体验竞争对手媒体关注度数据分析+数据挖掘必看书籍!时移势易,随着审美水平的提高,随着工作需求的增加,大家对一份优秀的幻灯片的需求也变的越来越高。对于许多头痛于制作PPT的同学来说,高质量的PPT模板确实是一剂灵丹妙药可以帮助自己解决不小的麻烦。看过之后才发现,相见恨晚啊!!!产品也许不一定是最好的,但消费者在情绪被卷入后,却愿意无条件地维护产品的口碑。正如每个玉米心中都有一个李宇春,他们会把自己想象中任何的优点加诸于偶像,并且屏蔽偶像本来存在的一切缺点。资本市场,毕竟总是优胜劣汰的丛林法则,我们曾以为自己是浪尖上的弄潮儿,但现在才悟到:当你丧失了对市场的嗅觉,就是物联网吗?善于解决问题的能力通常是缜密而系统化思维的产物,任何一个有才之士都能获得这种能力。有序的思维工作方式并不会扼杀灵感及创造力,反而会助长灵感及创造力的产生。爆是产品策略产品结构要单一,要有做精品的思维;扁是组织结构扁平化,快速决策,高效微创新;爽是团队激励要给足,领导者要放低姿态,在员工招聘上要用最好的人。有了核心竞争力,就等于脚踏七色云彩。无论在哪里,你都将是团队里不可替代的角色。在自己的专业领域做到极致,尔后那些“钱多、事少、离家近”都只不过是你应得的附属品了。其实所有的创业公司都存在这个问题,像唐僧一样讲使命,讲故事的人才有,像孙悟空一样的技术大牛有,也不缺一群程序猿、产品狗等等,就是没有能够明白怎么赚钱的角色,就是没有二师兄这种角色没有什么是恒定不变的,世界变化的速度又太快,要削多少个苹果才能证悟用户需求?文章来源于慧聪网作者:何慕从营销维度来讲,我们将通向产品“畅销、长销、高价销”的路径分为“硬件”支撑和“软件|沙龙精选自网络态度普通管理者情商是管理者重要的特质,高情商在管理者中主要表现为情绪稳定。对于初级管理者而言我要从徐家汇赶去机场,于是匆匆结束了一个会议,在美罗大厦前搜索出租车。一辆大众发现了我,非常专业地停在我面前。这一停,就有了后面的这个让我深感震撼的故事,像上了一堂生动的MBA课。牛轰标题的13种方法、1个内容编辑的基本底线、社区早期内容预运营的4步骤、8招hold住内容方向的产品运营、3条内容运营的进化路大多数人只知道“治大国如烹小鲜”,而不知道这只是半句话,其实老子的意思是:管理者如果能顺应人性和自然规律,治大国就如炒一碟小菜那样容易了。这篇文章,正是一个食堂小老板在实践中总结出的管理经验,读起来让人拍案叫绝。在他看来,大公司的很多复杂制度都是瞎掰,别人怎么管,都不如自己管自己。你对这个问题怎么看?|小编精选自网络想象一下,50年后的2065年,我们都老了,如果那时还有朋友圈 ,我们会怎么写呢?|今天是老你爸妈知道你搞的活动这么下流么?互联网行业像一座围城。城外的人蜂拥而入,城内的人习以为常。|小编精选自华商韬略(ID:hstl8888)来源:长江商业评论新东方创始人俞敏洪不见得是中国企业界最有韬略|小编精选自网优雇佣军想首先问大家一个问题:你觉得中国人聪明还是美国人聪明?我见过最好的回答是美籍华人。我们文章来源于公众号阑夕(techread)“双十一”临近,情理之中的“猫狗大战”转瞬变成意料之外的“鸡鸭同池”文章来源于微信公众号吴蚊米,作者:小恺1.圈人做一份店铺海报,经过好友推荐,拉动朋友通过淘口令进店购物。在此文\吴晓波我记得我中学的时候,其实没有什么焦虑,那时候很快乐,踢足球啊、玩啊,被爸爸妈妈打,最多赶出去啊这样淘宝是因为便宜、因为习惯,而uber是因为便宜,但是还没有习惯。每个从业人员都是棋子,没有绝对的职业安全感和归属感。|小编精选自IT之家导读:徐家骏用了十年时间从华为一个普通的公司员工,做到了年薪千万的副总裁。十年弹指一挥间做微信,不要过多在乎你的粉丝数有多少,粉丝的质量才是最主要的如何做好微信运营?学学人家麻辣烫是怎么做的?做传播是很花钱的,你有必要用几种简单的工具做一下检测|小编精选自网络说到管理,人们很喜欢谈论《红楼梦》中的王熙凤,欣赏她协理宁国府时的魄力。但从她短促的一生来看shizhanjingyan提供互联网商业信息、分析和观点,让从业人员不在孤独,全力为您提供实战营销平台。热门文章最新文章shizhanjingyan提供互联网商业信息、分析和观点,让从业人员不在孤独,全力为您提供实战营销平台。想了解本文作者个人信息,请上查询,加入请联系姑婆运营审核上线。一了解行业一,望尽天涯路,把握互联网的过往今生,掌握职业命脉1,了解行业《沸腾十五年》《浪潮之巅》《互联网之达芬奇密码》《不一样的平台,移动互联网时代的商业模式创新》《电商的战国》《我看电商》《改变中国互联网未来的六大力量》《信息规则 :网络经济的策略指导》《超级数字天才:为什么用数字思考是变聪明的新方法》2,了解产品《人人都是产品经理》《结网》《设计沟通十器》《产品经理手册》《神一样的产品经理》《启示录》《软件工程:实践者的研究方法》《手机研发流程与质量管理》3,交互设计、用户体验《About Face3交互设计精髓 》《触动人心》《SNS网站构建》《社交网站界面设计》《web信息架构,设计大型网站》《web导航设计》《web设计禁忌》《移动应用UI设计模式》筑巢引凤、简约至上、见微知著《yes 产品经理》4,创业数据,商业思维《精益创业》《精益创业实战》《创业四步法》《精益创业》《创业者圣经》《丰田汽车案例:精益制造的14项管理原则》《创业三十六条军规》《精益六西格玛-精益生产与六西格玛的完美整合》《平台战略》《电子商务管理视角》《营销管理》《运营管理》(这里的运营是企业运营管理的意思)《项目管理知识体系指南》《量化,大数据时代的企业管理》二,消得人憔悴,依据所处职位的职责寻求最优解决之道 1,数据分析基础书籍:《网站分析基础教程》《网站分析实战:如何以数据驱动决策,提升网站价值》《流量的秘密:Google Analytics网站分析与优化技巧》第二版技能进阶:《精通Web Analytics 2.0:用户中心科学与在线统计艺术》数据呈现:《谁说菜鸟不会数据分析》2013最新版《Excel商务图表应用与技巧108例(双色版)》《鲜活的数据:数据可视化指南》拓展训练:《大数据时代》《R语言实战》具体主题分析:搜索《精通搜索分析》淘宝《玩法变了:淘宝卖家运赢弱品牌时代》社交网站《社交网站的数据挖掘与分析》性能优化:《构建高性能web站点》《网站性能监测与优化》《大规模web服务开发技术》《高性能网站建设进阶指南》2,流量网络营销《锦囊妙计,网站推广101招》《网络营销推广实战宝典》《正在爆发的营销革命-社会化网络营销指南》《湿营销》《行动的召唤》《等待猫吠》《SEO实战密码》《SEO艺术》《搜索引擎营销-网站流量大提速》《搜索引擎优化:每天一小时》《搜索引擎优化宝典》内容营销《内容营销,网络营销的杀手级武器》3,留存内容《胜于言传:网站内容制胜宝典》《与五十位主编面对面》《web内容策略指南》活动《商品促销实战技巧一本全》策划王志纲《找魂》《推手》熊大寻《江山入划》叶茂中《想》《做》4,转化《网站转化率优化之道》《数据掘金,电子商务运营突围》《landing page优化权威指南》《淘宝卖家秘笈》《提高转化率! : 网页A/B测试与多变量测试实战指南》《啤酒与尿布》《顾客为什么购买》三,寻他千百度,蓦然回首,佳丽原来在后宫社区运营:《裸猿》《人类动物园》《亲密行为》用户行为:《会赚钱的行为经济学》《流行性物欲症》《后物欲时代的来临》广告策划:《广告武林秘笈》《广告文案传真》《大量流出》商业:《商战》《战争论》值得精读的书:《数据化管理》《超级富豪就是超级创意》《数据挖掘与数据化运营实战》《精益创业实战》《数据分析,企业的贤内助》《微力无边》《淘宝产品十年事》《推荐系统实践》《设计搜索体验》《深入理解网站优化》四,韩利老师:2014年互联网好书推荐第一部分推荐10本2014年对我工作帮助很大、我看了多遍的书,当然,有些书颇有争议,比如《微力无边》,和朋友聊天时多数人觉得本书不太好,豆瓣评分也不高。可能看书角度有关,还是推荐出来。第二部分是2014年新出版的我个人觉得不错的书,《京东技术解密》和《微信思维》不在此列,个人觉得和预期有点差距。《腾讯方法 : 一个市值1500亿美元公司的产品真经》 潘东燕、王晓明 / 机械工业出版社 / 《颠覆式创新:移动互联网时代的生存法则》 李善友 / 机械工业出版社 / 《从门外汉到BAT产品经理有多远》 张恒 / 人民邮电出版社 / 《缔造企鹅 : 产品经理是这样炼成的》 胡澈 / 电子工业出版社 / 《九败一胜 : 美团创始人王兴创业十年》 李志刚 / 北京联合出版公司 / 《第二次机器革命 : 数字化技术将如何改变我们的经济与社会》 [美]埃里克o布莱恩约弗森 / 蒋永军 / 中信出版社 / 2014-9《参与感 : 小米口碑营销内部手册》 黎万强 / 中信出版社 / 2014-8《周鸿祎自述 : 我的互联网方法论》 周鸿祎 / 中信出版社 / 2014-8《再看电商》 黄若 / 电子工业出版社 /
/ CNY《新经济,新规则》 【美】Kevin Kelly / 刘仲涛 / 电子工业出版社 / 2014-7《社交红利(修订升级版)》 徐志斌 / 北京联合出版公司 /
/《互联网创业原创精品-互联网创业密码》 刘楠、胡皓 / 电子工业出版社 / 2014-6《风吹江南之互联网金融》 陈宇(江南愤青) / 东方出版社 / 《谷歌和亚马逊如何做产品》 [美] Chris Vander Mey / 刘亦舟 / 人民邮电出版社 / 2014-6《数据之巅:大数据革命》 涂子沛 / 中信出版社 /
/《微管理》杨立东 / 电子工业出版社 / 2014-5 /《O2O进化论: 数据商业时代的全景图》 板砖大余、姜亚东 / 中信出版社 / 2014-5《互联网思维的企业》 [美] Dave Gray Thomas Vander Wal / 张 玳 / 人民邮电出版社 / 《有的放矢:NISI创业指南》 Nathan Furr、Paul Ahlstrom / 七印部落 / 华中科技大学出版社 / 《翻转课堂的可汗学院:互联时代的教育革命》 萨尔曼o可汗(Salman Khan) / 浙江人民出版社 / 《硅谷百年史:伟大的科技创新与创业历程()》 [美]阿伦o拉奥(Arun Rao)、[美]皮埃罗o斯加鲁菲(Piero Scarruffi) / 闫景立、侯爱华 / 人民邮电出版社 /
/《创业时, 我们在知乎聊什么?》 知乎 / 中信出版社 / 2014-1《孵化Twitter:从蛮荒到IPO的狂野旅程》 [美]尼克o比尔顿(Nick Bilton) / 欧常智、张宇、单旖 / 浙江人民出版社 / 2014-1&&本文由姑婆那些事儿首发,转载请注明本文出处,并附带本文链接,违者必究。文章来源:运营管理笔记(微信号:weboper)。运营管理笔记(微信号:weboper)是韩利老师开设的微信公共账号,欢迎大家关注,同时韩利老师在知乎上也经常做分享,欢迎大家关注。&姑婆那些事儿()是互联网推广运营知识分享平台,关注移动推广(android,ios)运营,网站推广运营、校园推广及互联网领域最新动态&。欢迎关注我们的微信(gupo520),新浪微博(姑婆那些事儿)。&本文由姑婆那些事儿首发,转载请注明本文出处,并附带本文链接,违者必究。
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
阅读(1382)阅读(1298)阅读(1174)阅读(955)阅读(894)阅读(865)阅读(832)阅读(770)在数据分析、挖掘方面,有哪些好书值得推荐?
在数据分析、挖掘方面,有哪些好书值得推荐?
更新,由于经常接到私信要求在这个书单之内再推荐两三本,每个人的行业背景也不一样,所以就把下面的书单归类整理一下。入门读物:数据分析:适合入门的教程:稍微专业些的:机器学习教材:二、因为问题已经更新到了马年,所以推荐几本2014年刚出的数据科学好书。(网上已经有PDF版可以下载,此处不再给出)《Doing Data Science: Straight Talk from the Frontline》:作者之一Rachel Schutt本科在密歇根大学学习数学,同时拥有纽约大学数学硕士学位,以及斯坦福大学工程经济系统和运筹学双硕士学位,美国哥伦比亚大学统计学博士学位,而后在谷歌研究所担任统计学专家。Johnson研究实验室的高级科学家兼创始人之一,目前在哥伦比亚大学讲授“数据科学导论”(Introduction to Data Science)课程。她提出了数据科学家的概念即“计算机科学家、软件工程师和统计学家的混合体。”另一位作者Cathy O’Neil是哈佛大学数学博士,麻省理工学院数学系博士后,目前在华尔街的德劭基金(D.E.Shaw)做quant。(总之是两个大牛XD)本书前面几个章节大致介绍了数据分析法、一些机器学习算法、线性回归和逻辑回归、朴素贝叶斯等等。其中有一些内容需要一些数学基础才能吃透。 第六到十章节是本书的精华,详细介绍了如何利用金融及社交网络中的数据进行数据建模分析,值得反复回味。《Agile Data Science: Building Data Analytics Applications with Hadoop》:本书适合刚入行的数据爱好者以及有两三年工作经验数据科学家,作者立志打造一个full-stack解决方案(包括开发框架、运行环境等,有了它无需再下载别的软件)来减少前期在数据准备上必须花费的大量时间。此外书中的一些例子放在了GitHub上,建议一边看书一边DIY。《Fast Data Processing with Spark》:目前市面上关于Spark的书籍不多,这本120多页的薄书可以当做预热。Spark同Hadoop一样是基于Mapreduce算法实现的分布式计算,不同的是任务的中间输出结果可以保存在内存中无需读写HDFS,所以更加适合需要进行反复迭代的机器学习算法实验。作者Holden Karau曾在亚马逊数据挖掘项目组,目前是一名在谷歌工作的软件研发工程师。著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。作者:卡牌大师链接:/question//answer/来源:知乎我之前写过一个帖子是关于数据分析书籍推荐的这套书籍可以帮助零基础的小伙伴们快速的入门并且学习数据分析我在11月份的时候更新并增加了以下三个领域的书籍:PythonHadoopMysql总共增加了18本高清PDF版本的书籍-----------------------------------------------------------------------------------请仔细看下面的介绍:我将数据分析分为四个主要部分和一个额外部分,请看下图:&img src="/DownloadImg/5/.jpg" data-rawwidth="1248" data-rawheight="572" class="origin_image zh-lightbox-thumb" width="1248" data-original="/9d4a0b1c1e43cecdc9b9e5_r.jpg"&这是我给所有新人第一次接触数据分析同学的建议。 任何一门知识的学习都是循序渐进,有由简入难。 下面是我针对每一个部分给出的详细书单。在给出书单前我(想说几句:这是我给所有新人第一次接触数据分析同学的建议。 任何一门知识的学习都是循序渐进,有由简入难。 下面是我针对每一个部分给出的详细书单。在给出书单前我(想说几句:书籍大部分都是全英文版本的,只有少量趣味书籍是中文的(因为中文书籍优秀的真的不多)。 至于为什么要用全英文,我会在下面给出一些简单的说明核心篇是最最最最最重要的,你可能需要看两遍,三遍,甚至四遍,五遍。。。在以后的中级或者高级学习中,你还需要不断的回顾核心篇内容!我本人至少看了有10遍,现在有时还是需要回到书本当中翻阅。中级篇当初我首先推荐R。原因很多,我就只说一个:免费为什么要用英文呢? 我用几句最简单的话来说一下原因(原谅我中文不好,说不出高大上的原因)。请看图:&img src="/DownloadImg/5/.jpg" data-rawwidth="758" data-rawheight="550" class="origin_image zh-lightbox-thumb" width="758" data-original="/c7c579c3efecb3518207_r.jpg"&下面请看书单:核心篇&img src="/DownloadImg/5/.jpg" data-rawwidth="1000" data-rawheight="660" class="origin_image zh-lightbox-thumb" width="1000" data-original="/9c2d7a6252efa60d78d14eb5cc5d568e_r.jpg"&新手篇:&img src="/DownloadImg/5/.jpg" data-rawwidth="1004" data-rawheight="634" class="origin_image zh-lightbox-thumb" width="1004" data-original="/2cff8f27a5dd53dbb37205_r.jpg"&中级篇:三个部分中级篇:三个部分第一部分: SAS&img src="/DownloadImg/5/.jpg" data-rawwidth="1112" data-rawheight="882" class="origin_image zh-lightbox-thumb" width="1112" data-original="/dc5bbe3038aee3870d74b_r.jpg"&第二部分: SPSS第二部分: SPSS&img src="/DownloadImg/5/.jpg" data-rawwidth="928" data-rawheight="690" class="origin_image zh-lightbox-thumb" width="928" data-original="/dee5b5aee63eb343c52ba2_r.jpg"&第三部分: R第三部分: R&img src="/DownloadImg/5/.jpg" data-rawwidth="1082" data-rawheight="988" class="origin_image zh-lightbox-thumb" width="1082" data-original="/a0c2f35d1a1bc33fafff1c2f_r.jpg"&高级篇: 走到这里,实属不容易。原本我想继续推荐书籍,可是我发现当大家真的走到高级这一步的时候,其实已经不需要书籍的引导了。 虽然如此,我还是强烈推荐一本书:&img src="/DownloadImg/5/.jpg" data-rawwidth="1066" data-rawheight="1302" class="origin_image zh-lightbox-thumb" width="1066" data-original="/47a86141abe7bc1ac28e4d_r.jpg"&又是WIELY 出品,质量不用怀疑。我可以担保,如果你真的能弄清楚这本书上的每一个模块,那么数据挖掘建模你基本上已经搞定了。额外:这是针对网页分析的,我只推荐三本书: 作者Avinash Kaushik,请大家谷歌一下,然后看一下右面的介绍就OK。 文字形容这个家伙都是多余的,曾经来我们学校开讲座的时候,队伍是排到酒吧门口的(校园的酒吧)。&img src="/DownloadImg/5/.jpg" data-rawwidth="806" data-rawheight="1008" class="origin_image zh-lightbox-thumb" width="806" data-original="/fc8eb11c_r.jpg"&&img src="/DownloadImg/5/.jpg" data-rawwidth="856" data-rawheight="1052" class="origin_image zh-lightbox-thumb" width="856" data-original="/e4ba03f222f70d647e216b2e69a39fba_r.jpg"&&img src="/DownloadImg/5/.jpg" data-rawwidth="836" data-rawheight="1074" class="origin_image zh-lightbox-thumb" width="836" data-original="/e5c0a81364eba25f0d87_r.jpg"&书籍远不止这么多。 当然,还有更多经典的书籍值得我们学习,但是每个人的时间是有限的。比如说R,我觉得这方面的资料和书籍你这辈子也看不完, 我推荐的R in action, 大家可以去看看评价(请记住: 我说的是英文)。 我觉得,学完知识最重要的还是要去不断的实践,不断的去思考。书看太多未必是好事,有时会迷失在一个理论里而走不出来,我当初学神经网络,差点把自己搞成神经病!!
番外篇: 上面所有的书籍我都有高清正版的PDF格式,本来是放在网盘共享的,可是被侵权删除了。 我也试过在某宝上卖过这些书,可是结果是“呵呵”。 很多书籍是我在英国购买或者专有账户下载的,中文书籍可能侵权,但是英文绝对没有侵权! 本来在欧洲,基本上主流教材都会有高清PDF格式供使用的。电子化书籍是一个大趋势,可是我们国内似乎还没有认识到这一点!我在11月份的时候更新了以下三个领域的书籍:PythonHadoopMysql总共增加了18本高清PDF版本的书籍著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。作者:Han Hsiao链接:/question//answer/来源:知乎热诚推荐看过的几本经典。《Head First Data Analysis》链接:电子工业出版社的经典书目系列,从数据分析基本步骤开始、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧一一讲到。图比较多,适合入门。《Head First Statistics》链接:推荐理由同上,适合入门者的经典教材。《R in Action-Data Analysis and Graphics with R》链接:R是属于GNU系统的一个自由、免费、源代码开放的软件,用于统计计算和统计制图。这本书从实用的统计研究角度逐例分析R在数据处理、模型构建、以及图形操作上的由浅入深的结合,堪称经典。《数据之魅-基于开源工具的数据分析》链接:作者是华盛顿大学理论物理学博士。这本书是数据分析的经典之一,包含大量的R语言模拟过程及结果展示,例举了很多数据分析实例和代码。《数据挖掘-市场营销、销售与客户关系管理领域应用》链接:作者是Data Miners的创办人,有二十多年的营销和客户关系管理结合数据挖掘的经验。详细介绍了作为一个数据挖掘团队需要的知识体系,包括数据库、SAS使用、统计学、机器学习、数据可视化、如何访问用户收集需求、如何写论文与沟通等等。有条件的建议看英文原版。先把这些花时间啃啃,数据分析的理论部分就基本入门了,根据实际情况还需要结合你的业务需求来进行系统的学习。以上,有时间再来更新。著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。作者:董友良链接:/question//answer/来源:知乎《精通Web Analytics 2.0——用户中心科学与在线统计艺术》
以网站分析为主,作者是Avinash Kaushik,译者是郑海平,邓天卓,两位作者是国内网站分析领域比较有经验的牛人,翻译是比较专业的。
附录:网站分析可以读的几本书(但是千万不要扎进去爬不出来了!)
  全部是英文的
1. Sybex – Advanced Web Metrics with Google Analytics. Mar 2008。虽然是2008年的书,但是里面有一些关于网站分析的基本实现方法和网站分析工具的基本原理,值得一读。如果你觉得学习了GCU还不过瘾,那么你也可以通读这本书。
2. Google Analytics by Justin Cutroni (O'Reilly shortcuts)。这本书不错,内容精练,可以全部读完。
3. Wiley-Web Analytics For Dummies (2007)。 闲得无聊可以翻翻。
4. Avinas的两本,读英文版的。不过,不建议初学者读。
5. Sybex – Landing Page Optimization – The Definitive Guide to Testing and Tuning for Conversions – Jan 2008。值得读,随便翻阅,会有收获。
6. Don’t make me think,跟网站分析不直接相关,但值得读。
纯数据分析和数据挖掘方面的,下面2本偏理论的,属于“道”这个层面,适合有几年工作经验以后再看
数据仓库(原书第4版)
数据挖掘概念与技术(原书第2版)
偏工具使用的,SAS和SPSS的书,市面上很多,说实话,都是把帮助文件翻译成中文,加一些实验示例,只能让你会使用工具,让你入门,至于说提高,主要靠工作经验的积累。
发表评论:
TA的最新馆藏

我要回帖

更多关于 数据分析书籍 的文章

 

随机推荐