大数据零基础可不可以如何自学大数据

后使用快捷导航没有帐号?
只需一步,快速开始
扫一扫,访问微社区
请完成以下验证码
请完成以下验证码
今日: 8863|昨日: 1746|帖子: 15203|会员: 7147|欢迎新会员:
&&&&&系统[系统通知] 全站 说: 全站 说: 全站 说:
2017最新整理python工程师之零基础入门精品视频教程合 ...
2017年最新整理Python扩展开发单点技能突破精品视频教 ...
2017年最新整理JAVA全文检索零基础到精通全套精品视频 ...
2017最新整理基于matlab的机器学习快速入门精品系列课 ...
2017最新整理机器学习之必学数学基础知识回顾精品全套 ...
07-26 11:16
07-26 11:11
07-26 10:59
07-26 10:58
07-26 10:56
07-26 10:55
07-26 10:30
07-26 10:11
07-26 10:08
07-26 10:05
主题: 16, 帖数: 1872
主题: 19, 帖数: 639
主题: 18, 帖数: 934
主题: 8, 帖数: 156
主题: 80, 帖数: 1102
主题: 33, 帖数: 912
主题: 28, 帖数: 145
主题: 54, 帖数: 423
主题: 27, 帖数: 355
主题: 33, 帖数: 418
主题: 21, 帖数: 140
主题: 6, 帖数: 79
主题: 26, 帖数: 214
主题: 23, 帖数: 165
主题: 17, 帖数: 77
主题: 11, 帖数: 82
主题: 13, 帖数: 53
主题: 8, 帖数: 32
主题: 15, 帖数: 246
主题: 27, 帖数: 187
主题: 32, 帖数: 964
主题: 12, 帖数: 510
主题: 5, 帖数: 160
主题: 21, 帖数: 383
主题: 192, 帖数: 962
主题: 87, 帖数: 1625
主题: 25, 帖数: 76
主题: 2, 帖数: 4
主题: 11, 帖数: 77
主题: 39, 帖数: 154
主题: 39, 帖数: 94
主题: 38, 帖数: 42
主题: 29, 帖数: 72
主题: 18, 帖数: 68
主题: 43, 帖数: 396
主题: 17, 帖数: 72
主题: 0, 帖数: 0
主题: 0, 帖数: 0
主题: 26, 帖数: 135
主题: 58, 帖数: 254
主题: 27, 帖数: 119
主题: 3, 帖数: 14
主题: 76, 帖数: 165
主题: 7, 帖数: 38
主题: 44, 帖数: 237
主题: 11, 帖数: 23
主题: 20, 帖数: 33
主题: 19, 帖数: 25
主题: 11, 帖数: 38
主题: 4, 帖数: 31
主题: 7, 帖数: 28
一起自学吧最新动态、官方最新公告
版主申请、投诉建议、问题反馈等
昨天&17:18
社区所进行的活动会在这个板块通知
有意商务合作、代理等事务加 &&QQ: &&进行洽谈。
站长推荐 /6
一起自学吧专注大数据领域,站长十年经验答疑解惑,千人大群共同学习,一起成长,期待您的加入。
终身VIP先开通,后付款,新用户注册送学豆,还有多种免费赚学豆方式,全站课程任意学习。
至尊会员,活动期间打折优惠,活动过后马上涨回原价,想加入一起自学吧的同学抓紧时间哦。
多种方式,免费赚取学豆,全站课程任意学习,你还在等什么?
从大学毕业一步步走到现在,有一点小小的感悟给大家分享一下,不喜勿喷。
一起自学吧开始招募代理了,零门槛,稳定收益,名额有限,点击查看详细信息。QQ咨询: 电话咨询:
上一起自学吧
做大数据专家大数据分析课程详解,告诉你零基础该怎么学 - 简书
大数据分析课程详解,告诉你零基础该怎么学
目前想的朋友越来越多了,很多人都会在各个地方问:大数据分析课程有些什么啊?我是零基础应该怎么学习呢?这两个问题,是很多一头雾水不知道从哪开始学的朋友的共有问题,网上有很多相关答案,但是只有小部分是干货,今天我就来解决一下大家的这两个疑惑。首先是大数据分析的课程一般有些什么呢?这个问题相信很多人都知道需要数理知识,统计知识,还要学一定的编程软件,这些是成为大数据分析师的一些概括要求。具体的话,一般是有这些课程:1)阶段一:业务分析在这一阶段我们需要学习数据分析师入门,数据分析方法,Excel在工作中的高效运用。在业务分析这一块,我们要学了解分析师的现状,学习:业务分析方法论,市场分析方法论,建模分析方法论等等。有关数据分析的方法,需要学习缺失值处理,异常值处理,数据分析流程,数据处理切片,以及对比分析,环比分析,交叉分析等等。在这之后,我们就要学习excel在工作中如何才能更高效的运用,学习excel的相关实际操作。2)阶段二:数据产品规划这个阶段我们需要学习数据产品设计,数据管理MySQL,以及商业智能平台Tableau,数据产品设计。在数据产品规划这一块,我们首先要学会数据库的使用,在这一块,要具体学习数据库的操作与应用。之后学习企业级敏捷商业智能系统,Tableau desktop的使用,学习动态地图制作与分层钻取。在数据产品设计这一块上要学习产品设计与产品需求分析,数据仓库思维导图,基于CRM的用户表。3)阶段三:市场分析在这一阶段,我们需要学习市场分析方法,统计学与spss的应用。具体的我们需要学习问题问卷的设计,市场分析的具体方法,比如:行业分析,环境分析,机会分析,价格分析等等。学习Spss时,需要具体学习Spss中的数据类型,统计图和统计表,假设检验,多因素方差分析等专业软件分析方法。4)阶段四:数据挖掘建模这个阶段就是进阶了,我们需要学习数据挖掘的具体操作,学习使用数据挖掘平台:IBM,SPSS,Modeler。学习机器学习原理,面向对象编程Python等等。当然,在这些课程中如果能有相应的案例穿插那是最好的,在学习分析案例的过程中,自己学习的知识也能精进。有的人可能会说,你写的课程看上去好复杂啊,我是零基础,这些都没有接触过,我能学好吗?其实,就算你是零基础,只要你愿意学,这些课程都只是纸老虎而已,他们的确是充满了技术性与挑战性,但是我们科多大数据在设置课程的时候是充分考虑了零基础学员的情况的,课程设置都是从浅入深,一开始会把你的基础教好,之后学起进阶的东西就会快很多也轻松很多。只要你努力,跟着老师一步一步学,基础再差都可以学会。更多分析的学习方法,大家可以到科多大数据官网上进行详细了解与咨询。可能有人会对我文中提到的科多大数据充满好奇,科多大数据是工信部认证的大数据人才培养基地,同时也是中国智慧城市大数据创新联盟的副理事长单位,贵阳大数据交易所会员单位,科多大数据一直专注于做专业权威的大数据培训。欢迎大家到科多大数据进行大数据分析学习的了解。,名额有限,想参加的朋友请抓紧时间报名。官网咨询:。免费咨询电话:400-668-9713。或者直接加我们的QQ群了解详情:。想直接咨询我们的课程老师可以点击这里了解详情:
欢迎关注科多微信公众号热门推荐:
  大数据文摘作品,转载要求见文末
  作者 | SAURABH
  编译 | 张伯楠,万如苑,刘云南
  大数据的领域非常广泛,往往使想要开始学习大数据及相关技术的人望而生畏。大数据技术的种类众多,这同样使得初学者难以选择从何处下手。
  这正是我想要撰写本文的原因。本文将为你开始学习大数据的征程以及在大数据产业领域找到工作指明道路,提供帮助。目前我们面临的最大挑战就是根据我们的兴趣和技能选定正确的角色。
  为了解决这个问题,我在本文详细阐述了每个与大数据有关的角色,同时考量了工程师以及计算机科学毕业生的不同职位角色。
  我尽量详细地回答了每一项人们在学习大数据过程中遇到或可能会遇到的问题。为帮助你根据兴趣选择发展途径,我添加了一组树图,相信会对你找到正确的途径有所帮助。
  注释:学习之路树状图
  在这个树状图的帮助下,你可以根据你的兴趣和目标选择路径。 然后,你可以开始学习大数据的旅程了。 后台回复“职业路径”3个字,下载高清版本。
  目录表
  1.如何开始?
  2.在大数据领域有哪些职位需求?
  3.你的领域是什么,适合什么方向?
  4.勾勒你在大数据领域的角色
  5.如何成为一名大数据工程师?
  o什么是大数据行业术语?
  o你需要了解的系统和结构
  o学习去设计解决方案并且学习相关技术
  6.大数据学习路径
  7.资源
  1.如何开始?
  人们想开始学习大数据的时候,最常问我的问题是,“我应该学Hadoop(hadoop是一款开源软件,主要用于分布式存储和计算,他由HDFS和MapReduce计算框架组成的,他们分别是Google的GFS和MapReduce的开源实现。由于hadoop的易用性和可扩展性,因此成为最近流行的海量数据处理框架。hadoop这个单词来源于其发明者的儿子为一个玩具大象起的名字。), 分布式计算,Kafka(Kafka是由LinkedIn开发的一个分布式基于发布/订阅的消息系统),NoSQL(泛指非关系型的数据库)还是Spark(Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处)?”
  而我通常只有一个答案:“这取决于你究竟想做什么。”
  因此,让我们用一种有条理的方式来解决这个问题。我们将一步步地探索这条学习之路。
  2. 在大数据行业有哪些职业需求?
  在大数据行业中有很多领域。通常来说它们可以被分为两类:
大数据工程
大数据分析
  这些领域互相独立又互相关联。
  大数据工程涉及大量数据的设计,部署,获取以及维护(保存)。大数据工程师需要去设计和部署这样一个系统,使相关数据能面向不同的消费者及内部应用。
  而大数据分析的工作则是利用大数据工程师设计的系统所提供的大量数据。大数据分析包括趋势、图样分析以及开发不同的分类、预测预报系统。
  因此,简而言之,大数据分析是对数据的高级计算。而大数据工程则是进行系统设计、部署以及计算运行平台的顶层构建。
  3.你的领域是什么,适合什么方向?
  现在我们已经了解了行业中可供选择的职业种类,让我们想办法来确定哪个领域适合你。这样,我们才能确定你在这个行业中的位置。
  通常来说,基于你的教育背景和行业经验我们可以进行如下分类:
  (包括兴趣,而不一定与你的大学教育有关)
计算机科学
计算机工程师(在数据相关领域工作)
  因此,通过上面的分类,你可以把自己的领域定位如下:
  例1:“我是一名计算机科学毕业生,不过没有坚实的数学技巧。”
  你对计算机科学或者数学有兴趣,但是之前没有相关经验,你将被定义为一个新人。
  例2:“我是一个计算机科学毕业生,目前正从事数据库开发工作。”
  你的兴趣在计算机科学方向,你适合计算机工程师(数据相关工程)的角色。
  例3:“我正作为数据科学家从事统计工作。”
  你对数学领域有兴趣,适合数据科学家的职业角色。
  因此,参照着定位你的领域吧。
  (此处定义的领域对你确定在大数据行业的学习路径至关重要。)
  4.根据领域规划你的角色
  现在你已经确定了你的领域,下一步,让我们规划出你要努力的目标职位吧。
  如果你有卓越的编程技巧并理解计算机如何在网络(基础)上运作,而你对数学和统计学毫无兴趣,在这种情况下,你应该朝着大数据工程职位努力。
  如果你擅长编程同时有数学或者统计学的教育背景或兴趣,你应该朝着大数据分析师职位努力。
  5.如何成为一名大数据工程师
  让我们先定义一下,一名受到行业承认的大数据工程师都需要学习和了解什么。首先以及最重要的一步是确认你的需求。你不能在不清楚个人需求的情况下直接开始学习大数据。否则,你将一直盲人摸象。
  为了明确你的需求,你必须了解常用的大数据术语。所以让我们来看一下大数据到底意味着什么?
  5.1 大数据术语
  大数据工程通常包括两个方面 C 数据需求以及处理需求。
  5.1.1 数据需求术语
  结构:你应该知道数据可以储存在表中或者文件中。储存在一个预定义的数据模型(即拥有架构)中的数据称为结构化数据。如果数据储存在文件中且没有预定义模型,则称为非结构化数据。(种类:结构化/非结构化)。
  容量:我们用容量来定义数据的数量。(种类:S/M/L/XL/XXL/流)
  Sink吞吐量:用系统所能接受的数据率来定义Sink吞吐量。(种类:H/M/L)
   源吞吐量:定义为数据更新和转化进入系统的速度。(种类:H/M/L)
  5.1.2 处理需求术语
  查询时间:系统查询所需时间。(种类:长/中/短)
  处理时间:处理数据所需时间。(种类:长/中/短)
  精度:数据处理的精确度。(种类:准确/大约)
  5.2 你需要知道的系统和架构
  情景1:
  为分析一个公司的销售表现需要设计一个系统,即创建一个数据池,数据池来自于多重数据源,比如客户数据、领导数据、客服中心数据、销售数据、产品数据、博客等。
  5.3 学习设计解决方案和技术
  情节1的解决方案:销售数据池
  (这是我的个人解决方案,如果你想到一个更高明的解决方案请在下面分享一下)
  那么,一个数据工程师会怎样解决这个问题呢?
  需要记住的一点是,大数据系统的目的不仅仅是无缝整合各种来源的数据,而使其可用,同时它必须能使得,用于开发应用系统的数据的分析和利用变得简单迅速和易得(在这个案例中是智能控制面板)。
  定义最后的目标:
  1. 通过整合各种来源的数据创建一个数据池。
  2. 每隔一定时间自动更新数据(在这个案例中可能是一周一次)。
  3. 可用于分析的数据(在记录时间内,甚至可能是每天)
  4. 易得的架构和无缝部署的分析控制面板。
  既然我们知道了我们最后的目标,让我们尽量用正式术语制定我们的要求吧。
  5.3.1 数据相关要求
  结构:大部分数据是结构化的,并具有一个定义了的数据模型。但数据源如网络日志,客户互动/呼叫中心数据,销售目录中的图像数据,产品广告数据等是非结构化的。 图像和多媒体广告数据的可用性和要求可能取决于各个公司。
  结论:结构化和非结构化数据
  大小:L或XL(选择Hadoop)
  Sink 吞吐量:高
  质量:中等(Hadoop&Kafka)
  完整性:不完整
  5.3.2 处理相关要求
  查询时间:中至长
  处理时间:中至短
  精度:准确
  随着多个数据源的集成,重要的是要注意不同的数据将以不同的速率进入系统。 例如,网络日志可用高颗粒度连续流进入系统。
  基于上述我们对系统要求的分析,我们可以推荐以下大数据体系。
  6.大数据学习路径
  现在,你已经对大数据行业,大数据从业人员的不同角色和要求有所了解。 我们来看看你应该遵循哪条路来成为一名大数据工程师。
  我们知道大数据领域充斥着多种技术。 因此,你学习与你的大数据工作角色相关的技术非常重要。这与任何常规领域有点不同,如数据科学和机器学习中,你可以从某些地方开始并努力完成这一领域内的所有工作。
  下面你会发现一个你应该通过的树状图,以找到你自己的路。即使树状图中的一些技术被指向是数据科学家的强项,但是如果你走上一条路,知道所有的技术直到“树叶节点”总是很好的。 该树状图源自lambda架构范例。
  注释:学习之路树状图
  任何想要调配应用程序的工程师必须知道的基本概念之一是Bash 脚本编程。你必须对linux和bash 脚本编程感到舒适。这是处理大数据的基本要求。
  核心是,大部分大数据技术都是用Java或Scala编写的。但是别担心,如果你不想用这些语言编写代码,那么你可以选择Python或者R,因为大部分的大数据技术现在都支持Python和R。
  因此,你可以从上述任何一种语言开始。 我建议选择Python或Java。
  接下来,你需要熟悉云端工作。 这是因为如果你没有在云端处理大数据,没有人会认真对待。 请尝试在AWS,softlayer或任何其他云端供应商上练习小型数据集。 他们大多数都有一个免费的层次,让学生练习。如果你想的话,你可以暂时跳过此步骤,但请务必在进行任何面试之前在云端工作。
  接下来,你需要了解一个分布式文件系统。最流行的分布式文件系统就是Hadoop分布式文件系统。在这个阶段你还可以学习一些你发现与你所在领域相关的NoSQL数据库。下图可以帮助你选择一个NoSQL数据库,以便根据你感兴趣的领域进行学习。
  到目前为止的路径是每个大数据工程师必须知道的硬性基础知识。
  现在,你决定是否要处理数据流或静止的大量数据。 这是用于定义大数据(Volume,Velocity,Variety和Veracity)的四个V中的两个之间的选择。
  那么让我们假设你已经决定使用数据流来开发实时或近实时分析系统。 之后你应该采取卡夫卡(kafka)之路,或者还可以采取Mapreduce的路径。然后你按照你自己创建的路径。 请注意,在Mapreduce路径中,你不需要同时学习pig和hive。 只学习其中之一就足够了。
  总结:通过树状图的方式。
从根节点开始,并执行深度优先的通过方式。
在每个节点停止查验链接中给出的资源。
如果你有充足的知识,并且在使用该技术方面有相当的信心,那么请转到下一个节点。
在每个节点尝试完成至少3个编程问题。
移动到下一个节点。
到达树叶节点。
从替代路径开始。
  最后一步(#7)阻碍你! 说实话,没有应用程序只有流处理或慢速延迟数据处理。 因此,你在技术上需要成为执行完整的lambda架构的高手。
  另外,请注意,这不是学习大数据技术的唯一方法。 你可以随时创建自己的路径。 但这是一个可以被任何人使用的路径。
  如果你想进入大数据分析世界,你可以遵循相同的路径,但不要尝试让所有东西都变得完美。
  对于能够处理大数据的数据科学家,你需要在下面的树状图中添加一些机器学习渠道,并将重点放在机器学习渠道上,而不是下面提供的树状图。 但我们可以稍后讨论机器学习渠道。
  根据你在上述树状图中使用的数据类型,添加选择的NoSQL数据库。
  该表格表示数据存储类型要求及相应的软件选择
  如你所见,有大量的NoSQL数据库可供选择。 所以它常常取决于你将要使用的数据类型。
  而且为了给采用什么类型的NoSQL数据库提供一个明确的答案,你需要考虑到你的系统需求,如延迟,可用性,弹性,准确性当然还有你当前处理的数据类型。
  7.资源
  初学者的Bash指南,来自Machtelt Garrels
  1.Python
让每个人变成python专家,来自Coursera(https://www.coursera.org/specializations/python)
用Python学数据科学之路,来自Coursera(/learning-paths-data-science-business-analytics-business-intelligence-big-data/)
  2. Java
Java编程简介1:开始使用Java编码,来自 Udemy(https://www.edx.org/course/introduction-programming-java-1-starting-uc3mx-it-1-1x)
中级和高级Java编程,来自Udemy(/intermediate-advanced-java-programming/)
Java 编程介绍2,来自 Udemy(https://www.edx.org/course/introduction-programming-java-2-writing-uc3mx-it-1-2x)
面向对象Java编程:数据结构和超越专业化,来自Coursera(https://www.coursera.org/specializations/java-object-oriented)
大数据技术基础,来自亚马逊网络服务(https://www.edx.org/course/introduction-programming-java-starting-uc3mx-it-1-1x)
AWS上的大数据,来自亚马逊网络服务(/training/course-deions/bigdata/)
  4. HDFS
大数据和Hadoop 要点,来自 Udemy(/big-data-and-hadoop-essentials-free-tutorial/)
大数据基础,来自大数据大学(/learn/big-data/)
Hadoop入门工具包(/hadoopstarterkit/)
Apache Hadoop文档(https://hadoop.apache.org/docs/r2.7.2/)
书--Hadoop集群部署(/product/8.do)
  5. Apache Zookeeper
Apache Zookeeper文档(/product/1.do)
书 - Zookeeper(https://zookeeper.apache.org/doc/r3.4.6/)
6. Apache Kafka
完整初学者Apache Kafka课程(/product/1.do)
学习Apache Kafka基础和高级主题(/learn-apache-kafka-basics-and-advanced-topics/)
Apache Kafka文档(https://kafka.apache.org/documentation/)
书 - 学习Apache Kafka(https://www.amazon.in/Learning-Apache-Kafka-Nishant-Garg-ebook/dp/B00U2MI8MI/256-4049?_encoding=UTF8&tag=googinhydr18418-21)
  7. SQL
用MySQL管理大数据(/beginners-guide-to-postgresql/)
SQL课程()
PostgreSQL初学者指南(/beginners-guide-to-postgresql/)
高性能MySQL(/product/3.do)
  8. Hive
使用Hive访问Hadoop数据(https://cognitiveclass.ai/learn/big-data/0
学习Apache Hadoop生态系统 Hive(https://cognitiveclass.ai/learn/big-data/)
Apache Hive文档(https://hive.apache.org)
Hive编程(https://hive.apache.org)
  9. Pig
Apache Pig 101,来自大数据大学(https://cognitiveclass.ai/courses/introduction-to-pig/)
用Hadoop与Apache Pig编程(/courses/introduction-to-pig/)
Apache Pig文档(/product/3.do)
书 - Pig编程(https://pig.apache.org/docs/r0.12.0/)
  10. Apache Storm
使用Apache Storm实时分析(/course/real-time-analytics-with-apache-storm--ud381)
Apache Storm文档(/course/real-time-analytics-with-apache-storm--ud381)
11. Apache Kinesis
Apache Kinesis文档(/cn/documentation/kinesis/)
Amazon Kinesis通过Amazon Web Services流式浏览开发人员资源(/cn/documentation/kinesis/)
亚马逊Kinesis Streams开发人员资源,来自亚马逊网络服务(/documentation/kinesis/)
  12. Apache Spark
数据科学、工程与Apache(https://www.edx.org/xseries/data-science-engineering-apache-spark)
Apache Spark文档(https://www.edx.org/xseries/data-science-engineering-apache-spark)
书 - 学习Spark(https://www.edx.org/xseries/data-science-engineering-apacher-sparktm)
  13. Apache Spark Streaming
Apache Spark Streaming文档(http://spark.apache.org/streaming/)
  我希望你们喜欢阅读这篇文章。 借助这种学习途径,你将能够踏上你在大数据行业的旅程。 我已经叙述了大部分你找工作会要求的主要概念。
  来源:/blog/2017/03/big-data-learning-path-for-all-engineers-and-data-scientists-out-there/
请先登录再操作
请先登录再操作
微信扫一扫分享至朋友圈
普及数据思维,传播数据文化;专注大数据,每日有分享。
知名IT评论人,曾就职于多家知名IT企业,现是科幻星系创建人
未来在这里发声。
新媒体的实践者、研究者和批判者。
立足终端领域,静观科技变化。深入思考,简单陈述。
智能硬件领域第一自媒体。零基础能学大数据么_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
零基础能学大数据么
0|0|暂无简介|
踏实做事、认真做教育,无兄弟,不编程!|
总评分0.0|
阅读已结束,如果下载本文需要使用0下载券
想免费下载更多文档?
你可能喜欢

我要回帖

更多关于 自学大数据要多久 的文章

 

随机推荐