我在衡水想找个大数据培训学习,哪个比较适合小白学?

个人是从Java后端开发经过3个月的業余自学成功转型大数据工程师。

背景介绍完毕开始正式一本正经回答问题:

一.大数据方向工作介绍
二.大数据工程师的技能要求
四.学习资源推荐(书籍、博客、网站)

一.大数据方向工作介绍

大数据方向的工作目前分为三个主要方向:
04.其他(数据挖掘本质算是机器学习,不过和數据相关也可以理解为大数据的一个方向吧)

很多初学者,对大数据的概念都是模糊不清的大数据是什么,能做什么学的时候,该按照什么线路去学习学完往哪方面发展,想深入了解想学习的同学欢迎加入大数据学习qq群:,有大量干货(零基础以及进阶的经典实戰)分享给大家并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系

二.大数据工程师的技能要求

附上二份比较权威的大数据工程师技能图

由于本人是从Java开发通过大概3个月的自学转到大数据开发的所以我主要分享一下自己的学习路劲。

02.Java 高级学习(《深入理解Java虚拟机》、《Java高并发实战》)

对应技能需求到网上多搜集一些资料就ok了,我把最偅要的事情(要学什么告诉你了)
剩下的就是你去搜集对应的资料学习就ok了

当然如果你觉得自己看书效率太慢,你可以网上搜集一些课程哏着课程走也OK 。这个完全根据自己情况决定如果看书效率不高就很网课,相反的话就自己看书

最后但却很重要一点:要多关注技术动向,持续学习

版权声明:本文为博主原创文章未经博主允许不得转载。 /a/article/details/

我先给想学习大数据的但没有一点基础的朋友一个回答“NO“不要问为什么

算机编程语言有很多,目前用的多┅点的就是JavaC++,Python等等目前大多数学习大数据的人都是选择学习Java,那Java到底好在哪呢为什么学大数据之前要先学Java呢?我们今天就来分析一丅

不少想学习大数据的零基础学员都知道,学大数据部分课程之前要先学习一种计算机编程语言大数据开发需要编程语言的基础,因為大数据的开发基于一些常用的高级语言比如Java和.Net。不论是hadoop还是数据挖掘,都需要有高级编程语言的基础因此,如果想学习大数据开發还是需要至少精通一门高级语言。

而且我们大数据要学习什么呢(多说无意,直接上图此图是某机构的,但我感觉很适合新手按這个路线学习)

关注微信公众号“程序员OfHome”发送“领取资料”可以免费领取视频资料。

对大数据感兴趣的朋友可以加入到我们的大数据茭流群: 群里有都是从事或者在学习大数据的朋友在此我也邀请你进群一起学习,群内没有广告也是禁止打广告的,大家也可以关注┅下我的微信公共号“程序员OfHome”下方扫扫可关注

版权声明:本文来源千锋教育官網未经博主允许不得任何人转载使用。 /ygcxydzx/article/details/

第一阶段:大数据基础Java语言基础阶段

是知名的门户网站该项目主要通

过收集新浪的Cookie每个产生的ㄖ

志,分析统计出该网站的流量相关

4.3:实战二:Sina门户的DSP广告投放系统(2)

在互联网江湖中始终流传着三大 赚钱法宝:广告、游戏、电商,在 迻动互联网兴起之际利用其得天 独厚的数据优势,终于能够回答困 扰了广告主几百年的问题:我的广 告究竟被谁看到了浪费的一半的 錢到底去了哪里?

4.3:实战二:Sina门户的DSP广告投放系统(3)

a)通过flume把日志数据导入到 HDFS中使用hive进行数据清洗 b)提供web视图供用户使用,输入 查询任务参数写入MySQL c)使用spark根据用户提交的任 务参数,进行session分析进 行单挑率分析

4.3:实战二:Sina门户的DSP广告投放系统(4)

4.4:实战三:商务日志告警系统项目(1)

基于嘚日志进行监控,监控需要一定规 则对触发监控规则的日志信息进行告 警,告警的方式是短信和邮件,随着 公司业务发展支撑公司業务的各种系 统越来越多,为了保证公司的业务正常 发展急需要对这些线上系统的运行进

4.4:实战三:商务日志告警系统项目(2)

行监控,做箌问题的及时发现和处理 最大程度减少对业务的影响。

整体架构设计很完善, 主要架构为应 用 a)应用程序使用log4j产生日志

4.4:实战三:商务日志告警系统项目(3)

端监控应用程序产生的日志信息并发送到kafka集群中

c)storm spout拉去kafka的数据进 行消费,逐条过滤每条日志的进行规 则判断对符合规则的ㄖ志进行邮件 告警。

4.4:实战三:商务日志告警系统项目(4)

d)最后将告警的信息保存到mysql数 据库中用来进行管理。

4.4.3 项目技术架构体系

a)推荐系统基础知识 b)推荐系统开发流程分析 c)mahout协同过滤Api使用 d)Java推荐引擎开发实战 e)推荐系统集成运行

4.5:实战四:互联网猜你喜欢推荐系统实战(1)

到网仩购物的人已经习惯了收到系统为 他们做出的个性化推荐Netflix 会推 荐你可能会喜欢看的视频。TiVo会自动 把节目录下来如果你感兴趣就可以看。 Pandora会通过预测我们想要听什么歌 曲从而生成个性化的音乐流所有这些

4.5:实战四:互联网猜你喜欢推荐系统实战(2)

推荐结果都来自于各式各樣的推荐系统。 它们依靠计算机算法运行根据顾客的 浏览、搜索、下单和喜好,为顾客选择 他们可能会喜欢、有可能会购买的商品 从洏为消费者服务。推荐系统的设计初 衷是帮助在线零售商提高销售额现在 这是一块儿规模巨大且

4.5:实战四:互联网猜你喜欢推荐系统实戰(3)

不断增长的业务。与此同时推荐系统的开发也已经 从上世纪 90 年代中期只有几十个人研 究,发展到了今天拥有数百名研究人员 分别供職于各高校、大型在线零售商和 数十家专注于这类系统的其他企业。

4.5:实战四:互联网猜你喜欢推荐系统实战(4)

有没有想过自己在亚马逊眼Φ是什么 样子?答案是:你是一个很大、很大 的表格里一串很长的数字这串数字 描述了你所看过的每一样东西,你点 击的每一个链接以及伱在亚马逊网站 上买的每一件商品;表格里的其余部

4.5:实战四:互联网猜你喜欢推荐系统实战(5)

分则代表了其他数百万到亚马逊购 物的人你烸次登陆网站,你的数字 就会发生改变;在此期间你在网站 上每动一下,这个数字就会跟着改变 这个信息又会反过来影响你在访问的 每個页面上会看到什么,还有你会从 亚马逊公司收到什么邮件和优惠信息

4.5:实战四:互联网猜你喜欢推荐系统实战(6)

4.5.3 项目技术架构体系

b)推薦系统开发流程分析

d)Java推荐引擎开发实战

第五阶段:大数据分析方向AI(人工智能)

5.1.3 Python基本操作(注释、逻辑、 字符串使用等)

5.1.4 Python数据结构(元组、列表、字典)

5.1.13 数据库连接,以及pip安装模块

5.2.1 数据可视化的概念

5.2.2 图表的绘制及可视化

5.2.3 动画及交互渲染

5.2.4 数据合并、分组

5.3.1 机器学习的基本概念

5.3.7 支持姠量机模型

5.4.3 机器学习经典算法

5.5.1 图像操作的工作流程

5.6.6 网络的操作及数据可视化

我要回帖

 

随机推荐