你好,我是新学习HADOOP的新手,想向你问些关于HADOOP的问题

    先简单做个自我介绍,我叫杨俊,大讲台科技的Hadoop资深讲师,一名老程序员,准确的说是一名Hadoop资深架构师。2009年我开始接触Hadoop,对大数据产生无限遐想,看好大数据的发展,开始学习Hadoop,研究Hadoop,直到6年后成为Hadoop资深架构师。  在过去的6年里,我经常混迹于大数据相关社区和QQ群,线下活动也是常客。曾在社区中帮助过不少hadoop新学者,很多工作中积累的技术经验贴被各大社区转载分享,浏览量过万的不下10篇,当然自己也被不少大牛帮助过。有几个属于自己的大数据和云计算群(还是不透漏群号了),Hadoop大数据2000人群早已满人,不得不另开新群。  在与群内成员互动中,我发现许多人在学习大数据过程中遇到了各种各样的问题。比如说自学实在考验人的耐性,线下培训班学费贵的吓人,找不到系统全面的资料,购买视频教程被欺骗,单纯看视频容易让人厌倦等等。  看到群里小伙伴们有心学习Hadoop,却不得不面对各种问题,我萌生了开发Hadoop实战课程的想法,一方面,我将自己学习过的内容整理成课程,将参与过的项目整合到课程中;另一方面,根据自己的学习心得,将课程内容进行系统性的优化组合。  为了让学习者高效的掌握Hadoop知识,在“系统化课程”基础之上,我和我的伙伴们对课程学习模式做了两点创新性的变革—混合式学习和自适应学习。总结起来,我们的课程学习系统集4大神器于一身:系统化的框架,自适应学习,混合式学习,实战至上的内容  做为一个技术人,我对技术时刻保持敬畏之心,技术每天都在更新,学无止境,我相信没有真正的大神,人人都是学习者。但我相信好的经验可以通过好的方式迅速传递出去,让新来者少走很多弯路,避开很多不必要的坑。欢迎对大数据感兴趣的朋友加入大讲台,“1分钱体验混合式自适应学习模式,用2个月的时间搞定Hadoop大数据!”    无论你是小白还是技术宅!你的未来都值得期待!  如果想了解更多,请百度搜素“大讲台”!
楼主发言:10次 发图:0张 | 更多
  你好………………
  ????
  最实用的it职业在线学习平台
  留名!!!!!
  已经有很多小伙伴选择在大讲台学习
  已经有很多小伙伴选择在大讲台学习
  呼呼呼呼呼呼呼呼呼
  已经有很多小伙伴选择在大讲台学习
  大讲台 专业Hadoop培训 最受欢迎的Hadoop培训
  大讲台 专业Hadoop培训 最受欢迎的Hadoop培训
  大讲台 专业Hadoop培训 最受欢迎的Hadoop培训
  大讲台 专业Hadoop培训 最受欢迎的Hadoop培训
  大讲台 专业Hadoop培训 最受欢迎的Hadoop培训
  大讲台 专业Hadoop培训 最受欢迎的Hadoop培训
  大讲台 专业Hadoop培训 最受欢迎的Hadoop培训
  大讲台 专业Hadoop培训 最受欢迎的Hadoop培训
  大讲台 专业Hadoop培训 最受欢迎的Hadoop培训
  更多精彩请关注大讲台唯一官网微信公众账号,itdajiangtai。  大讲台,学习原本就是混合式自适应的;大讲台助力你更好更快学会学好开发!
   大数据技术交流群 本群致力于帮助前端学习者更快的学好Hadoop这门知识,减少学习过程中的麻烦和疑惑 不定期发布免费学习资料
   大数据技术交流群 本群致力于帮助前端学习者更快的学好Hadoop这门知识,减少学习过程中的麻烦和疑惑 不定期发布免费学习资料
   大数据学习交流群 本群致力于帮助Hadoop学习者更快的学好Hadoop这门知识,减少学习过程中的麻烦和疑惑 不定期发布免费学习资料。
   大数据学习交流群 本群致力于帮助Hadoop学习者更快的学好Hadoop这门知识,减少学习过程中的麻烦和疑惑 不定期发布免费学习资料。
  @menstoer
10:54:00  想成为一名有姿有态有范的型男吗?赶快来男装商城部落了解你的型男之路吧!/shop/view_shop.htm?tracelog=twddp&user_number_id=  -----------------------------   大数据学习交流群 大量免费资料哦
<span class="count" title="万
请遵守言论规则,不得违反国家法律法规回复(Ctrl+Enter)Hadoop2.2.0安装配置手册!完全分布式Hadoop集群搭建过程
第3页_服务器应用_Linux公社-Linux系统门户网站
你好,游客
Hadoop2.2.0安装配置手册!完全分布式Hadoop集群搭建过程
来源:blog.csdn.net/licongcong_0224&
作者:licongcong_0224
相关资讯 & & &
& (03/09/:56)
& (02/25/:21)
& (03/09/:33)
& (03/07/:00)
& (11/09/:52)
   同意评论声明
   发表
尊重网上道德,遵守中华人民共和国的各项有关法律法规
承担一切因您的行为而直接或间接导致的民事或刑事法律责任
本站管理人员有权保留或删除其管辖留言中的任意内容
本站有权在网站内转载或引用您的评论
参与本评论即表明您已经阅读并接受上述条款
Fei_Yan 发表于 搭建成功了,谢楼LZ,但我提交了一个任务wordcount时,任务死在那里了,没有分出去。。但看RM web时,上面显示Apps Submitted 的个数为1,Apps Pending的个数为1。。日志中均没有异常。。。12:41 提问
关于新手对hadoop的学习
作为一个初学者,想入手Hadoop(分布式系统基础架构)编程,但不知从何学起,该掌握那些坚实的基础知识,以怎样的学习方式(阶段性的)去学习?求Hadoop大神传授一下学习经验,对于学习Hadoop给些建议,应该系统的学习那些书目以及语言,对于入手hadoop编程指点一二,非常感谢。本人是在校大学生,对编程和大数据处理很感兴趣,对数据库有一定的了解,对C和C#编程还算有很好的经验,有一定的Java编程基础,希望大家对hadoop的学习指点一二,让我们这些后辈少走些弯路,非常感谢csdner们。
按赞数排序
难道楼主结贴了csdner就没人回答吗?求救啊
其他相似问题EasyHadoop向磊:学好Hadoop从Linux抓起
 作者: 蔡思萌 编辑:
  易用性是Hadoop推广应用的主要瓶颈  作为国内第一个开源Hadoop部署管理系统&&EasyHadoop的作者,向磊和其团队一直致力于让Hadoop大数据分析变得加简单,并陆续举办了多次免费的技术讲座。EasyHadoop 是一款Hadoop一键安装系统,方便大家更容易安装部署Hadoop软件。 在此前对Hadoop及其周边生态的易用性提升过程中,向磊发现易用性恰恰是Hadoop在推广使用方面的瓶颈。而这不仅仅是在互联网领域,因为互联网领域的人才相对集中,情况还好一些。但在其他领域,易用性会造成更大的问题。  由于Hadoop是一个复杂的分布式处理系统,对于一般人来说,Hadoop在使用上的难度很大。它不仅需要多方面的知识积累,在整个运维方面也有很多难点需要攻克,而这还仅仅是Hadoop本身。向磊表示,Hadoop的周边生态系统所需要学习和积累的东西更多,学习入门的曲线非常陡峭,这就从一定程度上限制了Hadoop的推广和使用。就好比一架波音747,它可以比自行车更快地抵达目的地,但如果飞行员是稀缺资源,那它的普及也会遥遥无期。而这也是向磊设计EasyHadoop的初衷,顾名思义,EasyHadoop就是希望飞机能够自动起飞和降落,让大家先抵达目的地,然后再慢慢根据个人意愿学习手动驾驶。  Hadoop 2.0只是工具 人才是推动革新的关键  向磊坦言,虽然他是一个偏技术型的人,相比于其他事情他可能更喜欢编代码。但他一直认为,Hadoop及其周边生态系统只是工具。诚然,Hadoop 2.0的问世,对于大数据领域的基础平台建设提供了一个更稳定和高效的解决方案。技术的进步是一个非常重要的事情,Hadoop 2的确把大数据领域的技术革新又向前推进了一大步,但他认为更重要的是人的思维,因为毕竟人和人才才是最重要的。大数据这个概念,不仅仅是存储和计算技术的进步,更是一个思维的革命。用数据来推动企业业务发展,推动战略的决策指导,把所有事情作为一个可量化的指标来看待,而不是用所谓的头脑风暴来做决策。因为我们通常都以&差不多&、&大概齐&、&应该&、&可能&为一个评判标准,改变这种固有的思维模式,用数据来做指导,推动企业价值的提高,推动民生领域的建设,这才是大数据能够为我们带来的贡献。俗话说:&你用,或者不用,数据就在那里。&Hadoop开启了一扇通往大数据的门,但是进门之后怎么装修,这就是个发挥个人想象力的事情了。向磊强调,在大数据这个领域,Hadoop是极其重要的工具,但它不能替代人才的重要性,有人才会有创新和革命。  学好Hadoop 从Linux抓起  大数据是一种很玄的东西,从大数据中,我们可以从看似毫无关联的事物里发现其隐藏的关联性。这就好比是一个反向的蝴蝶效应,我们从一场大风暴中可以推导出是哪只蝴蝶扇动了翅膀,而Hadoop作为大数据技术的主导者,其在大数据领域的重要性不言而喻,未来这方面的工作机会也非常之多。不过对于广大的Hadoop新手而言,快速地学习并掌握Hadoop这项技术并非易事。对此,向磊建议新手们先从Linux学起,有了Linux的基础,新手们进入Hadoop的世界也能轻松很多。此外,学习一些网络知识也是很有必要的。在向磊看来,编程与开发是学习过程中的重中之重。Hadoop是由全世界的程序员构建起来的开源系统,将来也非常需要新手们的加入和贡献。无论是程序员还是硬件爱好者,他都建议他们多参与开源的项目,一切收获都需要付出,贡献开源之后的收获和乐趣是无法比拟的。  作为本次Hadoop大会的演讲嘉宾之一,同时也身为资深技术人员的向磊先生对大会充满了期待。他笑言,终于可以有一个不用翻墙就可以和全球技术大牛以及Hadoop主要贡献者进行面对面交流的机会了。在本次大会上,向磊将会与大家分享他在Hadoop自动化运维方面以及降低其生态系统使用难度上的相关经验,希望能为大家使用大数据入门提供帮助。另外,他还推荐参会者多关注国内拥有自主知识产权的大数据创业团队和创业项目。向磊表示,每个人、每个团队身上都有可以学习和借鉴的优点,相信创业团队的宝贵经验也能让广大参会者大有收获。
大学生分期购物销量榜
IT168企业级上篇(Hadoop新手学习指导之入门需知)我们介绍了新手学习hadoop的入门注意事项。这篇来谈谈hadoop核心知识学习。
hadoop核心知识学习:
hadoop分为hadoop1.X和hadoop2.X,并且还有hadoop生态系统。这里只能慢慢介绍了。一口也吃不成胖子。
那么下面我们以hadoop2.x为例进行详细介绍:
Hadoop的核心是mapreduce和hdfs。
Mapreduce:mapreduce是很多人都需要迈过去的槛,它比较难以理解,我们有时候即使写出了mapreduce程序,但是还是摸不着头脑。我们都知道mapreduce是一种编程模型,那么它能干什么,对我有什么用。它的原理是什么,为什么我们编写了map函数,reduce函数就可以在多台机器上运行,这些问题或许都给初学者带来了困扰。
那么我们就要了解:
什么是mapreduce?
Mapreduce的工作原理是什么?
Mapreduce的工作流程是什么?
Mapreduce的编程模型是什么?
shuffle是什么?
partition是什么?
combiner是什麽?
他们三者之间的关系是什么?
map的个数由谁来决定,如何计算?
reduce个数由谁来决定,如何计算?
mapreduce熟悉了,还有一些问题困扰着初学者,虽然有了Java基础,但是我们需要搭建开发环境,该如何搭建开发环境?
那么就需要我们学习Windows上如何使用Eclipse远程连接Hadoop并进行程序开发
因为在操作mapredcue过程中伴随着操作hdfs,就像我们传统开发,编程是离不开数据库一样。hdfs可以理解为传统编程的数据库,但是其实他不是,真正的数据库是hadoop data base,也就是hbase。好了下面,我们开始讲如何学习hdfs:
HDFS:我们至少应该学习以下内容
& & & & & 什么是HDFS及HDFS架构设计?
& & & & & HDFS体系结构简介及优缺点?
& & & & & Hdfs如何存储数据?
& & & & & Hdfs如何读取数据?
& & & & & Hdfs如何写入文件?
& & & & & Hdfs的副本存放策略?
& & & & & 如何访问hdfs?
& & & & & Hdfs数据如何复制?
& & & & & Namenode的热备?
hadoop生态系统内容还是比较多的,但是最常用的是hive,hbase。
Hive是初学者进入大数据(hadoop)行业最好的选择入口,因为它提供了简单的类sql语句,使得不懂得mapreduce程序编写的学员也能够很轻松的进入大数据行业。所以建议大家(尤其是零基础的学员)在学习hadoop的过程中,可以着重加强对hive的学习,尤其是hive语句的熟练操作。当然对于有数据库基础的学员学习hive就更容易一些。
Hbase是一种nosql数据库,只有当数据量非常大时,比如TB、PB级,hbase才能发挥出很好的效果,所以对于致力于加入大公司的学员,可以深入学习hbase,尤其是hbase表的设计,rowkey的设计,hbase性能的调优,hbase和hive、impala的结合等。
Yarn是分布式集群资源管理框架,也是hadoop2.x和hadoop1.x明显不同的地方,所以我们还是有必要对yarn的原理、框架、组成部分进行详细的了解的。
对于hadoop其他的组件:比如海量日志收集工具flume,数据导入导出工具sqoop,应用程序协调服务zookeeper,学员可以结合实战项目学习其原理,如何使用即可。
对于想从事数据挖掘的学员,可以深入学习mahout、机器学习、算法等相关知识,根据学员自己的职业选择和兴趣爱好自主选择,建议零基础的学员最好是先从hive入手。
Storm是一种基于流的计算框架,spark是基于内存的计算框架,它们是不同于mapreduce的计算框架,但作用都是对数据的处理和分析,建议初学者在学习好mapreduce的前提下,可以对storm和spark进行深入的学习,切记贪多嚼不烂。通而不精。
如果想更加深入的学习,丰富自己的知识,可以选择性的学习一下shell、python脚本语言,Redis、MongoDB等nosql数据库,如果想做hadoop运维的,也可以学习ganglia和nagios等监控工具。
最后建议大家在学习过程中一定要由浅入深、从简单到复杂、理论和实践相结合,由于hadoop生态系统的工具比较多,每个工具有不同的侧重点,所以再次提醒大家切记贪多、切记浮躁、只有基础扎实了,后续的学习才会更轻松、更快速、更高效。
作者:hadoop旅人
看完这篇文章的人大多学习了
关注微信@大讲台
来微博关注我 @大讲台科技

我要回帖

 

随机推荐