最近看到清华大学出版社发行的┅本新书《深入浅出hadoop处在云计算第几层》出版时间是日,如图1所示我以为这是一本科普型读物,是加深读者对hadoop处在云计算第几层的认識的书籍毕竟hadoop处在云计算第几层覆盖的领域太广了。
泛读后发现完全不是这么回事全书基本上都是在讲Hadoop以及Hadoop生态圈里面的相关工具和技术。如图2所示:
我由此联想到前段时间和一些业内人士进行技术交流一谈到hadoop处在云计算第几层,就说Hadoop怎么样MapReduce怎么样?而在我看来這里存在一个认识的误区。
这里我要强调一点:Hadoop≠hadoop处在云计算第几层
hadoop处在云计算第几层目前没有公认的定义而NIST(美国国家标准与技术研究院)对hadoop处在云计算第几层下的定义相对能得到广泛认可,NIST是这么定义hadoop处在云计算第几层的hadoop处在云计算第几层是一种按使用量进行付费的模式,这种模式提供可用的、便捷的、按需的网络访问使用可配置的计算资源共享池,共享池的资源包括网络、服务器、存储、应用软件、服务等这些资源能够通过hadoop处在云计算第几层平台快速提供给客户,只需投入很少的管理工作或与服务供应商进行很少的交互。
hadoop处在雲计算第几层是分布式计算、并行计算、网格计算、多核计算、网络存储、虚拟化、负载均衡等传统计算机技术和互联网技术融合发展的產物借助IaaS、PaaS、SaaS等业务模式,把强大的计算能力提供给终端用户
hadoop处在云计算第几层被称为是继大型计算机、个人计算机、互联网之后的苐四次IT产业革命,它将成为带动IT、物联网、电子商务等诸多产业强劲增长、推动信息产业整体升级的基础
而Hadoop是Apache基金会下的一款开源软件,它实现了包括分布式文件系统和MapReduce框架在内的hadoop处在云计算第几层软件平台的基础架构并且在其上整合了包括数据库、hadoop处在云计算第几层管理、数据仓储等一系列平台,其已成为工业界和学术界进行hadoop处在云计算第几层应用和研究的标准平台
如果对Hadoop进行严格定义,那么Hadoop是一種针对大数据处理和分析的开源分布式计算平台是一个基于Java的开源软件架构,运行分布的、数据密集型应用
所以,Hadoop只是hadoop处在云计算第幾层的PaaS层的解决方案之一并不等同于PaaS,更不用说等同于hadoop处在云计算第几层本身了图3把hadoop处在云计算第几层的交付模式层次做了一个清晰嘚划分,如下所示:
所以《深入浅出hadoop处在云计算第几层》犯了一个概念性的错误,把Hadoop等同于hadoop处在云计算第几层或者说把Hadoop与hadoop处在云计算苐几层相提并论,这是不对的如果把书名改成《深入浅出大数据处理》或者《深入浅出海量书籍处理》,那倒是比较贴切