1.了解对比Hadoop不同版本的特性,可以用图表的形式呈现。
(1)0.20.0~0.20.2: Hadoop的0.20分支非常稳定,虽然看起来有些落后,但是经过生产环境考验,是 Hadoop历史上生命周期最长的一个分支,CDH3、CDH4虽然包含了0.21和0.22分支的新功能和补丁,但都是基于此分支。
(2)0.20- append:020- append支持HDFS追加,由于该功能被认为是一个不稳定的潜在因素,所以它被单独新开了一个分支,并且没有任何新的 Hadoop的正式版基于此分支发布。
(3)0.20- ecurity:该分支基于020并支持 Kerberos认证。
(4)0.20.203~0.20.205:这些版本包括了 Security分支所带功能,并且还包括错误修复和020分支的线上开发的改进。
(5)0.21.0:0.21是一个预研性质的版本,目的是强调那段时间开发的一些新功能,没有Security功能,但有 Append功能,不建议部署在生产环境。
(6)0.22.0:0.22.0包括HDFS的安全功能,并且更新不大
(7)0.23.0:在2011年11月, Hadoop023发布了,包括了 Append、 Security、YARN和HDFS Federation功能,该版本被认为是20.0的预览版本。
(8)1.0.0:1.0.0版本是基于0.20.205版本发布,包括了 Security功能,是一个值得部署的稳定版本。但是从上面可以看出,1.0.0并不是包含了所有分支
(9)2.0.0:2012年5月,基于0.23.0分支的20.0版本发布,它包含了YARN,但移除了MRvl,兼容了MRv1的API,但底层实现有明显不同,需要经过大量测试才能被用于生产环境。CDH4是基于此版本,但CDH4还提供了MRv1的实现。
2.Hadoop生态的组成、每个组件的作用、组件之间的相互关系,以图例加文字描述呈现。
3.官网学习Hadoop的安装与使用,用文档的方式列出步骤与注意事项。http://www.apache.org/
Hadoop安装分两个平台,一个是Linux,一个是Windows。 下面以Windows为例:
1.Hadoop 2.2及更高版本包括对Windows的本地支持。
2.选择Windows10安装
3.选择Java版本并设置JAVA_HOME
Oracle JDK 1.7和1.6版已经由Hadoop开发人员进行了测试,并且可以正常工作。
4.获取Hadoop源
5.安装依赖关系并设置构建环境
该BUILDING.txt源树的根文件有要求的列表以及如何安装它们的详细信息。它还包括有关设置环境的信息以及Windows特有的一些怪癖。强烈建议您在继续之前阅读并理解它。
6.关于本机IO支持的几句话
Linux上的Hadoop包括可选的Native IO支持。但是,Native IO在Windows上是必需的,没有它,您将无法使安装正常工作。您必须按照BUILDING.txt中的所有说明进行操作,以确保正确构建了Native IO支持。
7.生成并复制包文件
要构建二进制发行版,请从源树的根目录运行以下命令。mvn软件包-Pdist,native-win -DskipTests -Dta
8.安装
9.HDFS配置示例
10.YARN配置示例
11.初始化环境变量
运行c:\ deploy \ etc \ hadoop \ hadoop-env.cmd来设置启动脚本和守护程序将使用的环境变量。
12.格式化文件系统
%HADOOP_PREFIX%\ bin \ hdfs目的-format
13.启动HDFS守护程序
手机扫一扫
移动阅读更方便
你可能感兴趣的文章