本文介绍在Linux下使用eclipse编译Hadoop0.21.0源码,参考Hadoop0.21.0编译手册
假设安装环境已配置好:eclipse3.X + jdk1.6
第一步,下载hadoop0.21.0release版本
下载后解压,可看到文件夹内包含三个子文件夹common,hdfs,mapred,分别对应hadoop common,HDFS,Mapreduce的编译文件夹。
第二步,编译common模块
在common工程上点击右键,选择属性。
去掉Java Builder前面的钩,点击new按钮新建ant编译器
为builder命名,选择Buildfile位置 Browse File System… 这里需要选择common根目录下的build.xml文件
在target选项卡中修改 Manual Build的targets,只保留jar
在common工程的project选项中去掉自动编译的选项,点击编译,完成
编译后在common的build目录下即生成了两个jar文件和其他一下文件夹。其中Hadoop-common-0.21.1-SNAPSHOT.jar是二进制包,而hadoop-common-0.21.1-SNAPSHOT-sources.jar是源码包。
注意:有编译的时候会报找不到lib文件夹的错误,需要在build下手工简历lib文件夹即可
第三步,编译hdfs,mapreduce模块
第二步中新建工程的方法对于hdfs,mapreduce的编译同样适用
在编译hdfs和mapreduce的时候,由于对common有依赖关系。需要去网站下载相关包。不过在默认的配置中,是找不到该包的,会报模块找不到错误。需要对hdfs,mapreduce的ivy目录中的libraries/properties文件进行修改
修改以下两项的值。
然后其他的操作和common编译一样,即可完成编译过程,编译后的build文件夹如下:
a. Sh ${HADOOP_HOME}/bin/stop-all.sh停掉hadoop集群。然后删除${HADOOP_HOME}下三个工程相关的包。
b. 把编译成功的hadoop-common-0.21.1-SNAPSHOT.jar,hadoop-hdfs-0.21.1-SNAPSHOT.jar和 hadoop-mapred-0.21.1-SNAPSHOT.jar三个jar包拷贝到hadoop集群${HADOOP_HOME}目录下。
c. Sh ${HADOOP_HOME}/bin/start-all.s重启hadoop集群。
d. 查看集群的各项功能,是否正确,正确则证明编译成功。