共计 1745 个字符,预计需要花费 5 分钟才能阅读完成。
1. 启动 Hadoop
进入 root 权限,进入 Hadoop 安装目录 $HADOOP_HOME
执行 Bin/start-all.sh
Jps 查看 hadoop 进程
2. 启动 eclipse
进入 eclipse 的安装目录,在 root 权限下运行 eclipse
./eclipse& 后台运行以便进行其它操作。
3. Eclipse 装 Hadoop 插件
Window->preference->HadoopMapReduce 设置好 Hadoop 的安装目录
/usr/programFiles/hadoop-1.0.1
Eclipse 中本没有 hadoop 插件,
按照 http://www.linuxidc.com/Linux/2013-08/88957p2.htm 安装 eclipse 的hadoop插件
4. 配置 Map/Reduce Locations
Windows->Show View->Map/Reduce Locations 打开 Map/ReduceLocations
右键 ->New Hadoop Location
填入 mapred-site.xml、core-site.xml 中配置的地址及端口,如下所示:
5. 新建项目
File–>New–>Other–>Map/Reduce Project,项目名可以随便取如 WordCount_root。
复制 hadoop 安装目录 /src/example/org/apache/hadoop/examples/WordCount.java 到刚才新建的项目 WordCount 下,修改 WordCount.java 首行 package 为 mypackage。
6. 在 hadoop 安装目录下创建文件夹:
在 /usr/programFiles/hadoop-1.0.1 下创建 test_wordCount_0103
在 test_wordCount_0103 文件夹下创建 file0、file1 文件,分别写入一些单词。
在 HDFS 分布式文件系统中创建目录 input:bin/hadoop fs –mkdir input
7. 将数据从 Linux 文件系统复制到 HDFS 分布式文件系统中
bin/hadoop fs –put/usr/programFiles/hadoop-1.0.1/test_wordCount_0103 input
8. Run
右键项目 ->Run As->Run Configurations
点 Java Application,右键 –>New,这时会新建一个 application 名为 WordCount。
配置运行参数,点 Arguments,在 Program arguments 中输入你要传给程序的输入文件夹和你要求程序将计算结果保存的文件夹,如下图所示。注意这里的 output 一定是不存在的文件,存在就会报错!
点击 Run,运行程序。
9. 查看结果
bin/hadoop fs –ls output
bin/hadoop fs –cat output/part-r-00000 或者直接 output/* 也行
其中 input 的内容是:
相关阅读:
Ubuntu 13.04 上搭建 Hadoop 环境 http://www.linuxidc.com/Linux/2013-06/86106.htm
Ubuntu 12.10 +Hadoop 1.2.1 版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm
Ubuntu 上搭建 Hadoop 环境(单机模式 + 伪分布模式)http://www.linuxidc.com/Linux/2013-01/77681.htm
Ubuntu 下 Hadoop 环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm
单机版搭建 Hadoop 环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm
搭建 Hadoop 环境(在 Winodws 环境下用虚拟机虚拟两个 Ubuntu 系统进行搭建)http://www.linuxidc.com/Linux/2011-12/48894.htm
更多 Hadoop 相关信息见Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13