阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

在Hadoop2.3下运行WordCount程序

215次阅读
没有评论

共计 1464 个字符,预计需要花费 4 分钟才能阅读完成。

1、如果 hdfs 没有启动,则在 haoop 主目录下启动:
 ./sbin/start-dfs.sh 
 ./sbin/start-yarn.sh 

2、查看状态,保证有数据节点在运行
./bin/hdfs dfsadmin -report

看到如下状态表示一切正常
Datanodes available: 1 (1 total, 0 dead)

这一步也可以用浏览器查看:http://localhost:50070

3、新建几个数据文件,如 file1.txt,file2.txt,我是放到 Hadoop 主目录下的 examples 目录里
examples/file1.txt 内容如下:
hello  www.linuxidc.com
hello  www.linuxidc.net
hello  www.6688.cc
hello  www.88181.com

examples/file2.txt 内容如下:
pmpbox  ok
pmpbox  v1.0
pmpbox  online
I think pmpbox will help you!

4、把文件拷贝到 hadoop 文件系统
./bin/hadoop fs -mkdir /input
./bin/hadoop fs -put -f examples/file1.txt examples/file2.txt /input

5、运行 WordCount
./bin/hadoop jar ./share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.3.0-sources.jar org.apache.hadoop.examples.WordCount /input /output
运行中会显示进度。

6.
查看结果命令
./bin/hadoop fs -cat /output/part-r-00000

也可把结果从 hdfs 拷到文件系统中保存
./bin/hadoop fs -cat /output/part-r-00000

下面就是 WordCount 程序执行结果:
I 1
hello 4
help 1
ok 1
online 1
pmpbox 4
think 1
v1.0 1
will 1
www.88181.com 1
www.linuxidc.com 1
www.linuxidc.net 1
www.6688.cc 1
you! 1
下面的代码出自 JDK 文档)

相关阅读

Ubuntu 13.04 上搭建 Hadoop 环境 http://www.linuxidc.com/Linux/2013-06/86106.htm

Ubuntu 12.10 +Hadoop 1.2.1 版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm

Ubuntu 上搭建 Hadoop 环境(单机模式 + 伪分布模式)http://www.linuxidc.com/Linux/2013-01/77681.htm

Ubuntu 下 Hadoop 环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm

单机版搭建 Hadoop 环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm

搭建 Hadoop 环境(在 Winodws 环境下用虚拟机虚拟两个 Ubuntu 系统进行搭建)http://www.linuxidc.com/Linux/2011-12/48894.htm

更多 Hadoop 相关信息见 Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-20发表,共计1464字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中