共计 1933 个字符,预计需要花费 5 分钟才能阅读完成。
Ubuntu 下配置 Hadoop 环境,实现真正的分布式的 Hadoop,并不是伪分布式的。
一、系统与配置
共准备 2 台机器搭建 Hadoop 集群。基于 Ubuntu14.04,jdk1.6.0_45,Hadoop1.0.3 版本,虚拟机使用 VMware10.0
192.168.1.10 NameNode master(master)
192.168.1.20 DateNode slave1(Slave)
我的用户名就 hadoop
接下来需要安装一些常用的软件:vim,ssh
sudo apt-get update
sudo apt-get install vim
sudo apt-get install ssh
首先修改本机 IP
然后输入以下命令,修改 hosts
sudo vim /etc/hosts
接下来设置 ssh,实现无密码登陆,输入以下命令,生成秘钥
ssh-keygen -t rsa -P “”
一直按回车就会生成秘钥,然后 在.ssh 目录中会生成 id_rsa 和 id_rsa.pub 两个文件,这两个文件分别是 SSH 的私钥和公钥。
生成 authorized_keys 文件:cat id_rsa.pub >> authorized_keys 实现无密码登陆本地 localhost 的 ssh 中,
二、安装 hadoop 和 jdk
解压 hadoop 的压缩包,我的安装目录是 /home/hadoop(这是用户名)/hadoop(这是文件夹)/
tar -zxvf hadoop1.0.3.tar
解压缩 jdk 的压缩包,命令类似上面,不过是将文件该名称,这里就不列出来了
然后下来是修改环境变量
sudo vim /etc/profile
export JAVA_HOME = /home/hadoop/hadoop/jdk1.6.0_45
export PATH = $JAVA_HOME/bin:$PATH
export HADOOP_HOME = /home/hadoop/hadoop/hadoop-1.0.3
export PATH = $JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH
别忘了执行 source /etc/profile,让路径立马生效
最后配置 hadoop 下的 conf 文件夹中的文件
修改 hadoop-env.sh
修改 core-site.xml
修改 hdfs-site.xml
修改 mapred-site.xml
修改 masters,和 slaves 文件,在 masters 中只写 master 也就是上面提到的 192.168.1.0,slaves 中填写 master 和 slave。
然后格式化 namenode,在 hadoop-1.0.3 文件中写入下面命令
bin/hadoop namenode -format
对了这里一直没有提到 slave 的配置,其实特别简单,关闭当前的虚拟机,复制一份刚才的虚拟机文件,然后重亲起名,再次打开,修改用户名和 ip 就好了,我的 Ubuntu 名字是一样,只要不在一个盘里就行。
最后在 master(用户名,也就是主节点的 ubuntu)中输入以下命令,同样也是在 hadoop-1.0.3 的文件中
bin/start-all.sh
然后输入 JPS 查看 java 进程,如果出现以下 5 个进程,就表示成功(不包括 jps)
可以查看网页
已经有两个节点,到此整个 hadoop 分布式的部署就完成了。
CentOS 安装和配置 Hadoop2.2.0 http://www.linuxidc.com/Linux/2014-01/94685.htm
Ubuntu 13.04 上搭建 Hadoop 环境 http://www.linuxidc.com/Linux/2013-06/86106.htm
Ubuntu 12.10 +Hadoop 1.2.1 版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm
Ubuntu 上搭建 Hadoop 环境(单机模式 + 伪分布模式)http://www.linuxidc.com/Linux/2013-01/77681.htm
Ubuntu 下 Hadoop 环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm
单机版搭建 Hadoop 环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm
搭建 Hadoop 环境(在 Winodws 环境下用虚拟机虚拟两个 Ubuntu 系统进行搭建)http://www.linuxidc.com/Linux/2011-12/48894.htm
更多 Hadoop 相关信息见 Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13