共计 4905 个字符,预计需要花费 13 分钟才能阅读完成。
网络环境,整 3 台虚拟机或者物理机,配置好相应网络,编辑 /etc/hosts, 如:
ssh 无密码登录,很简单,每台机器都生成公钥,密钥 (事先建立一个统一的 Hadoop 用户)
// 生成 key, 都不输入密码
ssh-keygen -t rsa
// 于是在用户主目录下会有.ssh/ 文件夹生成, 文件有:
id_rsa id_rsa.pub
将三台机器的 id_rsa.pub 的内容合并到一个 authorized_keys 文件,并复制到三台机器用户主目录 /.ssh/ 下。
注意, CentOS 默认没有启动 ssh 无密登录,去掉 /etc/ssh/sshd_config 其中 3 行的注释:
完成后就可以无密 ssh 了,如:
安装 hadoop:
解压,并做配置 $HADOOP_HOME/etc/hadoop 下:
详细配置可见:http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/ClusterSetup.html
————————————– 分割线 ————————————–
Ubuntu 13.04 上搭建 Hadoop 环境 http://www.linuxidc.com/Linux/2013-06/86106.htm
Ubuntu 12.10 +Hadoop 1.2.1 版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm
Ubuntu 上搭建 Hadoop 环境(单机模式 + 伪分布模式)http://www.linuxidc.com/Linux/2013-01/77681.htm
Ubuntu 下 Hadoop 环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm
单机版搭建 Hadoop 环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm
Hadoop LZO 安装教程 http://www.linuxidc.com/Linux/2013-01/78397.htm
Hadoop 集群上使用 Lzo 压缩 http://www.linuxidc.com/Linux/2012-05/60554.htm
————————————– 分割线 ————————————–
//1. hadoop-env.sh 中添加 JAVA_HOME, 如:
# The java implementation to use.
export JAVA_HOME=/usr/java/jdk1.7.0_45
//2. core-site.xml(tmp 目录需手动创建):
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop/tmp/hadoop-${user.name}</value>
</property>
<property>
<name>fs.default.name</name>
<value>hdfs://hadoopmaster:9000</value>
</property>
</configuration>
//3. mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>hadoopmaster:9001</value>
</property>
</configuration>
//4. hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
</configuration>
//5. slaves
hadoopslave1
hadoopslave2
更多详情见请继续阅读下一页的精彩内容 :http://www.linuxidc.com/Linux/2014-06/102665p2.htm
// 配置 yarn-site.xml
<configuration>
<property>
<name>yarn.resourcemanager.address</name>
<value>Hadoopmaster:8080</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>hadoopmaster:8081</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>hadoopmaster:8082</value>
</property>
<property>
<name>yarn.nodemanager.resource.memory-mb</name>
<value>10240</value>
</property>
<property>
<name>yarn.nodemanager.remote-app-log-dir</name>
<value>${hadoop.tmp.dir}/nodemanager/remote</value>
</property>
<property>
<name>yarn.nodemanager.log-dirs</name>
<value>${hadoop.tmp.dir}/nodemanager/logs</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>
将整个 hadoop 目录复制到其他两台机器:
scp -r hadoop-2.2.0 hadoop@hadoopslave1:/home/hadoop
scp -r hadoop-2.2.0 hadoop@hadoopslave2:/home/hadoop
格式化 hadoop 文件系统:
hdfs namenode -format
启动 hadoop 集群:
start-dfs.sh
start-yarn.sh
视觉图:
OK,搞定。
更多 Hadoop 相关信息见 Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13
网络环境,整 3 台虚拟机或者物理机,配置好相应网络,编辑 /etc/hosts, 如:
ssh 无密码登录,很简单,每台机器都生成公钥,密钥 (事先建立一个统一的 Hadoop 用户)
// 生成 key, 都不输入密码
ssh-keygen -t rsa
// 于是在用户主目录下会有.ssh/ 文件夹生成, 文件有:
id_rsa id_rsa.pub
将三台机器的 id_rsa.pub 的内容合并到一个 authorized_keys 文件,并复制到三台机器用户主目录 /.ssh/ 下。
注意, CentOS 默认没有启动 ssh 无密登录,去掉 /etc/ssh/sshd_config 其中 3 行的注释:
完成后就可以无密 ssh 了,如:
安装 hadoop:
解压,并做配置 $HADOOP_HOME/etc/hadoop 下:
详细配置可见:http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/ClusterSetup.html
————————————– 分割线 ————————————–
Ubuntu 13.04 上搭建 Hadoop 环境 http://www.linuxidc.com/Linux/2013-06/86106.htm
Ubuntu 12.10 +Hadoop 1.2.1 版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm
Ubuntu 上搭建 Hadoop 环境(单机模式 + 伪分布模式)http://www.linuxidc.com/Linux/2013-01/77681.htm
Ubuntu 下 Hadoop 环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm
单机版搭建 Hadoop 环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm
Hadoop LZO 安装教程 http://www.linuxidc.com/Linux/2013-01/78397.htm
Hadoop 集群上使用 Lzo 压缩 http://www.linuxidc.com/Linux/2012-05/60554.htm
————————————– 分割线 ————————————–
//1. hadoop-env.sh 中添加 JAVA_HOME, 如:
# The java implementation to use.
export JAVA_HOME=/usr/java/jdk1.7.0_45
//2. core-site.xml(tmp 目录需手动创建):
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop/tmp/hadoop-${user.name}</value>
</property>
<property>
<name>fs.default.name</name>
<value>hdfs://hadoopmaster:9000</value>
</property>
</configuration>
//3. mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>hadoopmaster:9001</value>
</property>
</configuration>
//4. hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
</configuration>
//5. slaves
hadoopslave1
hadoopslave2
更多详情见请继续阅读下一页的精彩内容 :http://www.linuxidc.com/Linux/2014-06/102665p2.htm