共计 1981 个字符,预计需要花费 5 分钟才能阅读完成。
Hadoop 是一个分布式系统基础架构,他使得用户可以在不了解分布式底层细节的情况下,开发分布式程序。
Hadoop 的重要核心:HDFS 和 MapReduce。HDFS 负责储存,MapReduce 负责计算。
下面介绍安装 Hadoop 的重点:
其实安装 Hadoop 也不麻烦,主要需要以下的几点先行条件,如果以下先行条件弄好了,按照官网配置启动就非常简单了。
1、Java 运行环境,建议 Sun 的发行版
2、SSH 公钥免密认证
以上环境搞定,剩下的就只是 Hadoop 的配置了,这部分配置不同版本或许有不同,详细参照官方文档说明。
环境
虚拟机:VMWare10.0.1 build-1379776
操作系统:CentOS7 64 位
安装 Java 环境
下载地址:http://www.Oracle.com/technetwork/cn/java/javase/downloads/jdk8-downloads-2133151-zhs.html
根据自己的操作系统版本选择相应的下载包,如果是支持 rpm 包的,直接下载 rpm,或者使用 rpm 地址
rpm –ivh http://download.oracle.com/otn-pub/java/jdk/8u20-b26/jdk-8u20-linux-x64.rpm
JDK 会持续更新,所以安装最新版本的 JDK 需要你自己去官网获取最新安装包的 rpm 地址。
配置 SSH 公钥免密认证
CentOS 中默认自带了 openssh-server、openssh-clients 以及 rsync,如果你的系统中没有,那么请自行查找安装方式。
创建共同的账户
所有机器上创建 hadoop(名称自定)账户,密码也统一设置为 hadoop
useradd -d /home/hadoop -s /usr/bin/bash –g wheel hadoop
passwd hadoop
SSH 配置
vi /etc/ssh/sshd_config
找到如下三个配置项,并改成如下设置。如果被注释了,就去掉前面的 #解除注释使配置生效。
RSAAuthentication yes
PubkeyAuthentication yes
# The default is to check both .ssh/authorized_keys and .ssh/authorized_keys2
# but this is overridden so installations will only check .ssh/authorized_keys
AuthorizedKeysFile .ssh/authorized_keys
.ssh/authorized_keys 就是公钥的存放路径。
密钥公钥生成
用 hadoop 账户登录。
cd ~
ssh-keygen –t rsa –P ”
将生成的~/.ssh/id_rsa.pub 文件保存成~/.ssh/authorized_keys
cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys
用 scp 命令将.ssh 目录拷贝到其他机器上,偷懒做法让所有的机器的密钥相同,共享公钥。
scp ~/.ssh/* hadoop@slave1:~/.ssh/
注意保证~/.ssh/id_rsa 的访问权限必须是 600,禁止其他用户访问。
Hadoop 安装
参照官方配置文档
或者下面的文章:
Ubuntu14.04 下 Hadoop2.4.1 单机 / 伪分布式安装配置教程 http://www.linuxidc.com/Linux/2015-02/113487.htm
CentOS 安装和配置 Hadoop2.2.0 http://www.linuxidc.com/Linux/2014-01/94685.htm
Ubuntu 13.04 上搭建 Hadoop 环境 http://www.linuxidc.com/Linux/2013-06/86106.htm
Ubuntu 12.10 +Hadoop 1.2.1 版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm
Ubuntu 上搭建 Hadoop 环境(单机模式 + 伪分布模式)http://www.linuxidc.com/Linux/2013-01/77681.htm
Ubuntu 下 Hadoop 环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm
单机版搭建 Hadoop 环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm
更多 Hadoop 相关信息见 Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13
本文永久更新链接地址 :http://www.linuxidc.com/Linux/2015-11/124798.htm