共计 3332 个字符,预计需要花费 9 分钟才能阅读完成。
Apache Ambari 是对 Hadoop 进行监控、管理和生命周期管理的基于网页的开源项目。它也是一个为 Hortonworks 数据平台选择管理组建的项目。Ambari 支持管理的服务有:
Apache HBase
Apache HCatalog
Apache Hadoop HDFS
Apache Hive
Apache Hadoop MapReduce
Apache Oozie
Apache Pig
Apache Sqoop
Apache Templeton
Apache Zookeeper
ambari 可以使安装 hadoop 集群,管理 hadoop 集群服务,监控集群都很容易。目前 ambari 支持的操作系统为 rhel/CentOS 5、rhel/centos6。
————————————– 分割线 ————————————–
Ubuntu 13.04 上搭建 Hadoop 环境 http://www.linuxidc.com/Linux/2013-06/86106.htm
Ubuntu 12.10 +Hadoop 1.2.1 版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm
Ubuntu 上搭建 Hadoop 环境(单机模式 + 伪分布模式)http://www.linuxidc.com/Linux/2013-01/77681.htm
Ubuntu 下 Hadoop 环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm
单机版搭建 Hadoop 环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm
Hadoop LZO 安装教程 http://www.linuxidc.com/Linux/2013-01/78397.htm
Hadoop 集群上使用 Lzo 压缩 http://www.linuxidc.com/Linux/2012-05/60554.htm
————————————– 分割线 ————————————–
安装步骤为
1. 首先需要使用 svn 客户端获取 ambari 的源码
$ svn checkout http://svn.apache.org/repos/asf/incubator/ambari/trunk ambari
2. 对 ambari 源码进行打包编译
$ yum install rpm-build
$ cd hmc/package/rpm
$ ./create_hmc_rpm.sh
$ cd mon_dashboard/package/rpm
$ ./create_dashboard_rpm.sh 如果编译成功的话,将会生成下面的 rpm 文件
1) hmc/package/rpm/build/rpmbuild/RPMS/noarch/ambari-1.0.0-1.noarch.rpm
2) hmc/package/rpm/build/rpmbuild/RPMS/noarch/ambari-agent-1.0.0-1.noarch.rpm
3) mon_dashboard/package/rpm/build/rpmbuild/RPMS/noarch/hdp_mon_dashboard-0.0.1-2.noarch.rpm
3. 安装 ambari 前需要做的步骤
将需要安装的 hadoop 集群按照 namenode,datanode 进行划分,namenode 节点作为 ambari master 节点,其他节点作为 ambari slave。
设置 namenode 节点到其他节点的无密码登陆的 ssh 设置。
将各个节点的防火墙停止 service iptables stop
4. 开始安装 ambari
因为 ambari 需要依赖模块 puppet ruby php apache 等,所以需要先使用 yum 源安装这些组件
在每个节点设置系统 yum 源
$ sudo rpm -Uvh http://dl.Fedoraproject.org/pub/epel/5/x86_64/epel-release-5-4.noarch.rpm
OR
$ sudo rpm -Uvh http://dl.fedoraproject.org/pub/epel/5/i386/epel-release-5-4.noarch.rpm
$ sudo rpm -Uvh http://passenger.stealthymonkeys.com/rhel/5/passenger-release.noarch.rpm
$ sudo rpm -Uvh http://public-repo-1.hortonworks.com/HDP-1.0.1.14/repos/centos5/hdp-release-1.0.1.14-1.el5.noarch.rpm (for rhel5/centos5)ORrpm -Uvh http://public-repo-1.hortonworks.com/HDP-1.0.1.14/repos/centos6/hdp-release-1.0.1.14-1.el6.noarch.rpm (for rhel6/centos6)
在 ambari master 主节点中安装 puppet php 等模块
$ sudo yum install php-pecl-json # version 1.2.1 compatible with php-5.1 or php-5.2
$ sudo yum install php-pdo 检测是否安装 posix
$ php -m | grep posix 如果没有找到 posix 模块,使用
$ sudo yum install php-process 安装即可。
$ sudo yum install pdsh
$ sudo yum install httpd-devel
$ sudo yum install mod_passenger
$ sudo yum install puppet-2.7.9
$ sudo yum install ruby-devel 上面的模块都安装完成后,在 ambari master 节点安装
$ sudo rpm -iv ambari-1.0.0-1.noarch.rpm
$ sudo rpm -iv hdp_mon_dashboard-0.0.1-2.noarch.rpm 在其他的 slave 节点安装
$ sudo rpm -Uvh ambari-agent-1.0.0-1.noarch.rpm
因为 hadoop 需要 jdk 环境运行,所以需要到 http://www.Oracle.com/technetwork/Java/javase/downloads/jdk-6u26-download-400750.html 下载
1) jdk-6u26-linux-x64.bin
2) jdk-6u26-linux-i586.bin
安装包,然后放到 /var/run/hmc/downloads/ 文件夹中
4. 启动 ambari server 开始安装集群
在 ambari master 主节点启动 ambari server 服务
service ambari start 然后在浏览器中打开
http://AMBARIMASTER/hmc/html/ 地址开始安装 hadoop 集群
安装集群需要 ambari master 节点中 root 用户的 SSH Private Key File,路径在 /root/.ssh/id_rsa
然后将所需要安装的 slaves 节点所有 hostname 每行一个进行分割存为文件
在页面中都选择好文件后,即可进行安装,在安装服务的过程中需要等一段时间,因为所需要的 hadoop 都是通过 yum 进行下载安装。
等安装成功后,即可对集群进行管理,监控了。
参考 http://incubator.apache.org/ambari/install.html
更多 Hadoop 相关信息见Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13