共计 3704 个字符,预计需要花费 10 分钟才能阅读完成。
一、Cloudera Manager/CDH5
1、关于 cloudera manager 和 CDH 是什么,这里不做详细介绍了。有官网和百科介绍。
附上官网地址:cloudera manager
2、官网的安装指南
官方文档提供了三种安装方式:在线自动安装 / 手动安装包安装 / 手动使用 cloudera manager 管理安装
此处使用第三种方式安装 Hadoop 集群。
二、环境规划
1、系统:CentOS 6.4_x86
- master:4G 内存,硬盘尽量大容量
- slave1:2G 内存,硬盘尽量大容量
- slave2:2G 内存,硬盘尽量大容量
2、Cloudera Manager 5.3.3
3、CDH 5.3.3
安装包下载:
- Cloudera Manager 5.3.3:http://archive-primary.cloudera.com/cm5/cm/5/
- CDH 5.5.5:http://archive-primary.cloudera.com/cdh5/parcels/5.3.3/
下载软件包:
- CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel
- CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha1
- manifest.json
三、系统环境准备工作
- 此次执行权限均为 root 用户
- 所有的机器都必须 ssh 互信模式
- 修改主机名使用 hosts 文件或者 DNS 服务器
- 关闭 iptables 和 selinux
- 卸载系统自带的 openjdk, 安装 Oracle 的 jdk
- master 节点安装 mysql
- 所有节点的时间必须同步 (ntp 服务器或其他方法)
- 修改所有节点的内核参数
i. echo 0 > /proc/sys/vm/swappiness
ii.echo never > /sys/kernel/mm/RedHat_transparent_hugepage/defrag
四、正式开始安装
1、cloudera manager 默认的目录是在 /opt 下,解压到 /opt 目录下。
# tar xf cloudera-manager-el6-cm5.3.3_x86_64.tar.gz -C /opt/
# ls /opt/
cloudera cm-5.3.3
#
# 安装 mysql-connector-java
# yum -y install mysql-connector-java
2、初始化数据库
# /opt/cm-5.3.3/share/cmf/schema/scm_prepare_database.sh mysql cm -hlocalhost -uroot -p123456 –scm-host localhost scm scm scm
# mysql -uroot -p123456 -e “show databases;” 查看下 cm 数据库是否创建成功
3、复制数据到其他节点
# 修改配置文件 server_host 为 master 节点的主机名
# grep server_host /opt/cm-5.3.3/etc/cloudera-scm-agent/config.ini
server_host=master
# scp -rp /opt/cm-5.3.3 slave1:/opt/
# scp -rp /opt/cm-5.3.3 slave2:/opt/
#
# 每个节点创建系统用户
# useradd –system –home=/opt/cm-5.3.3/run/cloudera-scm-server –no-create-home –shell=/bin/false –comment “cloudera scm user” cloudera-scm
4、数据库的配置
# hive
# create database hive DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
# active monitor
# create database amon DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
# 授权 master 主机
# grant all on *.* to ‘root’@’master’ identified by ‘PASSWD’;
5、准备 parcels 安装包到 /opt/cloudera/parcel-repo/
# ls /opt/cloudera/parcel-repo/
CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha manifest.json
# 注意:CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha 下载后的文件重命名的
#
# 启动 master 节点的 server 和 agent 脚本
# /opt/cm-5.3.3/etc/init.d/cloudera-scm-agent start
# /opt/cm-5.3.3/etc/init.d/cloudera-scm-server start
# server 端口启动较慢
#
# 启动其他所有节点的 agent 脚本
# /opt/cm-5.3.3/etc/init.d/cloudera-scm-agent start
五、CDH 5 安装配置
1、访问 http://master-ip:7180 端口开始安装
登陆名:admin 密码:admin
2、选择一个版本进行安装,此处选择第一个免费版。然后下一步 –> 下一步
3、选中所有主机:
4、如果配置正确,会出现如下界面
5、然后继续下一步, 由于我们已经下载了离线包,所以下载是很快就能完成的
6、主机检测,检测主机是否符合安装要求,符合要求后会全部通过,否则请按照要求设置
7、然后选择需要安装的软件包,可以全选或自定义,也可以选择集成了某一个组件功能的软件包来安装
8、角色分配,此处默认,可以按需调整
9、数据库测试:
10、审核更改参数,可以使用默认,也可以按需更改
11、启动正常的安装配置了,等待安装完成后再次访问主页即可。
12、完成后的登陆界面
由于主机性能较低,数据延迟很大,查询经常无法显示。而且由于此处的磁盘空间不足,所以有很多警告信息。到此安装已全部完成。
六、其他问题说明
oozie 的 web 界面的开启:
cloudera 的文档中有说明配置 oozie:
安装这个操作即可:
# mv ext-2.2.zip /var/lib/oozie/
# cd /var/lib/oozie
# unzip ext-2.2.zip
刷新界面:
hadoop2.x 版本更新了一些新功能,支持 HDFS 的高可用等。cloudera manager 管理界面可以直接操作等这一系列的功能,还是很方便的。
在集群里的 HDFS 界面的右上角有操作选项栏:
点击后根据提示就能正常的配置了。管理界面添加移除集群中的主机也是非常方便的,具体的操作就不一一演示了。
七、Hadoop 测试程序
# 计算 pi 值
# sudo -u hdfs hadoop jar /opt/cloudera/parcels/CDH/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar pi 10 100
…
Job Finished in 126.439 seconds
Estimated value of Pi is 3.14800000000000000000
# 可以看到执行结果
可以在 YARN 的 web 界面看到详细 job 的信息
还有很多测试程序可以运行测试。这里就不一一演示了。
另外,这种安装方式虽然快捷方便,但是不利于对整体的理解,建议还是使用下载安装包的方式安装,配置文件等都是需要手动编写的,对于理解比较深刻。
Ubuntu14.04 下 Hadoop2.4.1 单机 / 伪分布式安装配置教程 http://www.linuxidc.com/Linux/2015-02/113487.htm
CentOS 安装和配置 Hadoop2.2.0 http://www.linuxidc.com/Linux/2014-01/94685.htm
Ubuntu 13.04 上搭建 Hadoop 环境 http://www.linuxidc.com/Linux/2013-06/86106.htm
Ubuntu 12.10 +Hadoop 1.2.1 版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm
Ubuntu 上搭建 Hadoop 环境(单机模式 + 伪分布模式)http://www.linuxidc.com/Linux/2013-01/77681.htm
Ubuntu 下 Hadoop 环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm
单机版搭建 Hadoop 环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm
更多 Hadoop 相关信息见 Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13
本文永久更新链接地址 :http://www.linuxidc.com/Linux/2015-08/121405.htm