阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

使用Cloudera Manager安装Hadoop

385次阅读
没有评论

共计 6063 个字符,预计需要花费 16 分钟才能阅读完成。

Hadoop 是由好多不同的服务(比如 HDFS,Hive,HBase,Spark 等等)构成的,这些服务之间还有些依赖关系,如果直接下 Apache 上的原始的包,需要下载多次,配置多次,显得比较麻烦。由此就产生了一些对 Hadoop 进行定制的公司,比如 Cloudera,Hortonworks , 还有 MapR . 这些公司都有自己的 Hadoop 发行版,Cloudera 的发行版叫 CDH。因为公司的系统用的就是 CDH,这一段时间装了多次 CDH5,做了一些实际操作,还看了些 Cloudera 的文档。

Cloudera 使用 Cloudera Manager,一个 Web 界面的 Hadoop 管理系统来进行 Hadoop 相关服务的安装,配置,和监控。

安装 Cloudera Manager

官方指南在 这里,有几种方式,我这里说到的只是其中之一,不是最简单的,但是可以让你对 Cloudera Manager 有比较多的了解。

可以通过下面这张简单的图来大概了解下 Cloudera Manager 是如何去管理 Hadoop 服务的。

使用 Cloudera Manager 安装 Hadoop

配置 Cloudera Manager 的 YUM 源

在 /etc/yum.repos.d/ 下加一个文件 CM.repo, 内容如下.

 

[CM]
name=CM
baseurl=http://archive-primary.cloudera.com/cm5/RedHat/6/x86_64/cm/5.1.3/
gpgcheck=0

[ CM ]

name = CM

baseurl = http : //archive-primary.cloudera.com/cm5/redhat/6/x86_64/cm/5.1.3/

gpgcheck = 0

运行下面的命令查看 Yum 仓库配置成功与否,如果 yum list 能列出 cloudera-manager-*** 那些包,就说明成功了。如果你是在实验室环境里安装,可能无法连接到外网,那么你可以在一台可以连接外网的机器上用 reposync 命令把外网的 yum 源 clone 到你本地,然后本地起个 http 服务给实验室的机器当 yum 服务器。也可以在实验室的 CM.repo 文件配置代理来连接外网,具体步骤 Google 一下就行了。

 

[root@bogon yum.repos.d]# yum clean all
Loaded plugins: fastestmirror, refresh-packagekit, security
Cleaning repos: CM base extras updates
Cleaning up Everything
Cleaning up list of fastest mirrors
[root@bogon yum.repos.d]# yum list | grep cloudera
cloudera-manager-daemons.x86_64        5.1.3-1.cm513.p0.155.el6          @CM    
cloudera-manager-server.x86_64         5.1.3-1.cm513.p0.155.el6          @CM    
cloudera-manager-agent.x86_64          5.1.3-1.cm513.p0.155.el6          CM     
cloudera-manager-server-db-2.x86_64    5.1.3-1.cm513.p0.155.el6          CM

[ root @ bogon yum . repos . d ] # yum clean all

Loaded plugins : fastestmirror , refresh packagekit , security

Cleaning repos : CM base extras updates

Cleaning up Everything

Cleaning up list of fastest mirrors

[ root @ bogon yum . repos . d ] # yum list | grep cloudera

cloudera manager daemons . x86_64 5.1.3 1.cm513.p0.155.el6 @ CM

cloudera manager server . x86_64 5.1.3 1.cm513.p0.155.el6 @ CM

cloudera manager agent . x86_64 5.1.3 1.cm513.p0.155.el6 CM

cloudera manager server db 2.x86_64 5.1.3 1.cm513.p0.155.el6 CM

安装 Cloudera Manager 相关的包, 安装这个包时会自动把它依赖的 cloudera-manager-daemons 包也装上。

 

yum install cloudera-manager-server

yum install cloudera manager server

看看这两个包到底装些什么, 可以看到 server 基本上就复制了一些配置文件. 真正的管理网站是通过 daemons 装的,具体的文件都在 /usr/share/cmf 目录下,日志在 /var/log/cloudera-scm-server 目录下,而运行时的配置文件在 /var/run/cloudera-scm-server

[root@bogon ~]# rpm -ql cloudera-manager-server
/etc/cloudera-scm-server
/etc/cloudera-scm-server/db.properties
/etc/cloudera-scm-server/log4j.properties
/etc/default/cloudera-scm-server
/etc/rc.d/init.d/cloudera-scm-server
/etc/security/limits.d/cloudera-scm.conf
/opt/cloudera/csd
/opt/cloudera/parcel-repo
/usr/sbin/cmf-server
/var/lib/cloudera-scm-server

[root@bogon ~]# rpm -ql cloudera-manager-daemons
...
/usr/share/cmf/yarn-fixtures/details_1.json
/usr/share/cmf/yarn-fixtures/details_2.json
/usr/share/cmf/yarn-fixtures/details_3.json
/usr/share/cmf/yarn-fixtures/details_4.json
/usr/share/cmf/yarn-fixtures/details_5.json
/usr/share/cmf/yarn-fixtures/details_6.json
/usr/share/cmf/yarn-fixtures/details_7.json
/usr/share/cmf/yarn-fixtures/details_8.json
/usr/share/cmf/yarn-fixtures/details_9.json
/var/log/cloudera-scm-server
/var/run/cloudera-scm-server

[ root @ bogon ~ ] # rpm -ql cloudera-manager-server

/ etc / cloudera scm server

/ etc / cloudera scm server / db . properties

/ etc / cloudera scm server / log4j . properties

/ etc / default / cloudera scm server

/ etc / rc . d / init . d / cloudera scm server

/ etc / security / limits . d / cloudera scm . conf

/ opt / cloudera / csd

/ opt / cloudera / parcel repo

/ usr / sbin / cmf server

/ var / lib / cloudera scm server

[ root @ bogon ~ ] # rpm -ql cloudera-manager-daemons

. . .

/ usr / share / cmf / yarn fixtures / details_1 . json

/ usr / share / cmf / yarn fixtures / details_2 . json

/ usr / share / cmf / yarn fixtures / details_3 . json

/ usr / share / cmf / yarn fixtures / details_4 . json

/ usr / share / cmf / yarn fixtures / details_5 . json

/ usr / share / cmf / yarn fixtures / details_6 . json

/ usr / share / cmf / yarn fixtures / details_7 . json

/ usr / share / cmf / yarn fixtures / details_8 . json

/ usr / share / cmf / yarn fixtures / details_9 . json

/ var / log / cloudera scm server

/ var / run / cloudera scm server

安装数据库和对应的 driver,这是因为 Cloudera Manager 本身需要把配置保存数据库中,另外后面装 Hive 时也需要数据库来保存元数据。

 

yum install mysql-server
yum install mysql-connector-java.noarch

yum install mysql server

yum install mysql connector java . noarch

接着配置一些数据库相关的参数,先在数据库添加数据库 cmf,以及对应的用户 cmf,还有密码。

 

mysql> create database cmf DEFAULT CHARACTER SET utf8;
Query OK, 1 row affected (0.00 sec)

mysql> grant all on cmf.* TO 'cmf'@'localhost' IDENTIFIED BY '123456';
Query OK, 0 rows affected (0.00 sec)

mysql > create database cmf DEFAULT CHARACTER SET utf8 ;

Query OK , 1 row affected ( 0.00 sec )

mysql > grant all on cmf . * TO ‘cmf’ @ ‘localhost’ IDENTIFIED BY ‘123456’ ;

Query OK , 0 rows affected ( 0.00 sec )

然后修改 /etc/cloudera-scm-server/db.properties 文件,配置 Cloudera manager 要访问哪个数据库,对应的用户名,密码等。

 

# The database type
# Currently 'mysql', 'postgresql' and 'Oracle' are valid databases.
com.cloudera.cmf.db.type=mysql

# The database host
# If a non standard port is needed, use 'hostname:port'
com.cloudera.cmf.db.host=localhost

# The database name
com.cloudera.cmf.db.name=cmf

# The database user<a href="http://linmingren.me/blog/wp-content/uploads/2014/09/cloudera-welcome.png"><img src="http://linmingren.me/blog/wp-content/uploads/2014/09/cloudera-welcome-1024x375.png" alt="" title="cloudera welcome" width="584" height="213" class="alignnone size-large wp-image-479" /></a>
com.cloudera.cmf.db.user=cmf

# The database user's password
com.cloudera.cmf.db.password=123456

# The database type

# Currently ‘mysql’, ‘postgresql’ and ‘oracle’ are valid databases.

com . cloudera . cmf . db . type = mysql

# The database host

# If a non standard port is needed, use ‘hostname:port’

com . cloudera . cmf . db . host = localhost

# The database name

com . cloudera . cmf . db . name = cmf

# The database user<a href=”http://linmingren.me/blog/wp-content/uploads/2014/09/cloudera-welcome.png”><img src=”http://linmingren.me/blog/wp-content/uploads/2014/09/cloudera-welcome-1024×375.png” alt=”” title=”cloudera welcome” width=”584″ height=”213″ class=”alignnone size-large wp-image-479″ /></a>

com . cloudera . cmf . db . user = cmf

# The database user’s password

com . cloudera . cmf . db . password = 123456

现在就可以启动 cloudera-scm-server 服务了, 用 netstat 命令看下 7180 端口有没有启动(从服务启动到端口开启在我的机器上大概要半分钟),有的话就可以在浏览器中输入 localhost:7180 来访问 Cloudera Manger 的 web 界面了(默认用户密码是 admin/admin),没有的话请看 /var/log/cloudera-scm-server/cloudera-scm-server.log 中的异常是什么。

 

service cloudera-scm-server restart

service cloudera scm server restart

第一次登陆进去的首页是这

使用 Cloudera Manager 安装 Hadoop

更多 Hadoop 相关信息见 Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13

本文永久更新链接地址 :http://www.linuxidc.com/Linux/2016-06/132598.htm

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-21发表,共计6063字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中