共计 1041 个字符,预计需要花费 3 分钟才能阅读完成。
最近写了个 Web 程序来调用 Hadoop 的 api,对 Hadoop 自带的管理方式进行了二次开发,加强了可操作性。现在简单的介绍下功能和方法。Hadoop 版本为 1.xx
1. 文件查看功能
先来个页面截图
这个功能实现主要是利用了 Hadoop 的 FileSystem 类得到 HDFS 文件的对象,并利用此提供的方法对 HDFS 进行操作。其中文件类型的判断用到的是 FileStatus 类。
2. 作业监控功能
作业的监控首先是得到一个 JobClient 对象,调用其 getAllJobs 方法,得到集群中所有作业的列表,再根据 JobStatus 得到作业的运行状态。
在作业监控种每个作业是由系统通过新建一线程实现的,在创建作业页面进行新建线程,由新线程去运行作业,这样并不妨碍主线程进行其它的作业新建或者对集群的管理。
页面中作业进程的更新是通过页面自动刷新得到的,这样比较浪费系统资源,或许用 Ajax 实现更好,随后有时间会进行完善。
Hadoop2.5.2 新特性 http://www.linuxidc.com/Linux/2014-11/109814.htm
CentOS 安装和配置 Hadoop2.2.0 http://www.linuxidc.com/Linux/2014-01/94685.htm
Ubuntu 13.04 上搭建 Hadoop 环境 http://www.linuxidc.com/Linux/2013-06/86106.htm
Ubuntu 12.10 +Hadoop 1.2.1 版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm
Ubuntu 上搭建 Hadoop 环境(单机模式 + 伪分布模式)http://www.linuxidc.com/Linux/2013-01/77681.htm
Ubuntu 下 Hadoop 环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm
单机版搭建 Hadoop 环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm
搭建 Hadoop 环境(在 Winodws 环境下用虚拟机虚拟两个 Ubuntu 系统进行搭建)http://www.linuxidc.com/Linux/2011-12/48894.htm
更多 Hadoop 相关信息见 Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13