Hadoop集群硬件标准配置

227次阅读

没有评论

共计 1523 个字符，预计需要花费 4 分钟才能阅读完成。

在我们选择硬件的时候，往往需要考虑应用得到的性能和经费开支。为此，我们必须在满足实际需要和经济可行上找到一个完美的平衡。下面，以 Hadoop 集群应用为了例子，说明需要考虑的要素。

1. I/ O 绑定的工作负荷。

Hadoop 涉及到的 I / O 操作，主要包括下列几项：

索引（Indexing）
群化（Grouping）
数据导入和导出（Data importing and exporting）
数据移动和转换（Data movement and transformation）

2. CPU 绑定的工作负荷

Hadoop 中，作业的执行，需要 CPU 的持续运作。

下面列举了几个方面：

集群处理（Clustering/Classification）
复杂的文本挖掘 Complex text mining
自然语言的处理 (Natural-language processing)
特殊功能的提取（Feature extraction）

说了这里，还是直接说明 Hadoop 标准配置吧。企业级应用，私有云处理都可能涉及到这样的配置需要。下面列举 DataNode/TaskTrackers(MR1) 的标准配置规格说明：

12-24 1-4TB 硬盘（批量的磁盘）
2 quad-/hex-/octo-core CPUs，运行频率至少 2 -2.5GHz
64-512GB of RAM(内存)

绑定 Gigabit Ethernet（千兆网络，更多的存储密度，需要更高的网络输入的需要）

Hadoop 集群中，NameNode/JobTracker(MR1) 的标准配置规格说明：

3-6 1TB 硬盘（批量的磁盘）
2 quad-/hex-/octo-core CPUs，运行频率至少 2 -2.5GHz
64-512GB of RAM(内存)

绑定 Gigabit Ethernet（千兆网络，更多的存储密度，需要更高的网络输入的需要）

其实，根据业务来划分硬件的配置，在参数上稍微有点区别。从上面的配置可以看出，数据存储需要的硬盘容量比较大。可见，考虑真实的业务需求是有必要的。可能规模小一点的，配置稍微弱一点也是可以的。

以上参数，仅供参考而已。

————————————– 分割线 ————————————–

CentOS 6.4 下 Hadoop 0.20.2 安装实录 http://www.linuxidc.com/Linux/2014-02/96864.htm

Ubuntu 13.04 上搭建 Hadoop 环境 http://www.linuxidc.com/Linux/2013-06/86106.htm

Ubuntu 12.10 +Hadoop 1.2.1 版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm

Ubuntu 上搭建 Hadoop 环境（单机模式 + 伪分布模式）http://www.linuxidc.com/Linux/2013-01/77681.htm

Ubuntu 下 Hadoop 环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm

单机版搭建 Hadoop 环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm

————————————– 分割线 ————————————–

更多 Hadoop 相关信息见 Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13

正文完

星哥玩云-微信公众号

发表至：服务器应用

2022-01-20

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

.Net Core 实现验证码功能

HttpServletRequestWrapper模拟实现分布式Session

Ubuntu 14.04下apt-get方法安装LNMP环境

基于CentOS的企业架构规划及服务器优化参数

CentOS6/7手动扩展PHP的IMAP模块

使用logrotate分割Tomcat的catalina日志

Linux入门教程：CDN加速

Ceph 单/多节点安装小结 Power by CentOS 6.x

Ubuntu下Hadoop1.0.4源码编译

Hadoop集群硬件标准配置

申请腾讯混元的API Key并且使用LobeChat调用混元AI

基于Docker快速搭建一个开源的IT人员在线工具箱-it-tools

让每个人都可以轻松使用Git-腾讯自研Git客户端

使用Docker部署开源的WPS-Office

开源软件让你更优雅的阅读微信公众号

7 个致命的 Linux 命令

干货：蓝鲸智云社区版V3.1详细安装记录

解析Linux中出现的错误：toomanyopenfiles

新手都曾搞很久的VMware虚拟机三种网络模式超详解

腾讯云8核16G5M服务器多少钱？CVM和轻量配置价格表，真优惠！