共计 1435 个字符,预计需要花费 4 分钟才能阅读完成。
Ashish Thusoo,Qubole 的 CEO 和联合创始人,最近在 Enterprise Data World Conference (EDW)上谈到了作为一种服务产品的“云中巨象”Hadoop。大数据作为服务而不是一个产品会成为一个趋势,Hadoop 作为一种服务提供,旨在帮助机构处理大规模运行的 Hadoop 服务的挑战和成本。这些基于云服务的解决方案也可以从云服务的其他功能中获益,如动态配置、计算和存储的灵活性以及在多个地区的可用性。
Ashish 在开始谈论时说到,现在数据的性质,包括海里的交互数据,都是非结构化的。而不仅仅是我们长期以来传统应用程序里处理数据结构化数据。
分析的性质也发生了改变。Ashish 谈到了分析值从描述性向规范性分析的发展。
- 描述性分析(发生了什么?)
- 诊断性分析(为什么发生?)
- 预测性分析(将会发生什么?)
- 规范性分析(我们怎样才会让它发生?)
云提供很多好处,如按需和弹性扩展架构,高可扩展的对象存储和处理,和自适应的基础设施。使用云大数据平台提供更快的生产时间、敏捷和基础设施的灵活性以及显著降低成本。
Virtual Private Cloud (VPC)提供隔离访问计算和存储,以及提供安全实践。VPC 的安全性包括云存储中的数据和网络数据,以及基于访问计算和存储的角色加密选项。
现代数据处理平台包括多个处理引擎,可以处理各种案例,如下面列举出:
- 复杂批次处理 SQL,Hive
- 数据科学,Spark
- 简单交互 SQL 查询,Presto
- 批量数据清洗(ETL),Map Reduce
Ashish 还谈论了基于云平台的大数据参考架构,包括多租户数据访问、引擎统一、云计算服务和可移植性服务等。他总结报告说,Hadoop 作为一种服务提供在大数据架构决策时是一个吸引人眼球的选择。
下面关于 Hadoop 的文章您也可能喜欢,不妨看看:
Ubuntu14.04 下 Hadoop2.4.1 单机 / 伪分布式安装配置教程 http://www.linuxidc.com/Linux/2015-02/113487.htm
CentOS 安装和配置 Hadoop2.2.0 http://www.linuxidc.com/Linux/2014-01/94685.htm
Ubuntu 13.04 上搭建 Hadoop 环境 http://www.linuxidc.com/Linux/2013-06/86106.htm
Ubuntu 12.10 +Hadoop 1.2.1 版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm
Ubuntu 上搭建 Hadoop 环境(单机模式 + 伪分布模式)http://www.linuxidc.com/Linux/2013-01/77681.htm
Ubuntu 下 Hadoop 环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm
单机版搭建 Hadoop 环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm
更多 Hadoop 相关信息见Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13
查看英文原文:Elephant in the Cloud – Hadoop as a Service
本文永久更新链接地址:http://www.linuxidc.com/Linux/2016-05/131407.htm