谁能给我解释一下hadoop和cloudera hadoop之间的区别是什么?
什么是Apache Hadoop?
Apache™ Hadoop®项目为可靠、可扩展的分布式计算开发了开源软件。
Apache Hadoop 软件库是一个框架,它允许使用简单的编程模型在计算机集群上对大型数据集进行分布式处理。它被设计成可以从单台服务器扩展到数千台机器,每台机器提供本地计算和存储。该库本身不是依靠硬件来提供高可用性,而是设计成在应用层检测和处理故障,因此在计算机集群之上提供高可用性服务,而每个计算机集群都可能容易发生故障。
Cloudera 是基于Apache Hadoop的软件和服务的领导者,并提供了一个强大的新数据平台,使企业和组织能够查看他们所有的数据--结构化以及非结构化的数据--并提出更大的问题,以思想的速度获得前所未有的洞察力。
Cloudera是一家创业公司,他们为hadoop提供商业支持。
这里有一些Cloudera Hadoop的优势:1.Cloudera提供了一个工具SCM,会自动为你建立一个hadoop集群。
Cloudera捆绑了hadoop相关的项目,这是很容易安装在任何标准的linux盒子() 。
Cloudera确保CDH发行版和该发行版的hadoop项目是兼容的(例如,你不必为寻找与hadoop发行版兼容的hbase发行版以及相关项目之间的集成等问题而烦恼)
有不少大型企业在使用CDH,并有cloudera的支持,(Cloudera提供各种支持包)
详细的解释请见 此处: