Ambari2.7.3

一、目的:

为了实现公司项目对海量业务数据、文件进行存储,系统间共享,并且达到以下几点要求,可行方案hadoop集群。

    数据安全 
    需要实现数据冗余,避免数据的单点故障
    可线性扩展 
    当数据增长到TB、甚至PB以上时,存储方案需要支持可线性扩展
    存储高可用 
    某个存储服务宕掉时,不影响整体存储方案的可用
    性能 
    性能达到应用要求

二、版本选择:

目前而言,不收费的Hadoop版本主要有三个(均是国外厂商),分别是:
Apache(最原始的版本,所有发行版均基于这个版本进行改进)。

Hortonworks版本(Hortonworks Data Platform,简称“HDP”)。

Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH)。

对比:

(1)Apache版本建议学习使用,不建议在生产环境使用。

(2)Hortonworks 主打产品是Hortonworks Data Platform (HDP),也同样是100%开源的产品,HDP除了常见的项目外还包含了Ambari,一款开源的安装和管理系统。HCatalog,一个元数据管理系统。

(3)Cloudera 最成型的发行版本,拥有最多的部署案例。提供强大的部署、管理和监控工具。Cloudera开发并贡献了可实时处理大数据的Impala项目,Cloudera有免费版和企业版,企业版只有60天试用期,不过基本上免费版也满足生产环境的使用,监控工具为中文,不过Cloudera的代码不开源,只能通过产生本身的BUG修改补丁升级等。

三、hortonworks简介

需求使用到的分别为Apache Ambari和HDP和HDP-UTILS。

Apache Ambari是一个基于web的工具,用于配置、管理和监视Apache Hadoop集群,支持Hadoop HDFS,、Hadoop MapReduce、Hive、HCatalog,、HBase、ZooKeeper、Oozie、Pig和Sqoop。Ambari同样还提供了集群状况仪表盘,比如heatmaps和查看MapReduce、Pig、Hive应用程序的能力,以友好的用户界面对它们的性能特性进行诊断。

HDP是hortonworks的软件栈,里面包含了hadoop生态系统的所有软件项目,比如HBase,Zookeeper,Hive,Pig等等。

HDP-UTILS是工具类库。

文章链接: https://www.mfisp.com/20234.html

文章标题:Ambari2.7.3

文章版权:梦飞科技所发布的内容,部分为原创文章,转载请注明来源,网络转载文章如有侵权请联系我们!

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给TA打赏
共{{data.count}}人
人已打赏
建站教程

Hadoop在CDH和HDP中的使用(二)

2023-5-5 11:33:59

建站教程

Hortonworks3 HDP

2023-5-6 10:39:48

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
客户经理
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索

梦飞科技 - 最新云主机促销服务器租用优惠