- 大数据技术入门(第2版)
- 杨正洪
- 464字
- 2020-11-23 16:47:49
1.3 Hadoop和云平台的应用实例
除了使用AWS管理界面(见图1-6)操作EC2、S3等组件之外,我们可以在个人计算机(例如苹果Mac)上安装AWS CLI(命令行接口),然后使用脚本来创建和管理EC2实例、S3存储等。其实,脚本模式是最常见的模式。下面我们以在AWS上部署Hadoop为例来说明。
在实际工作中,我使用了Chef工具和CodeDeploy工具(与Debian Package结合使用)。Chef是大数据环境下的自动化运维工具和IT自动化平台,可创建、部署、变更和管理基础设施运行时环境和应用。Chef是平台无关的,可以部署到云端或本地。Chef也被称为部署自动化工具和DevOps使能者。我们把在AWS上安装和部署Hadoop的配置参数做成了Chef脚本(.yml文件),并把Chef脚本放在GitHub上进行管理。图1-18显示了两类脚本,一类是在云平台上设置好虚拟机等,另一类是在大数据平台(Hadoop)层面上设置好集群。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P25_10275.jpg?sign=1739609951-6vOXf8OHu3OsFPRYLkNYVQNO3Xs5Y4Tu-0-854cb75fc24808b600277ca6f210bd93)
图1-18 部署层次图
1.3.1 云平台层面配置
下面是一个实际的Hadoop上的Master节点在云平台层面的配置信息。从中可以看到EC2实例类型、EBS卷、Auto Scaling和安全组的设置等:
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P25_10277.jpg?sign=1739609951-OfFprxwJnhFergK1wUjKUwMaVQe9Fz2s-0-7e756902d6bb7d3177b72d88f292ba8e)
下面是一个实际的Hadoop集群上的Slave节点在云平台层面的配置信息:
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P27_3169.jpg?sign=1739609951-apkaidwoQwVGPQCdA0EYv0T528ynRitw-0-1008f9721822c2fce2603d5699761c92)
1.3.2 大数据平台层面配置
下面是一个实际的Hadoop集群的配置信息。从中可以看到vcore个数设置、资源调度等:
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P27_10279.jpg?sign=1739609951-PdqyKwcNDcc0dX8t5lumIaogt1Lhzyou-0-d46bee1ee983e07f5d621406a54765e2)
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P28_3170.jpg?sign=1739609951-JpDK1M4asZO5dVr1PbP8v3Ml7S9iKBny-0-988ffb02c11364c10d5f6070ea9b7b5f)
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P29_3175.jpg?sign=1739609951-0I9FSj8aOeMZzYBrr4MhPZ37PqpSdM0U-0-3fb901224321493e285027d10d666d6b)