4。1。2 FIFO算法伪代码实现 9
4。2 轮询算法的设计与实现分析 11
4。2。1 POLL算法流程图 11
4。2。2 POLL算法伪代码实现 11
4。2。3 POLL算法的具体实现 13
4。3 大作业优先算法的设计与实现分析 13
4。3。1 BJP算法相关概念和定义 13
4。3。2 BJP算法流程图 13
4。3。3 BJP算法伪代码实现 13
4。3。4 BJP算法的具体实现 14
5 加载调度器的配置和实验分析 18
5。1 运行自定义调度器的相关配置分析 18
5。1。1 运行自定义调度器的相关配置分析 18
5。1。2 运行自定义调度器要完成的工作 18
5。2 评估方法和工作量描述 18
5。2。1 正确性实验 19
5。2。2 性能对比实验 24
5。2。3 实验结论 27
总结与展望 28
致 谢 29
参 考 文 献 30
1 绪论
1。1 问题背景与研究意义
近来,云计算技术在工业界和学术界共同推动下取得了巨大的发展,大量的云计算框架投入使用[1-2]。诸如适合用于批处理的hadoop框架,用于进行流处理的storm框架,用于迭代处理的spark框架,以及Marathon,MPI等。同时,为各个框架分配资源的集群资源管理器也应运而生。当前国内外主流的集群管理器有Mesos和YARN。Mesos和YARN的侧重点不同,YARN主要专注于大数据平台,对上层计算框架提供了非常好的支持。Mesos则着重与集群资源的抽象和管理,不仅是支持计算框架,而且还支持各种应用。随着两者的不断完善,他们之间的界限越来越模糊。国内外各大互联网公司选择的资源管理器也不尽相同。如twitter,apple等大公司使用Mesos管理集群资源,国内的有豆瓣,爱奇艺等公司在使用Mesos;而Yahoo,阿里,腾讯等公司则是使用YARN管理集群资源。论文网
与传统做法:在框架间静态划分资源,使各种框架分别单独运行不同,集群资源管理器力争通过在多种框架之间动态共享资源来优化资源使用率。而资源调度策略对于集群资源使用率有至关重要的影响。各大公司也在根据自身业务特点开发与之相符的调度器以提高自身的集群资源使用率,增加产值。因此,根据业务需求、特点,开发与之切合的调度器对提高系统的整体性能和集群资源的使用具有重要意义。
1。2 国内外研究现状
1。3 论文研究内容
本文主要以Mesos[20]为载体,搭建分布式集群系统。并在其上实现常用的资源调度策略:先进先出(FIFO)、轮询(POLL)、大作业优先(Big Job Priority,简称BJP)等。通过理论分析和实验对比,将其与分布式系统相结合,并结合实际应用进行分析,验证各种算法在分布式系统中的优劣。具体包括以下内容:
(1)对Mesos架构及其相关概念,以及Mesos的运行机制和调度流程的介绍。