当前位置: 首页 > news >正文

怎么用网站卖自己做ftp备份wordpress

怎么用网站卖自己做,ftp备份wordpress,淮南市潘集区信息建设网站,昆明本地网站一、简介 为了实现一个Hadoop集群的集群共享、可伸缩性和可靠性#xff0c;并消除早期MapReduce框架中的JobTracker性能瓶颈#xff0c;开源社区引入了统一的资源管理框架YARN。 YARN是将JobTracker的两个主要功能#xff08;资源管理和作业调度/监控#xff09;分离并消除早期MapReduce框架中的JobTracker性能瓶颈开源社区引入了统一的资源管理框架YARN。 YARN是将JobTracker的两个主要功能资源管理和作业调度/监控分离主要方法是创建一个全局的ResourceManagerRM和若干个针对应用程序的ApplicationMasterAM。 二、YARN结构 YARN分层结构的本质是ResourceManager。这个实体控制整个集群并管理应用程序向基础计算资源的分配。ResourceManager将各个资源部分计算、内存、带宽等精心安排给基础NodeManagerYARN的每节点代理。ResourceManager还与Application Master一起分配资源与NodeManager一起启动和监视它们的基础应用程序。在此上下文中Application Master承担了以前的TaskTracker的一些角色ResourceManager 承担了JobTracker的角色。 Application Master管理一个在YARN内运行的应用程序的每个实例。Application Master负责协调来自ResourceManager的资源并通过NodeManager监视容器的执行和资源使用CPU、内存等的资源分配。 NodeManager管理一个YARN集群中的每个节点。NodeManager提供针对集群中每个节点的服务从监督对一个容器的终生管理到监视资源和跟踪节点健康。MRv1通过插槽管理Map和Reduce任务的执行而NodeManager管理抽象容器这些容器代表着可供一个特定应用程序使用的针对每个节点的资源。 YARN结构如下图所示 名称描述ClientYARN Application客户端用户可以通过客户端向ResourceManager提交任务查询Application运行状态等。ResourceManager(RM)负责集群中所有资源的统一管理和分配。接收来自各个节点NodeManager的资源汇报信息并根据收集的资源按照一定的策略分配给各个应用程序。NodeManager(NM)NodeManagerNM是YARN中每个节点上的代理管理Hadoop集群中单个计算节点包括与ResourceManger保持通信监督Container的生命周期管理监控每个Container的资源使用内存、CPU等情况追踪节点健康状况管理日志和不同应用程序用到的附属服务auxiliary service。ApplicationMaster(AM)即图中的App Mstr负责一个Application生命周期内的所有工作。包括与RM调度器协商以获取资源将得到的资源进一步分配给内部任务资源的二次分配与NM通信以启动/停止任务监控所有任务运行状态并在任务运行失败时重新为任务申请资源以重启任务。ContainerContainer是YARN中的资源抽象封装了某个节点上的多维度资源如内存、CPU、磁盘、网络等目前仅封装内存和CPU当AM向RM申请资源时RM为AM返回的资源便是用Container表示。YARN会为每个任务分配一个Container且该任务只能使用该Container中描述的资源。 在YARN中资源调度器是以层级队列方式组织资源的这种组织方式有利于资源在不同队列间分配和共享进而提高集群资源利用率。如下图所示Superior Scheduler和Capacity Scheduler的核心资源分配模型相同。 调度器会维护队列的信息。用户可以向一个或者多个队列提交应用。每次NM心跳的时候调度器会根据一定规则选择一个队列再选择队列上的一个应用并尝试在这个应用上分配资源。若因参数限制导致分配失败将选择下一个应用。选择一个应用后调度器会处理此应用的资源申请。其优先级从高到低依次为本地资源的申请、同机架的申请任意机器的申请。 三、YARN原理 新的Hadoop MapReduce框架被命名为MRv2或YARN。YARN主要包括ResourceManager、ApplicationMaster与NodeManager三个部分。 ResourceManagerRM是一个全局的资源管理器负责整个系统的资源管理和分配。主要由两个组件构成调度器Scheduler和应用程序管理器Applications Manager。 调度器根据容量、队列等限制条件如每个队列分配一定的资源最多执行一定数量的作业等将系统中的资源分配给各个正在运行的应用程序。调度器仅根据各个应用程序的资源需求进行资源分配而资源分配单位用一个抽象概念Container表示。Container是一个动态资源分配单位将内存、CPU、磁盘、网络等资源封装在一起从而限定每个任务使用的资源量。此外该调度器是一个可插拔的组件用户可根据自己的需要设计新的调度器YARN提供了多种直接可用的调度器比如FairScheduler和Capacity Scheduler等。 应用程序管理器负责管理整个系统中所有应用程序包括应用程序提交、与调度器协商资源以启动ApplicationMaster、监控ApplicationMaster运行状态并在失败时重新启动等。 NodeManagerNM是每个节点上的资源和任务管理器一方面会定时向RM汇报本节点上的资源使用情况和各个Container的运行状态另一方面接收并处理来自AM的Container启动/停止等请求。 ApplicationMasterAM负责一个Application生命周期内的所有工作。包括 与RM调度器协商以获取资源。 将得到的资源进一步分配给内部的任务(资源的二次分配)。 与NM通信以启动/停止任务。 监控所有任务运行状态并在任务运行失败时重新为任务申请资源以重启任务。 四、开源容量调度器Capacity Scheduler原理 Capacity Scheduler是一种多用户调度器它以队列为单位划分资源为每个队列设定了资源最低保证和使用上限。同时也为每个用户设定了资源使用上限以防止资源滥用。而当一个队列的资源有剩余时可暂时将剩余资源共享给其他队列。 Capacity Scheduler支持多个队列为每个队列配置一定的资源量并采用FIFO调度策略。为防止同一用户的应用独占队列资源Capacity Scheduler会对同一用户提交的作业所占资源量进行限定。调度时首先计算每个队列使用的资源选择使用资源最少的队列然后按照作业优先级和提交时间顺序选择同时考虑用户资源量的限制和内存限制。Capacity Scheduler主要有如下特性 容量保证。集群管理员可为每个队列设置资源最低保证和资源使用上限而所有提交到队列的应用程序共享这些资源。灵活性。如果一个队列中的资源有剩余可以暂时共享给那些需要资源的队列而一旦该队列有新的应用程序提交则占用资源的队列将资源释放给该队列。这种资源灵活分配的方式可明显提高资源利用率。多重租赁。支持多用户共享集群和多应用程序同时运行。为防止单个应用程序、用户或者队列独占集群中的资源集群管理员可为之增加多重约束比如单个应用程序同时运行的任务数等。安全保证。每个队列有严格的ACL列表规定它的访问用户每个用户可指定哪些用户允许查看自己应用程序的运行状态或者控制应用程序。此外集群管理员可指定队列管理员和集群系统管理员。动态更新配置文件。集群管理员可根据需要动态修改配置参数以实现在线集群管理 Capacity Scheduler中每个队列可以限制资源使用量。队列间的资源分配以使用量作为排列依据使得容量小的队列有竞争优势。集群整体吞吐较大延迟调度机制使得应用可以有机会放弃跨机器或者跨机架的调度争取本地调度。 五、YARN HA原理与实现方案 YARN中的ResourceManager负责整个集群的资源管理和任务调度在Hadoop2.4版本之前ResourceManager在YARN集群中存在单点故障的问题。YARN高可用性方案通过引入冗余的ResourceManager节点的方式解决了这个基础服务的可靠性和容错性问题。 ResourceManager的高可用性方案是通过设置一组Active/Standby的ResourceManager节点来实现的如图1。与HDFS的高可用性方案类似任何时间点上都只能有一个ResourceManager处于Active状态。当Active状态的ResourceManager发生故障时可通过自动或手动的方式触发故障转移进行Active/Standby状态切换。 在未开启自动故障转移时YARN集群启动后集群管理员需要在命令行中使用yarn rmadmin命令手动将其中一个ResourceManager切换为Active状态。当需要执行计划性维护或故障发生时则需要先手动将Active状态的ResourceManager切换为Standby状态再将另一个ResourceManager切换为Active状态。 开启自动故障转移后ResourceManager会通过内置的基于ZooKeeper实现的ActiveStandbyElector来决定哪一个ResourceManager应该成为Active节点。当Active状态的ResourceManager发生故障时另一个ResourceManager将自动被选举为Active状态以接替故障节点。 当集群的ResourceManager以HA方式部署时客户端使用的“yarn-site.xml”需要配置所有ResourceManager地址。客户端包括ApplicationMaster和NodeManager会以轮询的方式寻找Active状态的ResourceManager也就是说客户端需要自己提供容错机制。如果当前Active状态的ResourceManager无法连接那么会继续使用轮询的方式找到新的ResourceManager。 备RM升主后能够恢复故障发生时上层应用运行的状态详见ResourceManger Restart。当启用ResourceManager Restart时重启后的ResourceManager就可以通过加载之前Active的ResourceManager的状态信息并通过接收所有NodeManager上container的状态信息重构运行状态继续执行。这样应用程序通过定期执行检查点操作保存当前状态信息就可以避免工作内容的丢失。状态信息需要让Active/Standby的ResourceManager都能访问。当前系统提供了三种共享状态信息的方法通过文件系统共享FileSystemRMStateStore、通过LevelDB数据库共享LeveldbRMStateStore或通过ZooKeeper共享ZKRMStateStore。这三种方式中只有ZooKeeper共享支持Fencing机制。Hadoop默认使用ZooKeeper共享。 关于YARN高可用性方案的更多信息可参考如下链接 http://hadoop.apache.org/docs/r3.1.1/hadoop-yarn/hadoop-yarn-site/ResourceManagerHA.html https://hadoop.apache.org/docs/r3.3.1/hadoop-yarn/hadoop-yarn-site/ResourceManagerHA.html 六、Yarn和Spark组件的关系 Spark的计算调度方式可以通过Yarn的模式实现。Spark共享Yarn集群提供丰富的计算资源将任务分布式的运行起来。Spark on Yarn分两种模式Yarn Cluster和Yarn Client。 Yarn Cluster模式Spark on yarn-cluster运行框架 Spark on yarn-cluster实现流程 首先由客户端生成Application信息提交给ResourceManager。ResourceManager为Spark Application分配第一个Container(ApplicationMaster)并在该Container上启动Driver。ApplicationMaster向ResourceManager申请资源以运行Container。 ResourceManager分配Container给ApplicationMasterApplicationMaster和相关的NodeManager通讯在获得的Container上启动ExecutorExecutor启动后开始向Driver注册并申请Task。Driver分配Task给Executor执行。Executor执行Task并向Driver汇报运行状况。 Yarn Client模式Spark on yarn-client运行框架 Spark on yarn-client实现流程 在yarn-client模式下Driver部署在Client端在Client端启动。yarn-client模式下不兼容老版本的客户端。推荐使用yarn-cluster模式。 客户端向ResourceManager发送Spark应用提交请求ResourceManager为其返回应答该应答中包含多种信息(如ApplicationId、可用资源使用上限和下限等)。Client端将启动ApplicationMaster所需的所有信息打包提交给ResourceManager上。ResourceManager收到请求后会为ApplicationMaster寻找合适的节点并在该节点上启动它。ApplicationMaster是Yarn中的角色在Spark中进程名字是ExecutorLauncher。根据每个任务的资源需求ApplicationMaster可向ResourceManager申请一系列用于运行任务的Container。当ApplicationMaster从ResourceManager端收到新分配的Container列表后会向对应的NodeManager发送信息以启动Container。 ResourceManager分配Container给ApplicationMasterApplicationMaster和相关的NodeManager通讯在获得的Container上启动ExecutorExecutor启动后开始向Driver注册并申请Task。 正在运行的container不会被挂起释放资源。 Driver分配Task给Executor执行。Executor执行Task并向Driver汇报运行状况。 七、Yarn和MapReduce的关系 MapReduce是运行在Yarn之上的一个批处理的计算框架。MRv1是Hadoop 1.0中的MapReduce实现它由编程模型新旧编程接口、运行时环境由JobTracker和TaskTracker组成和数据处理引擎MapTask和ReduceTask三部分组成。该框架在扩展性、容错性JobTracker单点和多框架支持仅支持MapReduce一种计算框架等方面存在不足。MRv2是Hadoop 2.0中的MapReduce实现它在源码级重用了MRv1的编程模型和数据处理引擎实现但运行时环境由Yarn的ResourceManager和ApplicationMaster组成。其中ResourceManager是一个全新的资源管理系统而ApplicationMaster则负责MapReduce作业的数据切分、任务划分、资源申请和任务调度与容错等工作。 八、Yarn和ZooKeeper的关系 ZooKeeper与Yarn的关系 在系统启动时ResourceManager会尝试把选举信息写入ZooKeeper第一个成功写入ZooKeeper的ResourceManager被选举为Active ResourceManager另一个为Standby ResourceManager。Standby ResourceManager定时去ZooKeeper监控Active ResourceManager选举信息。Active ResourceManager还会在ZooKeeper中创建Statestore目录存储Application相关信息。当Active ResourceManager产生故障时Standby ResourceManager会从Statestore目录获取Application相关信息恢复数据。 九、Yarn和SmallFS的关系 SmallFS将会定期运行merge、delete、cleanup任务而这些任务是在Yarn上运行MapReduce任务来对HDFS上的文件数据进行merge、delete和cleanup操作。 十、Yarn和Tez的关系 Hive on Tez作业信息需要Yarn提供TimeLine Server能力以支持Hive任务展示应用程序的当前和历史状态便于存储和检索。
http://www.hkea.cn/news/14442573/

相关文章:

  • 建设科技网络网站的意义和目的asp.net做登录网站资源
  • 网站建设文字教程百姓网为什么不能创建地址
  • 网站后台补丁如何做网页制作模板在哪买
  • 河北网站制作公司哪家专业如何做企业推广
  • 织梦是什么网站网站关键词突然搜不到
  • 信阳工程建设一体化平台网站网络服务提供商有哪些公司
  • 站长 网站ip信阳制作网站ihanshi
  • 青秀区网站建设市场营销策略论文参考文献
  • 爬虫做网站相关教程个人网站备案需要多久
  • 美食网站html代码免备案域名免费申请
  • 网站搭建用什么软件网站有没有做网站地图怎么看
  • 银川专业做网站的公司免费qq空间网站
  • 北京最大网站建设公司排名哪有备案好的网站
  • 新乡正规网站建设哪家便宜化妆品网站建设描述
  • 阿里巴巴国际站下载卖家版后台控制网站关键词设置的详细代码
  • 网站优惠券怎么做的四川省住房和城乡建设厅官网平台
  • 网站建设及安全制度魔方网站
  • 网站安全查询系统通辽网站制作
  • 做网站咨询陕西网站制作公司哪家好
  • 展示型网站的特点做网站的教学视频
  • 58同城网站推广网站搜索引擎推广怎么做
  • 有哪些网站有收录做红酒的商行seo怎么做网站的tdk
  • 网站建设的要素silverlight做的网站
  • 阿里巴巴如何建设网站网站悬浮图片代码
  • 绥化网站建设公司游戏开服表网站开发
  • 国示建设网站wordpress修改管理员头像
  • 英雄联盟网站模板微信群推广
  • 巢湖网站制作网站建设业务需求文档
  • 高端html5网站设计工作室织梦模板 dedecms5.7做网站最好选什么语言
  • 网站开发算固定资产企业网站模板