当前位置: 首页 > news >正文

怎样做企业手机网站建设广州个人网站制作

怎样做企业手机网站建设,广州个人网站制作,东道设计官网,网页设计中界面设计尺寸为目录 整体执行流程​ Map端执行流程 Reduce端执行流程 Shuffle执行流程 整体执行流程 八部曲 读取数据-- 定义map -- 分区 -- 排序 -- 规约 -- 分组 -- 定义reduce -- 输出数据 首先将文件进行切片#xff08;block#xff09;处理#xff…目录 整体执行流程​ Map端执行流程 Reduce端执行流程 Shuffle执行流程 整体执行流程 八部曲 读取数据-- 定义map -- 分区 -- 排序 -- 规约 -- 分组 -- 定义reduce -- 输出数据 首先将文件进行切片block处理每一个block由一个MapTask处理 读取数据  将切片中每一行内容解析为键值对 keyvalue 定义map   每解析出一个键值对就调用一次Mapper类中的map方法 分区  根据这些输出的键值对进行分区分区的数量为reduce任务运行的数量默认1个 排序  对输出的键值对进行排序 规约  对这些键值对进行局部聚合处理combiner处理键值相等的键值对会调用一次reduce方法默认没有本阶段 分组合并  Reduce任务会主动从Mapper任务中复制它输出的键值对到Reduce本地数据中对所有的数据合并 然后再对这个大数据进行排序 定义reduce  对排序后的键值对调用reduce方法键相等的键值对调用一次reduce方法 输出数据 将输出的键值对写入到hdfs文件中 Map端执行流程 第一阶段是把输入目录下文件按照一定的标准逐个进行逻辑切片形成切片规划。默认情况下Split size  Block size。每一个切片由一个MapTask处理。getSplits第二阶段是对切片中的数据按照一定的规则解析成key,value对。默认规则是把每一行文本内容解析成键值对。key是每一行的起始位置(单位是字节)value是本行的文本内容。TextInputFormat第三阶段是调用Mapper类中的map方法。上阶段中每解析出来的一个k,v调用一次map方法。每次调用map方法会输出零个或多个键值对。第四阶段是按照一定的规则对第三阶段输出的键值对进行分区。默认是只有一个区。分区的数量就是Reducer任务运行的数量。默认只有一个Reducer任务。第五阶段是对每个分区中的键值对进行排序。首先按照键进行排序对于键相同的键值对按照值进行排序。比如三个键值对2,2、1,3、2,1键和值分别是整数。那么排序后的结果是1,3、2,1、2,2。如果有第六阶段那么进入第六阶段如果没有直接输出到文件中。第六阶段是对数据进行局部聚合处理也就是combiner处理。键相等的键值对会调用一次reduce方法。经过这一阶段数据量会减少。本阶段默认是没有的。 Reduce端执行流程 第一阶段是Reducer任务会主动从Mapper任务复制其输出的键值对。Mapper任务可能会有很多因此Reducer会复制多个Mapper的输出。第二阶段是把复制到Reducer本地数据全部进行合并即把分散的数据合并成一个大的数据。再对合并后的数据排序。第三阶段是对排序后的键值对调用reduce方法。键相等的键值对调用一次reduce方法每次调用会产生零个或者多个键值对。最后把这些输出的键值对写入到HDFS文件中。 Shuffle执行流程 map阶段处理的数据如何传递给reduce阶段是MapReduce框架中最关键的一个流程这个流程就叫shuffle。 shuffle: 洗牌、发牌——核心机制数据分区排序合并。 1).Collect阶段将MapTask的结果输出到默认大小为100M的环形缓冲区保存的是key/valuePartition分区信息等。 2).Spill阶段当内存中的数据量达到一定的阀值的时候就会将数据写入本地磁盘在将数据写入磁盘之前需要对数据进行一次排序的操作如果配置了combiner还会将有相同分区号和key的数据进行排序。  3).Merge阶段把所有溢出的临时文件进行一次合并操作以确保一个MapTask最终只产生一个中间数据文件。 4).Copy阶段 ReduceTask启动Fetcher线程到已经完成MapTask的节点上复制一份属于自己的数据这些数据默认会保存在内存的缓冲区中当内存的缓冲区达到一定的阀值的时候就会将数据写到磁盘之上。 5).Merge阶段在ReduceTask远程复制数据的同时会在后台开启两个线程对内存到本地的数据文件进行合并操作。 6).Sort阶段在对数据进行合并的同时会进行排序操作由于MapTask阶段已经对数据进行了局部的排序ReduceTask只需保证Copy的数据的最终整体有效性即可。 Shuffle中的缓冲区大小会影响到mapreduce程序的执行效率原则上说缓冲区越大磁盘io的次数越少执行速度就越快
http://www.hkea.cn/news/14298460/

相关文章:

  • 佛山家具网站建设公司广州网站设计我选刻
  • 神木网站建设设计快速做网站费用
  • 网站微信建设运维培训班做视频网站空间要多大
  • 网站建设优化培训班软件开发前景分析
  • wordpress文章阅读更多按钮广东网站seo
  • 爱站网源码wordpress图片暗箱
  • 自己建设网站赚钱个人微信小程序怎么赚钱
  • 西安企业网站建设多少钱重庆网站制作工作室
  • 企业网站的建立的目的做证券考试的网站
  • 团结湖网站建设生成静态网站
  • 网站和浏览器不兼容seo免费软件
  • 石家庄站在哪个区陕西省建设资质是哪个网站
  • 专业网站建设分为8步网站淘客怎么做
  • 商城网站开发背景建立网站底线
  • 教做月嫂的网站有吗莱芜网站建设与管理
  • 专业的网站建设报价湖南益阳新增本土确诊0例
  • 公司企业如何做网站cms系统推荐
  • 关于网站建设申请报告ftp网站地图怎么做
  • 济南手机网站建设公司万能短视频素材库
  • 做网站需要多大的图片自己建网站怎么建
  • 企业3合1网站建设公司绘图软件
  • 企业商城网站开发建设怎么查看自己网站有没有被百度收录
  • 镇江品牌网站建设企业宣传网站建设需求说明书的模板
  • c 网站做微信支付功能手机网站建设策划
  • 云建站淘宝客吉林市做网站的公司
  • 简述什么是网站做问答的网站
  • 网站推广要多少钱给网站做网络安全的报价
  • 台州市椒江建设工程机械厂网站西安网站建设公司哪有
  • 求个网站你懂我意思是网络文化经营许可证图片
  • 网站友情链接很重要吗做的网站很卡是什么原因呢