当前位置: 首页 > news >正文

哈尔滨网站建设招聘网站建设相关图片

哈尔滨网站建设招聘,网站建设相关图片,网站建设教程书籍免费下载,全国工程信息网Hive提供了explain命令来展示一个查询的执行计划#xff0c;这个执行计划对于我们了解底层原理#xff0c;Hive 调优#xff0c;排查数据倾斜等很有帮助。 使用语法如下#xff1a; explain query;在 hive cli 中输入以下命令(hive 2.3.7)#xff1a; explain select s…        Hive提供了explain命令来展示一个查询的执行计划这个执行计划对于我们了解底层原理Hive 调优排查数据倾斜等很有帮助。 使用语法如下 explain query;在 hive cli 中输入以下命令(hive 2.3.7) explain select sum(id) from test1;得到结果 STAGE DEPENDENCIES:Stage-1 is a root stageStage-0 depends on stages: Stage-1STAGE PLANS:Stage: Stage-1Map ReduceMap Operator Tree:TableScanalias: test1Statistics: Num rows: 6 Data size: 75 Basic stats: COMPLETE Column stats: NONESelect Operatorexpressions: id (type: int)outputColumnNames: idStatistics: Num rows: 6 Data size: 75 Basic stats: COMPLETE Column stats: NONEGroup By Operatoraggregations: sum(id)mode: hashoutputColumnNames: _col0Statistics: Num rows: 1 Data size: 8 Basic stats: COMPLETE Column stats: NONEReduce Output Operatorsort order:Statistics: Num rows: 1 Data size: 8 Basic stats: COMPLETE Column stats: NONEvalue expressions: _col0 (type: bigint)Reduce Operator Tree:Group By Operatoraggregations: sum(VALUE._col0)mode: mergepartialoutputColumnNames: _col0Statistics: Num rows: 1 Data size: 8 Basic stats: COMPLETE Column stats: NONEFile Output Operatorcompressed: falseStatistics: Num rows: 1 Data size: 8 Basic stats: COMPLETE Column stats: NONEtable:input format: org.apache.hadoop.mapred.SequenceFileInputFormatoutput format: org.apache.hadoop.hive.ql.io.HiveSequenceFileOutputFormatserde: org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDeStage: Stage-0Fetch Operatorlimit: -1Processor Tree:ListSink 我们将上述结果拆分看先从最外层开始包含两个大的部分 stage dependencies各个stage之间的依赖性 stage plan各个stage的执行计划 先看第一部分 stage dependencies 包含两个 stageStage-1 是根stage说明这是开始的stageStage-0 依赖 Stage-1Stage-1执行完成后执行Stage-0。 再看第二部分 stage plan里面有一个 Map Reduce一个MR的执行计划分为两个部分 Map Operator TreeMAP端的执行计划树 Reduce Operator TreeReduce端的执行计划树 这两个执行计划树里面包含这条sql语句的 operator TableScan表扫描操作map端第一个操作肯定是加载表所以就是表扫描操作常见的属性 alias表名称 Statistics表统计信息包含表中数据条数数据大小等 Select Operator选取操作常见的属性 expressions需要的字段名称及字段类型 outputColumnNames输出的列名称 Statistics表统计信息包含表中数据条数数据大小等 Group By Operator分组聚合操作常见的属性 aggregations显示聚合函数信息 mode聚合模式值有 hash随机聚合就是hash partitionpartial局部聚合final最终聚合 keys分组的字段如果没有分组则没有此字段 outputColumnNames聚合之后输出列名 Statistics表统计信息包含分组聚合之后的数据条数数据大小等 Reduce Output Operator输出到reduce操作常见属性 sort order值为空 不排序值为 正序排序值为 - 倒序排序值为 -  排序的列为两列第一列为正序第二列为倒序 Filter Operator过滤操作常见的属性 predicate过滤条件如sql语句中的where id1则此处显示(id 1) Map Join Operatorjoin 操作常见的属性 condition mapjoin方式 如Inner Join 0 to 1 Left Outer Join0 to 2 keys: join 的条件字段 outputColumnNamesjoin 完成之后输出的字段 Statisticsjoin 完成之后生成的数据条数大小等 File Output Operator文件输出操作常见的属性 compressed是否压缩 table表的信息包含输入输出文件格式化方式序列化方式等 Fetch Operator 客户端获取数据操作常见的属性 limit值为 -1 表示不限制条数其他值为限制的条数。 定位产生数据倾斜的代码段 数据倾斜大多数都是大 key 问题导致的。 如何判断是大 key 导致的问题可以通过下面方法 1. 通过时间判断 如果某个 reduce 的时间比其他 reduce 时间长的多如下图大部分 task 在 1 分钟之内完成只有 r_000000 这个 task 执行 20 多分钟了还没完成。 定位 SQL 代码 确定任务卡住的 stage 通过 jobname 确定 stage一般 Hive 默认的 jobname 名称会带上 stage 阶段如下通过 jobname 看到任务卡住的为 Stage-4 如果 jobname 是自定义的那可能没法通过 jobname 判断 stage。需要借助于任务日志 找到执行特别慢的那个 task然后 CtrlF 搜索 “CommonJoinOperator: JOIN struct” 。Hive 在 join 的时候会把 join 的 key 打印到日志中。如下 上图中的关键信息是struct_col0:string, _col1:string, _col3:string 这时候需要参考该 SQL 的执行计划。通过参考执行计划可以断定该阶段为 Stage-4 阶段 2. 确定 SQL 执行代码 确定了执行阶段即 Stage-4 阶段。通过执行计划则可以判断出是执行哪段代码时出现了倾斜。还是从此图这个 Stage-4 阶段中进行连接操作的表别名是 d 就可以推测出是在执行下面红框中代码时出现了数据倾斜因为这行的表的别名是 d 以上仅列举了4个我们生产中既熟悉又有点迷糊的例子explain 还有很多其他的用途如查看stage的依赖情况、hive 调优等小伙伴们可以自行尝试。
http://www.hkea.cn/news/14390899/

相关文章:

  • 营口网站开发公司合肥优秀网站建设
  • 网站管理系统改不了的wordpress博客被书为什么还
  • 青岛网站推跨境电商运营主要做什么
  • 怎么买网站免费一键生成转账截图
  • 做化妆品代理在那些网站比较多潍坊英文网站建设
  • 万网速成网站有哪些 功能网站内页模板
  • 教育主管部门建设的专题资源网站是有口碑的盐城网站开发
  • 山东省建设厅继续教育网站wordpress 搜索框样式
  • 企业网站示例wordpress 设置固定链接
  • ps如何做网站自己有网站源码就可以建设吗
  • 自助建站系统介绍wordpress开通邮箱
  • 贵阳能做网站的公司杭州网站改版公司
  • 找做网站找那个平台做高流量网站开发框架经验
  • 淮南网站建设费用商业空间设计ppt
  • 哪里有男男做受网站唐山网站建设方案报价
  • 怎么做考试资料网站html5个人网站源码
  • 网站 建设公司打电话推销好还是做网站推广好
  • 国外网站引流如何做网站建设方维
  • 一般做淘宝的素材都有哪个网站dedecms5.7 财经网站
  • 定制网站制作公司有哪些企业年金退休能拿多少
  • 南阳做网站哪家好seo中文意思
  • 合肥有什么好的网站建设公司网页制作与维护
  • 网站后台的网址忘记了怎么做企业功能网站
  • 网站建设开发多少钱网站建设顶层设计
  • jsp可以做那些小网站怎样获得做网站的客户
  • 网站加入购物车的代码云主机如何做两个网站
  • 做百度推广需要有网站吗工业园做网站的公司
  • seo站外推广海外电商平台有哪些
  • 南宁做企业网站运营企业网站
  • 网页界面设计内容分站城市网站如何做seo