当前位置: 首页 > news >正文

北大青鸟网站建设课程体育新闻报道

北大青鸟网站建设课程,体育新闻报道,网站开发的项目背景,山东住房和建设庭官网站官前一阵子查看我们公司的大数据平台的离线脚本运行情况, 结果发现有一个任务居然跑了一天多, 要知道这还只是几千万量级的表, 且这个任务是每天需要执行的 于是我把hive脚本捞出来看了下, 发现无非多join了几个复杂的子查询, 应该不至于这么久, 包括我又检查了是不是没有加上每…前一阵子查看我们公司的大数据平台的离线脚本运行情况, 结果发现有一个任务居然跑了一天多, 要知道这还只是几千万量级的表, 且这个任务是每天需要执行的 于是我把hive脚本捞出来看了下, 发现无非多join了几个复杂的子查询, 应该不至于这么久, 包括我又检查了是不是没有加上每日分区的筛选条件 在反反复复测试调整以后, 我发现问题出在这里: 隐式join的时候顺序问题会导致错误的笛卡尔积(不确定什么版本hive) 假如t1和t2关联,t2和t3关联, 但是如果写成了from t1,t3,t2比如下面这样, 就会造成t1和t3直接笛卡尔积, 再和t2笛卡尔积, 再where筛选 -- select x from t1,t3,t2 where t1.id t2.t1_id and t2.id t3.t2_id 比如t1,t2,t3表都是1000, 彼此关联的是10条, 则按常理应该是t1和t2筛选和关联后得到临时表10条, 然后这10条再和t3进行10*1000筛选和关联. 但是根据explain解释执行, 貌似hive会将上面的直接1000* 1000*1000 可想而知这个效率会是怎么样 最后改为正确的顺序, 从1天多变成了二几分钟.搞定 结论 hive这个不知道是不是bug, 也可能后续会修复, 但是保险起见最好按表的关联顺序来写建议用显式join查询写完hive脚本测试跑一次看看效率,不确定就explain
http://www.hkea.cn/news/14275914/

相关文章:

  • 捷信做单官方网站在什么地方可以接到做网站的活
  • 网站建设类论文在人才网站做业务
  • wordpress邮件注册通知广东网站营销seo方案
  • 网站页面链接结构网站网页模板
  • 电子商务与网站建设论文专业零基础网站建设教学公司
  • 文化公司网站建设重庆企业年报网上申报入口
  • 图片类网站如何做优化网站排名软件下载
  • 怎样设计网站静态页面wordpress邮件
  • 网站建设东莞怎么创建网址
  • 招聘网站数建设vs2013做的网站
  • 平台网站开发公司西安做网站公司玖佰网络
  • 青岛百度网站排名手机房屋平面设计软件
  • 常德红网官网网站网站建设汇报会
  • 南充市住房建设局网站网站建设高端
  • 做服装要看国外哪些网站好wordpress留言功能
  • 青岛网站建设公司哪家好wordpress作者墙主题
  • 福建建设建设厅官方网站网站建设属于软件开发吗
  • 天津做网站外包公司网络营销推广专员的岗位职责
  • 网站关键词优化报价网站开发产品规划要求
  • 网站投资多少钱网络规划设计师历年试题分析与解答
  • 百科网站建设wordpress 页眉修改
  • 所有网站的名字大全建设工程施工合同内容
  • 乐清网站设计哪家好jsp做网站 案例
  • 自己电脑上做网站怎么使用源码深圳广告公司集中在哪里
  • 唐山如何做百度的网站毕业网站建设开题报告
  • 做网站高校视频企业信用信息公示系统网址年检
  • android 网站模板网站建设岗位要求
  • 东莞网上商城网站建设服装定制合同范本
  • 长沙seo网站建设袁飞最好双语网站用什么程序做
  • 氧化锌网站建设wordpress积分插件中文免费下载