当前位置: 首页 > news >正文

在线免费网站建设深圳品牌营销咨询公司

在线免费网站建设,深圳品牌营销咨询公司,轻云服务器 安装wordpress,付费阅读网站建设前一阵子查看我们公司的大数据平台的离线脚本运行情况, 结果发现有一个任务居然跑了一天多, 要知道这还只是几千万量级的表, 且这个任务是每天需要执行的 于是我把hive脚本捞出来看了下, 发现无非多join了几个复杂的子查询, 应该不至于这么久, 包括我又检查了是不是没有加上每…前一阵子查看我们公司的大数据平台的离线脚本运行情况, 结果发现有一个任务居然跑了一天多, 要知道这还只是几千万量级的表, 且这个任务是每天需要执行的 于是我把hive脚本捞出来看了下, 发现无非多join了几个复杂的子查询, 应该不至于这么久, 包括我又检查了是不是没有加上每日分区的筛选条件 在反反复复测试调整以后, 我发现问题出在这里: 隐式join的时候顺序问题会导致错误的笛卡尔积(不确定什么版本hive) 假如t1和t2关联,t2和t3关联, 但是如果写成了from t1,t3,t2比如下面这样, 就会造成t1和t3直接笛卡尔积, 再和t2笛卡尔积, 再where筛选 -- select x from t1,t3,t2 where t1.id t2.t1_id and t2.id t3.t2_id 比如t1,t2,t3表都是1000, 彼此关联的是10条, 则按常理应该是t1和t2筛选和关联后得到临时表10条, 然后这10条再和t3进行10*1000筛选和关联. 但是根据explain解释执行, 貌似hive会将上面的直接1000* 1000*1000 可想而知这个效率会是怎么样 最后改为正确的顺序, 从1天多变成了二几分钟.搞定 结论 hive这个不知道是不是bug, 也可能后续会修复, 但是保险起见最好按表的关联顺序来写建议用显式join查询写完hive脚本测试跑一次看看效率,不确定就explain
http://www.pierceye.com/news/87141/

相关文章:

  • 杭州微信建站一个主机放多个网站
  • 如何推进网站建设典当行网站模板
  • 河南省智慧团建培训优化
  • 创建网站需要注意什么网页交互设计
  • 网站建设费用摊销会计分录室内设计师工资一般多少
  • 一起做网站下载数据包在线商城建设
  • 网站开发怎么报价单做防水施工 上什么网站找
  • 网站备案查询官网入口卓手机建网站
  • 投资公司网站建设方案免费建站模板哪个好
  • 名词解释 网站内容企网官方网站
  • 大连网站设计团队网站外链什么时候做
  • 化工废料网站建设设置网站默认首页
  • 山西网站备案网站云解析域名解析
  • 天猫店铺装修做特效的网站桂阳网站开发
  • 阿里巴巴网站建设基本内容网站建设软件设施
  • 吴忠建设局网站怎么注册公司域名邮箱
  • 手机站点如何建立公司网站网页
  • 咸宁网站建设公司宁波公司注销
  • 萧山做网站的公司做好门户网站建设
  • 做公司网站哪家好wordpress页面导航菜单
  • 无锡网站优化推广一般做美食网站的产品需求
  • 网站建设教程搭建芽嘱湖南岚鸿信赖最新大连市热议新闻
  • 网站内部链接怎么做的成都中方互动科技有限公司
  • 深圳网站建设服务比较便宜网站开发失败原因分析
  • 松江新城做网站谷歌外贸平台
  • 网站介绍模板贝斯特专业网站
  • 建设公司网站费用怎么做账广州模板建站哪家好
  • 关键词密度查询站长工具大连网络推广广告代理
  • 企业网页设计网站案例绍兴seo淄博公司
  • 信阳建设监理协会网站科技股