当前位置: 首页 > news >正文

建设银行网站如何查询开户行中国企业500强2021名单

建设银行网站如何查询开户行,中国企业500强2021名单,淘宝网页视频如何下载,蛋糕店网站开发策划书摘要#xff1a; MaxCompute是一套阿里自主研发的数据仓库解决方案。产品除了功能、性能、简单等优势外#xff0c;还能在费用上节省下一大笔前。墨迹天气使用MaxCompute#xff0c;除了性能和稳定性也有提升外#xff0c;整体存储和计算的费用比之前节省70%。这是如何做到…摘要 MaxCompute是一套阿里自主研发的数据仓库解决方案。产品除了功能、性能、简单等优势外还能在费用上节省下一大笔前。墨迹天气使用MaxCompute除了性能和稳定性也有提升外整体存储和计算的费用比之前节省70%。这是如何做到的呢这里有一些常用的规则。 原文链接http://click.aliyun.com/m/43695/ MaxCompute是一套阿里自主研发的数据仓库解决方案。产品除了功能、性能、简单等优势外还能在费用上节省下一大笔前。墨迹天气使用MaxCompute除了性能和稳定性也有提升外整体存储和计算的费用比之前节省70%。这是如何做到的呢这里有一些常用的规则。 在讨论如何做到之前我们先看下MaxCompute是如何计费的。根据目前的文档目前的计费方式包含数据的存储、数据的下载以及计算费用。其中计算费用又分I/O后付费和预付费两种收费模式。I/O后付费根据实际的计算来进行收费而预付费相当于包了几个CU只有购买者可以使用这几个CU上随便怎么计算都不会产生计算费用。所以如何减少费用也就是转换成如何减少存储的费用、如何减少下载的费用以及如何减少计算的费用。 存储 数据存储在MaxCompute上是使用列式存储并有压缩的底层数据存储方式不需要用户自己维护。但是用户可以通过减少存储在MaxCompute上的数据量来减少存储的费用。可以通过及时删除不需要的数据来减少存储费用。这里需要推荐用一个叫生命周期lifecycle的功能来定时回收过期的数据。设置了生命周期后如果是分区表分区表里的某个分区如果在指定的时间内数据没发生变更系统会认为这个分区已经不需要了会自动删除这个分区。如果是非分区表的话指定的时间内没有数据变化就会删除这整张表。这个功能可以用来配置到一些历史记录表上比如说如果不想要一年之前的历史记录可以把表根据写入时间做分区然后设置生命周期为一年。数据写入的时候每天数据只写入到当天的那个分区里。一年后之前的数据因为一整年都没有数据写入触发生命周期的条件并后台定时作业删除对应的分区里的数据。 在实际使用中除了因为没及时删除过期不要的历史记录造成的额外的存储费用外更多的是因为对数据的管理不到位导致的一些不需要的表一直没删除导致的空间占用。仔细想想在做查询的时候使用Create table xx as select先存了一些临时表用好没删除一直放着占用从存储空间这种事情应该每个人都做过一些。但是如果你真的要去找找哪些数据需要删除哪些数据是业务数据不能动的时候对着list tables;出来的几百几千张表也是很无从下手吧。对数据仓库做好分层做好命名规范对于每一层根据使用需要配置不同的生命周期回收策略用一个好的数据管理来保证数据仓库的表的有序存储不仅能节省一笔存储的钱也能在实际使用的时候快速找到需要的表便于数据的管理和使用。而如果有一些计算过程产生的临时表后续又确定用不到的可以在计算结束及时删除。具体可以参考祎休写的基于阿里云数加的企业大数据仓库架构建设思路有比较详细的说明。 下载 下载数据并非全部都会收费的有一些情况下数据下载也不会产生费用。合理利用这些规则选择正确的下载方式就能减少下载的费用而且下载不收费的方式也正好是下载最快的方式。具体的规则可以参考文档。 另外下载的费用还和下载的文件的大小有关系。通过合理的表结构设置和数据生成方式把每次需要下载的数据放到一张表或一个分区里减少下载量也是减少费用的一种策略。比如说需要下载3年级的学生信息的时候下载全部的学生信息后再执行过滤肯定比不过先根据年级对学生进行分区然后只下载3年级的分区来的方法好。 计算 计算里需要注意的相对会多一些。不过我们还是先看看计算的费用和什么有关。先说I/O后付费现在暂时还只是收取了SQL的费用所以本文也只讲SQL的部分。看到SQL的费用是根据输入的数据量和SQL的算法复杂度有关的。 计算引擎在计算的时候合理设置表的分区字段可以减少数据的输入量。关于分区可以参考这里。计算引擎在做执行计划解析的时候如果发现查询过滤条件是用分区字段做过滤的时候可以只读计算涉及的分区的数据从而减少输入的数据量。 除了减少输入的数据量减少计算复杂度也是一种方法。算法复杂度的优化一般涉及到代码层面的优化而且有时候需要和业务结合起来。比如前面已经有过一些数据预处理知道本次计算的数据某个字段没有重复那这次计算的时候就可以少加一次distinct或者group by。通过代码层面结合业务逻辑一起优化SQL语句减少计算的复杂度是减少计算费用的一种方法。 另外减少计算的次数也是一种方法。比如某几个计算都需要用到某个实时表的数据而且都是在某种过滤和汇总之后的再加工那完全可以把中间可以复用的计算过程保存下来在数据仓库上做适量的轻度汇总甚至高度汇总。后续的计算可以拿汇总数据再做进一步的计算。这样虽然中间多存了一些数据但是后续的计算的时候可以少算一些逻辑。这是数据仓库里经常用到的空间换时间的方法。配合之前提到的生命周期可以用最小的存储费用的代价获得最大的计算费用的减少。当然合理利用这种方法除了可以减少计算费用外因为减少重复计算也可以减少计算的时间提高效率。 除了以上提到的这些也可以考虑后付费的方式来跑计算也就是计算费用是包年包月的。一般来说满足以下条件可以考虑使用后付费 任务大部分是周期任务任务量比较均匀。如果任务以偶发性的临时查询为主可能不合适用后付费 任务的提交事件比较分散如果都集中在某个时间点一起算的也不太合适 经过一段时间的试运行任务数量已经基本可以估计不会短期内有比较的明显的增加或者减少 如果不满足这些 条件者很容易出现在高峰期购买的CU不够用任务出现排队低谷的时候资源又利用不起来造成浪费。 其他 关于费用其实还有两个非常关键的问题 1.我每天都花了多少钱如何优化 可以参考这里看看每天的账单通过检查里面的计算、存储和下载分别产生了多少费用。从而从对应的角度去做优化。另外也可以在表格里做金额的排序看看金额最高的几笔费用是什么费用看看能否针对性做一些优化。 2.我这个SQL提交后会产生多少费用 如果产生的费用都不清楚那提交一个SQL时心里是没底的。在大数据开发套件的数据开发里跑SQL会跳出消费提醒从而提前知道提交后会产生的费用。如果发现金额特别高可以考虑先做一些优化后再提交以免产生不必要的费用。如果是直接在MaxCompute客户端里跑SQL的话可以用cost sql ;估算SQL的费用。 识别以下二维码干货
http://www.pierceye.com/news/623111/

相关文章:

  • 绍兴网站建设专业的公司整站优化网站报价
  • 揭阳网站制作套餐邯郸市建设局网站材料下载入口
  • 整站seo公司做盗版小说网站赚钱嘛
  • 网站文章优化怎么做网站快速备案安全吗
  • dede网站本地访问速度慢哪个app可以免费下载ppt模板
  • 网站改版方案流程龙华网站建设主要工作
  • 福田网站制作报价百度推广工作怎么样
  • 常熟智能网站开发蚌埠市建设工程质监站网站
  • 网站做水印有没有影响吗怎么设计公司网页
  • 做视频推广有哪几个网站wordpress 多重筛选插件
  • 电脑网站怎样给网页做适配官方正版浏览器
  • php 可以自己做网站吗网站建设尾款如何做会计分录
  • app开发哪家公司好东莞网站优化多少钱
  • 企业网站最重要的访问对象是谈一谈对网站开发的理解
  • 国外网站做问卷怎么做免费公司网站
  • 内容型网站有哪些企业网站常见问题
  • 毕节市住房和城乡建设局网站做wordpress总结
  • 桐城市建设局网站wordpress主题美容
  • 海阳市城建设局网站深圳高端设计公司名单
  • 高端网站制作系统网站开发的背景和意义
  • 假电影网站做注册长春seo代理计费
  • 网站代运营公司怎么做vip电影网站
  • 南京网站南京网站设计制作公司提高工作效率
  • 大连网站制作最好的公司萍乡商城网站建设
  • 做网站有2个前提条件_一个是网站班级优化大师app下载学生版
  • 自己做网站广告法wordpress自带评论表情
  • 苏州市城乡和建设局网站首页在线crm系统价格
  • php企业门户网站陕西高速公路建设网站
  • 网站商城系统建设方案h5页面制作网站易企秀
  • 绍兴网站建设方案报价seo外贸网站