当前位置: 首页 > news >正文

台州做网站电话福田所有车型

台州做网站电话,福田所有车型,设计网页需要多少价格,17173网络游戏Flink之时间语义 简介 Flink中时间语义可以说是最重要的一个概念了,这里就说一下关于时间语义的机制,我们下看一下下面的表格,简单了解一下 时间定义processing time处理时间,也就是现实世界的时间,或者说代码执行时,服务器的时间event time事件时间,就是事件数据中所带的时…Flink之时间语义 简介 Flink中时间语义可以说是最重要的一个概念了,这里就说一下关于时间语义的机制,我们下看一下下面的表格,简单了解一下 时间定义processing time处理时间,也就是现实世界的时间,或者说代码执行时,服务器的时间event time事件时间,就是事件数据中所带的时间(业务意义上的时间),和现实世界中的时间无关,只以数据中所带的时间为准ingestion time注入时间,也就是数据进入到Flink系统中最开始的那个时间,这个没什么用处.开发中使用的基本就是处理时间和事件时间. 通过表格中的内容我们对这三类时间代表的内容应该都清楚了,后面会先介绍一下时间语义的执行机制和对应的API使用. 机制 推进时间 何为时间标记,其实这里说的时间标记就是Flink中的WaterMark,是由于Operator[算子]中的定时器决定的,我们先看下图 图中我们是以event time为例子的,这样更便于理解 当数据从Mysql过来时,Operator中的定时器会先判断事件数据中所带的时间戳的大小当得知事件数据中的时间戳是截止目前为止的最大时间戳时,会和时间标记进行比较,其实也就是和WaterMark进行比较,发现大于WaterMark时,就会将时间戳进行更换,如果小于怎么办?小于就证明这一条数据时迟到的数据,就会被抛弃(这是发生在1对1的情况下).当时间标记更换完成后,就会将这个事件标记发送给下游算子. 推进时间选择 上面我们讲到了当时间标记更新完成后会发送给下游算子,试想一下如果下游的某个subtask接收的数据是上游的两个subtask发送来的数据时,且两条数据中的时间戳不同该怎么办?请看下图 Operator(subtask)这个算子实例,接收到了来自上游的两个推进时间300和700接收到之后首先判断出两个上游发送来的推进时间中的最小值,在图中也就是300判断出最小推进时间后,再和算子实例中存在的推进时间进行比较,如果大于当前算子实例中的推进时间则进行替换更新算子实例中的推进时间后,继续发送给下游 迟到数据 前面讲到了关于推进时间的更换和推进时间的选择,这里讲一下Flink中的迟到数据,什么是迟到数据?就是字面意思,来晚了. 比如说某个算子实例中的推进时间是1000,但是来了一条数据的时间是500,怎么办?这条数据会被舍弃掉,在使用Flink的时候我们要牢记一点未来尚可努力,过去不可更改,Flink中的时间线和现实世界中的时间线是一样的,只会推进永远不会回退,顶多在Flink中的时间可以暂停,但是一定一定是不可以回退的. 请看下图: 首先当前算子实例还是会对推进时间进行判断,获取最新的推进时间(800)当判断出推进时间为800时得知500~1000这个窗口还没有结束(窗口都是前闭后开)接收上游发送来的数据,根据数据中的事件时间将其发送到不同的桶中,如800和900的数据都符合当前桶(500~1000)的时间区间,那么就会将该数据分配到当前桶中,直到推进时间更新到1000时则开始计算当前桶中的数据如果发现数据中的事件时间超出当前桶的时间区间,则会根据该数据中的时间时间划分未来桶,如1000和1200都属于1000~1500这个时间区间,假如这时来了一条1500 data 2000的数据,这时又会划分出一个新的未来中,未来桶中的数据只要还没开始计算,就会一直这样划分下去.700的数据来时,发现时间时间700小于当前算子实例中的推进时间800,则将700的数据抛弃, 虽然700的数据在500~1000的区间,但是时间遵循不可回退的原则,所以该条数据必然会被抛弃将推进时间和计算完成的数据继续发往下游算子实例 推进时间暂停(即停止更新) 在Flink实时计算中还会出现一种情况,就是前面提到的,虽然时间不可回退,但是在Flink中可能会出现推进时间暂停的情况,这里就对这种情况进行说明,请看下图 同样下游的算子实例在选择推进时间时,会选择两个上游算子实例发来的推进时间中较小的那一个作为更新当前算子实例中的推进时间依据通过上图可知WaterMak为800的这个算子实例不再有新的WaterMark发送过来,所以对于下游的算子实例来说,不管另一个持续发送WaterMark的算子实例时间推进到哪里都没有作用了,也就是对于下游的算子实例时间已经暂停在800当下游的算子实例时间暂停后,上游其中一个算子实例还在源源不断的发送WaterMark和数据,这时在下游的算子实例的窗口中就会根据数据中的事件时间以500为一个区间不断地构建一个一个的未来桶,将这些数据先放起来发生这种情况时,如果时间过长就可能会导致程序崩溃报错,那么是否有解决方式呢?当然是有的,在Flink中为我们提供了一种机制watermark-idle-timeout,这个机制的作用是什么呢?当侦测到某一个支线一直没有数据进来,并且超过了watermark-idle-timeout设置的时间(比如说是2s),那么这个机制就会将推进时间往前推进2s,也就是说当我们将这个机制设置为2s时,那等待某个一直没有来数据支线的时间就是2s,到达2s这个临界值时就会自动更新推进时间 关于时间语义的机制大概就这些内容了,如有不对欢迎指正,如有问题共同探讨.
http://www.pierceye.com/news/45997/

相关文章:

  • 西安网站建设孙正学河南省建设网站首页
  • c 开发手机网站开发goodstore wordpress
  • 视觉品牌网站建设百度网页翻译
  • 阿里巴巴网站建设策略调研apple网站设计
  • 做企业网站用服务器吴江区经济开发区建设工程网站
  • 设计一个网站株洲seo优化哪家好
  • 益田附近网站建设wordpress 文档在线浏览
  • 如何建立营销网络成都百度seo搜索引擎优化培训
  • 建设网站关键词怎么写邢台做网站建设公司哪家好?
  • 政协网站法治建设珠宝网站方案
  • 连云港专业做网站软件开发岗位要求
  • 怎样给自己的网站做防红连接装饰设计学校
  • 个人网页设计制作网站模板那些网站被k恢复是怎么做的
  • 如何申请个人网站域名网站空间可以自己做服务器
  • 营销型网站建站系统下列哪个不属于网页制作工具
  • 城市分站cms网站网络推广方法
  • 网站建设思路方向电商优惠券网站 建设
  • 宿迁网站建设怎么收费电商网站的人员团队建设
  • 专业建站哪家好做水果的网站有哪些
  • 外贸seo网站推广wordpress多站点不显示
  • 快速做自适应网站宿迁网络推广公司
  • jsp网站建设项目实战课后wordpress主题小工具
  • 网站做过备案后能改别的公司吗wordpress知言主题
  • 签订网站建设合同需要注意什么单屏风格wordpress主题
  • 高端网站建设有哪些免费推广软件
  • 网站建站公司有必要做吗网站开发时保证用户登陆的安全
  • 惠州哪家做网站比较好wordpress 文章页面模板下载
  • html欧美网站模板上海网站建设哪里便宜
  • 备案名 网站名东莞如何制作网页
  • led灯笼河网站建设电脑什么软件可以做动漫视频网站