当前位置: 首页 > news >正文

做桂林网站的图片大全网站运营与公司

做桂林网站的图片大全,网站运营与公司,阿里云已备案域名购买,网站开发网站建设制作费用用户域登录各窗口汇总表 主要任务#xff1a;从kafka页面日志主题读取数据#xff0c;统计 七日回流用户#xff1a;之前活跃的用户#xff0c;有一段时间不活跃了#xff0c;之后又开始活跃#xff0c;称为回流用户当日独立用户数#xff1a;同一个用户当天重复登录从kafka页面日志主题读取数据统计 七日回流用户之前活跃的用户有一段时间不活跃了之后又开始活跃称为回流用户当日独立用户数同一个用户当天重复登录只算作一个独立用户。 思路分析 读取kafka页面主题数据转换数据结构String - JSONObject过滤数据uid不为null 登录的两种情况 用户打开应用后自动登录用户打印应用后没有登录浏览后跳转到登录页面 过滤条件 uid不为null且last_page_id is nulllast_page_id login 设置水位线按照uid分组统计回流用户数和独立用户数开窗聚合写入doris 具体实现 设置端口、并行度、消费者组、kafka主题读取dwd页面主题数据 - stream.print()对数据进行清洗过滤uid不为空 stream.flatMap()使用flatMap过滤new FlatMapFunction(){}在该方法内部转换为JSONObject, 并且获取uid和lastPageId, try-catch这段代码判断是否满足思路分析中的条件如果中途发生异常直接catch后打印到控制台清理掉即可。 先注册水位线 jsonObjStream.assignTimestampAndWatermarknew SerializableTimestampAssigner, 提取数据中的ts 按照uid分组 stream.keyby()按照uid进行分组 判断独立用户和回流用户 创建UserLoginBean, 使用状态保存用户的登录信息在open方法中getRuntimeContext().getState(new ValueStateDescriptor(last_login_dt,String.class))创建状态记录用户上一次的登录时间在processElement方法中比较当前登录的日期和状态存储的日期 如果lastLoginDtnull是新用户如果不为空判断上次登录时间和当前时间的差值是否大于7天如果大于7天说明是回流用户。如果小于7天还需要判断上次登录时间是否是今天如果不是今天则说明该用户本次是独立用户。 开窗聚合 使用滚动窗口开窗聚合在reduce算子中写聚合逻辑在process算子中获取窗口信息 写入doris 创建doris sink写出到doris 核心代码 public static void main(String[] args) {new DwsUserUserLoginWindow().start(10024,4,dws_user_user_login_window, Constant.TOPIC_DWD_TRAFFIC_PAGE);}Overridepublic void handle(StreamExecutionEnvironment env, DataStreamSourceString stream) {//1.读取dwd页面数据//stream.print();//2. 对数据进行清洗过滤SingleOutputStreamOperatorJSONObject jsonObjStream etl(stream);//3. 注册水位线SingleOutputStreamOperatorJSONObject withWatermarkStream addWatermark(jsonObjStream);//4. 按照uid分组KeyedStreamJSONObject, String keyedStream getKeyedStream(withWatermarkStream);//5. 判断独立用户和回流用户SingleOutputStreamOperatorUserLoginBean processedStream getUserLoginBeanStream(keyedStream);//processedStream.print();//开窗聚合SingleOutputStreamOperatorUserLoginBean reducedStream getReducedStream(processedStream);//reducedStream.print();//写入DorisreducedStream.map(new DorisMapFunction()).sinkTo(FlinkSinkUtil.getDorisSink(Constant.DWS_USER_USER_LOGIN_WINDOW));}[gitee仓库地址(https://gitee.com/langpaian/gmall2023-realtime)
http://www.pierceye.com/news/419510/

相关文章:

  • 设计网页英语口碑优化seo
  • 试客那个网站做的好北京做软件开发的公司
  • 网站多套系统如何调用网页大图素材
  • 沧州网站建设方案咨询wordpress需要 伪静态
  • 安徽省住房和城乡建设部网站郑州百姓网免费发布信息
  • 电子商务网站开发是指聊城市城乡建设部网站查询
  • 聊天室网站模板国内市场调研公司
  • 网站做不做备案有什么区别网站媒体给房开做内容推广
  • 昆明专业网站建设模板蚌埠app制作公司
  • 平面ui设计网站网页布局设计类型
  • 东莞企石网站建设网站怎么留住用户
  • 公司网站虚假宣传但网站不是我做的wordpress自豪地采用修改
  • 山西大同网站建设哪家好宜宾seo快速排名
  • 网站为什么做黄词骗流量网站图标在哪里修改
  • 手机移动端网站建设青岛门户网站建设
  • 专业APP客户端做网站php完整电商网站开发源码
  • 网站代码500网站的页面风格是什么
  • 电商开发网站公司腾讯营销平台
  • 商务网站是什么网站建设技术有哪些
  • 专门做团购的网站有哪些微信小程序开发者工具官网下载
  • 网站开发的项目需求山东省住房和城乡建设厅电话
  • 网站建设初期推广方式安徽网站建设价格
  • 淘宝购买网站建设工业皮带怎么做免费的网站
  • 华城建设集团有限公司官方网站嵌入式软件开发教程
  • 建设邮箱网站桔子建站官网
  • 电子商务网站模板xampp下安装wordpress
  • 可以做动图的视频网站校园网站建设的目的
  • 专业网站制作公司塞尼铁克dw网页设计作品简单
  • 福州做网站公司有哪些中小企业网站制作塞尼铁克
  • 公司网站 钓鱼网站网站建设实训报告的内容怎么写