当前位置: 首页 > news >正文

完整php网站开发小程序怎么开发

完整php网站开发,小程序怎么开发,网站开发 百度网盘,南宁百度推广代理商Web服务器日志分析项目 业务分析 业务背景 ​ 某大型电商公司#xff0c;产生原始数据日志某小时达4千五万条#xff0c;一天日志量月4亿两千万条。 主机规划 #xff08;可略#xff09;日志格式#xff1a; 2017-06-1900:26:36101.200.190.54 GET /sys/ashx/ConfigH…Web服务器日志分析项目 业务分析 业务背景 ​ 某大型电商公司产生原始数据日志某小时达4千五万条一天日志量月4亿两千万条。 主机规划 可略日志格式 2017-06-1900:26:36101.200.190.54 GET /sys/ashx/ConfigHandler.ashx actionjs 8008 - 60.23.128.118 Mazilla/5.0 (WindowsNT6.1;WOW64;rv:53.0)Gecko/20100101 Firefox/53.0 http://某网址/welcome.aspx 200业务需求 企业高层期望通过日志进行流量来源分析、网站访客特性等信息从而下沉访客为会员和客户。期望通过日志网页访问来分析出受欢迎和不受欢迎的功能模块、公司运营情况、关注细分功能访问量的统计和报表。掌握网站缺陷情况以便进行优化分析。 用户需求 运营、运维、产品部门提出以下具体需求 运营部门想知道最活跃的用户有哪些运维部门想知道经常被访问但无法响应的页面有哪些产品部门想知道最常被访问的页面有哪些以便进一步加强 功能需求 统计客户端访问次数最多的前10个IP地址按访问次数排序使用EChats柱状图可视化。分析客户端访问页面不正常的页面返回状态码不为200同上一的形式展示。统计客户端访问次数最多的前10个访问路径按访问次数排序使用EChats柱状图可视化。 技术方案设计 技术特性 数据量大不需要实时分析需要简单报表 考虑Hive 技术选型 大数据离线分析的行业最佳实践将架构由下向上分为5层此处不需要机器学习层 数据采集层数据存储层数据分析层机器学习层数据展示层 数据采集层 这里选用FlumeFlume可以采集文件socket数据包、文件、文件夹、kafka等各种形式源数据 - 又可以将采集到的数据(下沉sink)输出到HDFS、hbase、hive、kafka等众多外部存储系统中。在初步使用过程中我们经常监听一个socket端口或者是一个目录的形式去采集元数据。 这里我们监听目录的形式去将数据文件采集到HDFS上供给作业处理。 配置Flume对应的.conf文件进行采集和下沉 数据存储层 使用Hadoop的文件系统HDFS进行存储是最广泛和廉价的大数据分析平台存储方式。 使用基于hadoop的作业进行处理文中是MapReduce 数据分析层 此层文中规划的比较笼统如MapReduce、Spark、Hive等主离线如果是实时需求我们一般采用Flink。文中采用的具体技术栈是HIVE因为SQL语法减少了代码量。同时需求较为简单避免了引入Spark增加复杂度【技术没有最好的只有符合场景下最合适的】。 在Hive中引入hdfs中的表进行分析处理且输出 开启客户端Hive然后在Hive中创建数据库t1在t1数据库中创建内部表a1列之间用空格分隔将数据文件/out/part*导入该表。然后将业务逻辑SQL处理结果输出到结果目录针对不同的三个业务需求进行不同的SQL处理和编写此处略。 hive create database t1; hive use t1; hive create table a1(... ...) row format delimited fields terminated by ; hive load data inpath hdfs://localhost:9000/out/part* into table a1; hive select * from a1 limit 10;...//把分析数据以覆盖的方式插入该目录 hive insert overwrite directory hdfs://localhost:9000/user/hive/warehouse/a1 select n9,count(*) as num from a1 group by n9; 数据展示层 此层略述 主是SpringBoot一套的搭配Echatrs的可视化展示。具体是原生还是VUE均可。 Hadoop文件数据由sqoop管道传输到关系型数据库中。 利用管道工具sqoop将hdfs文件迁移到关系型数据库 sqoop export --connect jdbc:mysql://localhost:3306/sqoop --username hive --password hive --table a1 --export-dir /user/hive/warehouse/a1 --input-fields-terminated-by \001 --num-mappers 1项目技术栈流程图 招聘网站数据分析项目 相比于直接生成的数据文件这里的原始数据通过Python爬虫进行爬取后续步骤类似比如技术特性一致数据量大非实时等具体业务需求不一致原始数据格式不一致此处非日志格式而是JSON。即数据采集层使用Python的request模块进行采集。 项目技术栈流程图 电商网站实时数据分析项目 业务分析 电商网站的数据非常多有用户基本数据个人信息、账户信息等、访问数据浏览、点击、收藏、购买等、消费数据支付、转账等等。借助这些信息我们取其中两个简单的业务需求。 业务需求 企业高层期望能够随时查看当天的累计销售总额部门经理期望能看到某种类型商品如家电、食品下的销售总额观察日内的销售情况的变化 功能需求 统计当天的累计销售金额统计某种类型的商品当天每个时间段内的销售金额 这里技术特性就多了个实时性文中采用spark进行微批处理近实时性。 技术选型 大数据实时计算的行业最佳实践架构由下往上分为5层 数据采集层数据缓存层数据计算层数据存储层数据展示层 这里数据采集层依旧是使用Flume进行采集原始文件数据【数据采集层】但是采集之后下沉到缓存层不再是hdfs文件而是消息队列Kafka。【数据缓存层】。后经由Spark程序消费处理【数据计算层】后存储到Redis中【数据存储层】再通过Spring程序进行可视化展示【数据展示层】。 核心代码 这里的核心代码是Spark的处理如何把数据归纳到对应时间段进行累加统计文中采用的是最简单的直接根据解析出的JSON数据中的time字段进行Redis中对应的key进行累加操作。【采用的是Redis的incrBy累加操作此处文中未作说明并发情况下可能封装了redis的事务watch或者CAS乐观锁】并未使用开窗这里的需求和实现是伪实时的 项目技术栈流程图 金融大数据分析项目 业务需求 银行高层希望了解银行有哪些业务办理的方式各自占多少份额这样可以优化现有的资源配置更好地服务客户银行高层希望了解各个城市的业务量分别是多少有利于开展业务活动银行高层想要知道今年依赖哥哥月份的业务量及变化趋势并预测今年的业务办理总量银行高层希望能给基金用户推荐合适的基金真歹毒啊 功能需求 统计分析银行各种业务办理方式的占比采用Echarts饼状图统计分析银行哥哥城市的业务量并采用ECharts柱状图可视化统计分析银行截止到目前每个月的业务量并采用ECharts折线图可视化通过历史用户购买基金的数据使用协同过滤算法给当前用户推荐合适的基金 其中1和2属于离线数据分析3属于实时数据分析4属于数据挖掘。 技术特性 数据量较大业务较为复杂离线和实时需求交叉 技术框架 将其分为四层数据采集层、数据处理层、数据存储层、数据展示层。 数据采集层 文中离线处理方向数据采集使用SparkSQL从MySQL中采集数据实时方向采用Flume和Kafka从服务器进行采集数据。 数据处理层 离线方向采用Spark Core进行数据处理 实时方向采用Flink处理 数据存储层 离线采用MySql进行存储实时采用Redis进行存储 数据展示层 采用SpringBoot和VUE.js进行处理。 项目技术栈流程图 离线方向将数据用SparkSQL从MySQL中抽取后处理存放在Hive分区表中再用Spark进行处理和清洗统计分析保存在MySQL中。实时则是直接处理Flume采集到Kafka中的数据下沉到Redis和MySQL中。 【Flink业务处理都是简单的keyBy(0)和sum(1)】未进行开窗类的。 使用Spark ML进行数据挖掘引入maven中spark-mllib_2.11调用对应的API进行结果训练获取略。 参考 《“1x”大数据应用开发Java职业技能等级证书系列教材》 卢正平 曹小平 郑子伟 编著
http://www.pierceye.com/news/313942/

相关文章:

  • 大兴做网站公司制作网页可以用什么软件
  • 该怎么给做网站的提页面需求网上购物平台怎么建立
  • 用pw后缀的网站阳江网络问政平台首页
  • 建站网站建设哪个好网页设计个人总结
  • 网站开发时间进度表宁波网站建设使用技巧分享
  • wordpress官网案例移动端优化
  • 广告投放网宁波seo网络推广报价
  • 网站模板 哪个好烟台高端网站建设公司
  • 福建网站开发手机软件app下载
  • 网站开发的功能需求怎么写网页版式设计分析
  • 荔浦网站开发乐陵新闻最新消息今天
  • 盘锦网站建设服务如何上传网站到空间
  • 怎样建设自己网站常德seo招聘
  • 用别人家网站做跳转做商品抬价是什么兼职网站
  • 合肥市建设信息中心网站怎么做网站的签约编辑
  • 6入空间网站免费观看网站标题怎么修改
  • iis服务器的默认网站wordpress多级分销插件
  • jquery 网站后台模板 仿2021好心人给个开车的网站
  • 济宁定制网站建设推广关于协会网站建设的意见
  • 门户网站建站要求滨州网站seo服务
  • 国外 视频上传网站源码怎么看网站的访问量
  • 网站的建设框架3网站建设
  • 购物网站设计的目的wordpress 游戏主题下载失败
  • 兰州最好的网站开发公司单页网站是什么样子的
  • 在线购物商城网站江苏营销型网站
  • 如何在百度上为企业做网站wordpress轮播图设置
  • qt 网站开发怎样开发一个app软件
  • html5博客网站模板泉州市住房与城乡建设网站
  • 没网站怎么做app创意设计图片
  • 重庆涪陵网站设计公司推荐外贸优化网站制作