当前位置: 首页 > news >正文

基本网站怎么做网站开发站点的文件夹

基本网站怎么做,网站开发站点的文件夹,wordpress技术cms主题,做蛋糕网站目录 ElasticSearch聚合操作 基本语法 聚合的分类 后续示例数据 Metric Aggregation Bucket Aggregation ES聚合分析不精准原因分析 提高聚合精确度 ElasticSearch聚合操作 Elasticsearch除搜索以外#xff0c;提供了针对ES 数据进行统计分析的功能。聚合(aggregation…目录 ElasticSearch聚合操作 基本语法 聚合的分类 后续示例数据 Metric Aggregation Bucket Aggregation ES聚合分析不精准原因分析 提高聚合精确度 ElasticSearch聚合操作 Elasticsearch除搜索以外提供了针对ES 数据进行统计分析的功能。聚合(aggregations)可以让我们极其方便的实现对数据的统计、分析、运算。例如 什么品牌的手机最受欢迎 这些手机的平均价格、最高价格、最低价格 这些手机每月的销售情况如何 基本语法 聚合查询的语法结构与其他查询相似通常包含以下部分 查询条件指定需要聚合的文档可以使用标准的 Elasticsearch 查询语法如 term、match、range 等等。 聚合函数指定要执行的聚合操作如 sum、avg、min、max、terms、date_histogram 等等。每个聚合命令都会生成一个聚合结果。 聚合嵌套聚合命令可以嵌套以便更细粒度地分析数据。 GET index_name/_search {aggs: {aggs_name: { // 聚合名称需要自己定义agg_type: {field: field_name}}} } aggs_name聚合函数的名称 agg_type聚合种类比如是桶聚合terms或者是指标聚合avg、sum、min、max等 field_name字段名称或者叫域名。 聚合的分类 Metric Aggregation—些数学运算可以对文档字段进行统计分析类比Mysql中的 min(), max(), sum() 操作。 SELECT MIN(price), MAX(price) FROM products #Metric聚合的DSL类比实现 {aggs:{avg_price:{avg:{field:price}}} } Bucket Aggregation 一些满足特定条件的文档的集合放置到一个桶里每一个桶关联一个key类比Mysql中的group by操作。 SELECT size COUNT(*) FROM products GROUP BY size #bucket聚合的DSL类比实现 {aggs: {by_size: {terms: {field: size}} } 后续示例数据 DELETE /employees #创建索引库 PUT /employees {mappings: {properties: {age:{type: integer},gender:{type: keyword},job:{type : text,fields : {keyword : {type : keyword,ignore_above : 50}}},name:{type: keyword},salary:{type: integer}}} }PUT /employees/_bulk { index : { _id : 1 } } { name : Emma,age:32,job:Product Manager,gender:female,salary:35000 } { index : { _id : 2 } } { name : Underwood,age:41,job:Dev Manager,gender:male,salary: 50000} { index : { _id : 3 } } { name : Tran,age:25,job:Web Designer,gender:male,salary:18000 } { index : { _id : 4 } } { name : Rivera,age:26,job:Web Designer,gender:female,salary: 22000} { index : { _id : 5 } } { name : Rose,age:25,job:QA,gender:female,salary:18000 } { index : { _id : 6 } } { name : Lucy,age:31,job:QA,gender:female,salary: 25000} { index : { _id : 7 } } { name : Byrd,age:27,job:QA,gender:male,salary:20000 } { index : { _id : 8 } } { name : Foster,age:27,job:Java Programmer,gender:male,salary: 20000} { index : { _id : 9 } } { name : Gregory,age:32,job:Java Programmer,gender:male,salary:22000 } { index : { _id : 10 } } { name : Bryant,age:20,job:Java Programmer,gender:male,salary: 9000} { index : { _id : 11 } } { name : Jenny,age:36,job:Java Programmer,gender:female,salary:38000 } { index : { _id : 12 } } { name : Mcdonald,age:31,job:Java Programmer,gender:male,salary: 32000} { index : { _id : 13 } } { name : Jonthna,age:30,job:Java Programmer,gender:female,salary:30000 } { index : { _id : 14 } } { name : Marshall,age:32,job:Javascript Programmer,gender:male,salary: 25000} { index : { _id : 15 } } { name : King,age:33,job:Java Programmer,gender:male,salary:28000 } { index : { _id : 16 } } { name : Mccarthy,age:21,job:Javascript Programmer,gender:male,salary: 16000} { index : { _id : 17 } } { name : Goodwin,age:25,job:Javascript Programmer,gender:male,salary: 16000} { index : { _id : 18 } } { name : Catherine,age:29,job:Javascript Programmer,gender:female,salary: 20000} { index : { _id : 19 } } { name : Boone,age:30,job:DBA,gender:male,salary: 30000} { index : { _id : 20 } } { name : Kathy,age:29,job:DBA,gender:female,salary: 20000} Metric Aggregation 单值分析︰只输出一个分析结果min, max, avg, sum等 多值分析:输出多个分析结果stats统计, extended stats等 查询员工的最低最高和平均工资 #多个 Metric 聚合找到最低最高和平均工资 POST /employees/_search {size: 0, aggs: {max_salary: {max: {field: salary}},min_salary: {min: {field: salary}},avg_salary: {avg: {field: salary}}} } 对salary进行统计 # 一个聚合输出多值 POST /employees/_search {size: 0,aggs: {stats_salary: {stats: {field:salary}}} } cardinate对搜索结果去重 POST /employees/_search {size: 0,aggs: {cardinate: {cardinality: {field: job.keyword}}} } Bucket Aggregation 按照一定的规则将文档分配到不同的桶中从而达到分类的目的。ES提供的一些常见的 Bucket Aggregation。 Terms需要字段支持filedata如果是keyword 默认支持fielddata如果是text需要在Mapping 中开启fielddata会按照分词后的结果进行分桶。 数字类型支持Range / Data Range、Histogram直方图 / Date Histogram。 支持嵌套: 也就在桶里再做分桶。 获取job的分类信息 # 对keword 进行聚合 GET /employees/_search {size: 0,aggs: {jobs: {terms: {field:job.keyword}}} } 聚合可配置属性有 field指定聚合字段。 size指定聚合结果数量。 order指定聚合结果排序方式。 默认情况下Bucket聚合会统计Bucket内的文档数量记为_count并且按照_count降序排序。我们可以指定order属性自定义聚合的排序方式 GET /employees/_search {size: 0,aggs: {jobs: {terms: {field:job.keyword,size: 10,order: {_count: desc }}}} } 限定聚合范围 #只对salary在10000元以上的文档聚合 GET /employees/_search {query: {range: {salary: {gte: 10000 }}}, size: 0,aggs: {jobs: {terms: {field:job.keyword,size: 10,order: {_count: desc }}}} } ES聚合分析不精准原因分析 ElasticSearch在对海量数据进行聚合分析的时候会损失搜索的精准度来满足实时性的需求。 Terms聚合分析的执行流程 不精准的原因 数据分散到多个分片聚合是每个分片的取 Top X导致结果不精准。ES 可以不每个分片Top X而是全量聚合但这会有很大的性能问题。 提高聚合精确度 方案1设置主分片为1 注意7.x版本已经默认为1。 适用场景数据量小的小集群规模业务场景。 方案2调大 shard_size 值 设置 shard_size 为比较大的值官方推荐size*1.510。shard_size 值越大结果越趋近于精准聚合结果值。此外还可以通过show_term_doc_count_error参数显示最差情况下的错误值用于辅助确定 shard_size 大小。 size是聚合结果的返回值客户期望返回聚合排名前三size值就是 3。shard_size: 每个分片上聚合的数据条数。shard_size 原则上要大于等于 size 适用场景数据量大、分片数多的集群业务场景。 方案3使用Clickhouse/ Spark 进行精准聚合 适用场景数据量非常大、聚合精度要求高、响应速度快的业务场景。
http://www.pierceye.com/news/980238/

相关文章:

  • 手机网站用二级目录做的弊端四川建设人员数据网站
  • 做网站什么类型好数据分析师培训需要多少钱
  • 建html5网站合作网站开发
  • 南通网站推广优化公司网站语言切换功能如何做
  • php网站开发案例论文临沂网站建设中企动力
  • 霸州做网站1766534168WordPress全局屏蔽谷歌
  • 织梦做的网站被黑了北京互联网排名
  • 专业seo整站优化专业建站教程
  • 网站建设合同注意点什么网站可以接设计方案
  • 青岛建设公司网站费用建网站的流程和费用
  • 徐州cms模板建站液压电机东莞网站建设
  • 阿里巴巴国际站运营工作内容北京软件开发公司排行榜最新
  • 电子商务网站的开发流程包括泉州seo建站
  • 微信h5商城网站开发米拓模板网站建设
  • 品牌网站设计案例wordpress 实例
  • 郑州大学科技园手机网站建设wordpress 新手指南
  • 国外免费建站网站搭建南阳网站排名优化报价
  • 中国排名高的购物网站免费软件下载网站有哪些
  • 云服务器做视频网站石家庄软件定制开发
  • 好的外贸网站的特征如何快速的制作h5页面
  • 徐州建站程序南京制作网页培训学校
  • 广州市服务好的网站制作排名北京网站建设公司哪个最好
  • 网站调用谷歌地图灌云网站制作
  • 做的网站能撤掉吗济南好的网站建设公司排名
  • 北京智能建站系统价格江西省住房建设厅统计网站
  • 中山建设网站官网郑州做网站排名公司
  • 怎么把自己做的网站放到百度上网页该如何推广
  • 军事网站大全军事网金蝶软件公司官网
  • 哪些网站用c 做的南宁有做门户网站的公司吗
  • 濮阳网站建设陈帅wordpress 调用用户头像