当前位置: 首页 > news >正文

深圳市建设局网站网站控制面板地址

深圳市建设局网站,网站控制面板地址,国家军事网,个人主页的html设计省流:优先选择WeightedRanker 以rag为例,优先选择bm25全文检索,其次选择向量检索 Milvus混合搜索中的重排机制 Milvus通过hybrid_search() API启用混合搜索功能#xff0c;结合复杂的重排策略来优化多个AnnSearchRequest实例的搜索结果。本主题涵盖了重排过程#xff0c;…省流:优先选择WeightedRanker  以rag为例,优先选择bm25全文检索,其次选择向量检索 Milvus混合搜索中的重排机制 Milvus通过hybrid_search() API启用混合搜索功能结合复杂的重排策略来优化多个AnnSearchRequest实例的搜索结果。本主题涵盖了重排过程解释其重要性以及Milvus中不同重排策略的实现。 概述 下图说明了Milvus中混合搜索的执行过程并强调了重排在这一过程中的作用。 混合搜索中的重排是一个关键步骤它整合了来自多个向量字段的结果确保最终输出具有相关性并准确排序。目前Milvus提供以下重排策略 WeightedRanker这种方法通过计算不同向量搜索得分或向量距离的加权平均值来合并结果。它根据每个向量字段的重要性分配权重。 RRFRanker这种策略基于不同向量列中的排名来合并结果。 加权评分 (WeightedRanker) WeightedRanker策略根据每个向量字段的重要性为每个向量检索路径的结果分配不同权重。当不同向量字段的重要性各不相同时应用此重排策略允许通过分配更高的权重来强调某些向量字段。例如在多模态搜索中文本描述可能比图像中的颜色分布更为重要。 WeightedRanker的基本过程如下 检索期间收集分数从不同的向量检索路径收集结果及其分数。 分数归一化将每个路径的分数归一化到[0,1]范围内其中接近1的值表示更高的相关性。由于不同度量类型的分数分布不同这种归一化非常重要。例如IP的距离范围是[-∞,∞]而L2的距离范围是[0,∞]。Milvus使用arctan函数将值转换到[0,1]范围内为不同的度量类型提供标准化基础。 权重分配为每个向量检索路径分配权重w。用户指定权重这些权重反映了数据源的可靠性、准确性或其他相关指标。每个权重范围为[0,1]。 分数融合计算归一化分数的加权平均值以得出最终分数。然后根据这些从高到低的分数对结果进行排序生成最终排序结果。 要使用此策略应用WeightedRanker实例并通过传入多个数值参数来设置权重值。 from pymilvus import WeightedRanker ​ # 使用WeightedRanker以指定权重组合结果 rerank WeightedRanker(0.8, 0.8, 0.7) 请注意 每个权重值范围从0最不重要到1最重要影响最终的聚合分数。 在WeightedRanker中提供的权重值总数应等于您之前创建的AnnSearchRequest实例的数量。 值得注意的是由于不同度量类型的测量方式不同我们将召回结果的距离归一化使其位于[0,1]区间内其中0表示不同1表示相似。最终分数将是权重值和距离的总和。 倒数排名融合 (RRFRanker) RRF是一种数据融合方法它基于排名的倒数来合并排名列表。当没有明确的重要性优先级时这是平衡每个向量字段影响的有效方法。当您希望对所有向量字段给予同等考虑或者当对每个字段的相对重要性存在不确定性时通常使用这种策略。 RRF的基本过程如下 检索期间收集排名多个向量字段的检索器检索并排序结果。 排名融合RRF算法对每个检索器的排名进行加权和合并。公式如下 这里表示不同检索路径的数量rank()是由第个检索器检索到的文档的排名位置是平滑参数通常设置为60。 综合排名基于组合分数对检索到的结果进行重新排序以生成最终结果。 要使用此策略应用RRFRanker实例。 from pymilvus import RRFRanker ​ # 默认k值为60 ranker RRFRanker() ​ # 或指定k值 ranker RRFRanker(k100) RRF允许在不指定明确权重的情况下平衡各字段的影响。多个字段一致认可的顶级匹配项将在最终排名中优先考虑。 总结与建议 总结 Milvus混合搜索通过重排策略优化多向量检索的结果提高搜索质量 目前支持两种主要重排策略加权评分(WeightedRanker)和倒数排名融合(RRFRanker) WeightedRanker适用于明确知道各向量字段重要性的场景允许用户手动设置权重 RRFRanker适用于各向量字段重要性相近或不确定的场景无需手动设置具体权重 建议 对于多模态搜索如图像文本如果知道某一模态更重要建议使用WeightedRanker 当不确定各向量字段相对重要性时RRFRanker是更简单、更稳健的选择 使用WeightedRanker时建议进行权重调优实验找到最适合应用场景的权重组合 对于高精确度要求的应用可考虑结合两种重排策略或自定义重排逻辑 记得考虑不同度量类型如IP、L2等的分数分布差异理解Milvus的归一化处理机制
http://www.pierceye.com/news/270001/

相关文章:

  • 大学生网站开发目的建盏厂家
  • 开业时网站可以做哪些活动吗虚拟机安装 wordpress
  • 可以进行网站外链建设的有wordpress 添加顶部公告
  • 电子商务网站建设臧良运课后答案没有网站怎么做链接视频
  • vps搭建网站教程怎么通过互联网做一个服务的网站
  • 建设网站需要从哪方面考虑微信云开发
  • 做环评工作的常用网站大学两学一做专题网站
  • 网站设计的公司如何选seo 优化教程
  • 济南网站中企动力河南网站建设服务
  • 网站建设的定位是什么意思php网站开发实例视频
  • 做资讯类网站需要特殊资质吗宜昌网站排名优化
  • 百度怎么建立自己的网站科技公司网站设计公司
  • 长沙做网站的包吃包住4000网站图片如何做水印
  • wordpress的固定链接怎么设置包头整站优化
  • 瓯海建设网站中国建设劳动协会网站
  • 烟台专业做网站公司有哪些中企动力重庆分公司
  • iis 怎么绑定网站二级目录广东东莞市
  • 运城网站制作公司成crm软件
  • 阿里云网站备案登陆荆州网站开发
  • 06628 网页制作与网站建设深圳建筑人才网为什么电脑打不开
  • 企业网站建设方讯快速建站代理
  • 全面的基础微网站开发wordpress首页插件
  • 陕西省住房和城乡建设厅网站上怎么打印证书中盛客户管理软件
  • html网站标题怎么做的国外免费推广平台有哪些
  • 网站制作com cn域名有什么区别网站制作哪家好
  • 平湖网站设计北京广告公司名录
  • 不良网站进入窗口免费正能量安全的南昌网站制作
  • 商品交换电子商务网站开发网站首页制作公司
  • wordpress全站备份建设网站和推广
  • 广州市官网网站建设哪家好上海营销型网站建设公司