当前位置: 首页 > news >正文

漳州网站建设企业苗木推广做哪个网站好

漳州网站建设企业,苗木推广做哪个网站好,深圳市住房和建设局工程交易网,ppt设计兼职现在是北京时间2023年11月18日。聊一聊搜索。 说到搜索#xff0c;大家首先想到的肯定是谷歌#xff0c;百度。我把这些定义成上一个时代的搜索引擎。ChatGPT已经火热了有一年的时间了#xff0c;大家都认为Ai搜索是下一代的搜索。但是AI搜索#xff0c;需要的是很大算力大家首先想到的肯定是谷歌百度。我把这些定义成上一个时代的搜索引擎。ChatGPT已经火热了有一年的时间了大家都认为Ai搜索是下一代的搜索。但是AI搜索需要的是很大算力需要很大存储空间。至今为止又有多少个公司能够真的去做AI搜索呢普通的公司又能够做什么呢 ChatGPT是大模型它的数据总是停留在历史的某个时间点上目前来看它对新事物的了解还是很慢的并不能时时刻刻把新的内容加入到知识库中。未来在更强大的算力进步下或许会实现。但是我觉得下一代的搜索仍然需要和上一代的搜索结合。这会是一个漫长的过渡期。很显然大家也都是这么玩的。它叫做搜索增强。 上一代传统搜索 上一代的搜索引擎的关键是关键词匹配。这里还是以elasticsearch为例关键词匹配BM25相关性算法来决定数据的召回。这种基于关键词的匹配技术是存在很多弊端的它的召回能力效果也有限。大家更喜欢AI搜索这种模式通常AI搜索给的答案更接近问题本身。而在传统的搜索模式下通常就是问一个问题然后返回你几条数据然后再在这几条数据中人工获取答案。悲伤的是这几条数据里边未必有我们的结果。 传统搜索与大模型构造增强式搜索引擎 最简单的玩法就是把召回的结果给大模型然后由大模型总结整理一个答案。其实这个过程就是省去了使用者思考的过程。为使用者带来很大的便利性。这正是被更多人追捧的原因。最典型的就是bing的搜索。它就是这么玩的这样以来弥补了大模型的知识停留在历史的某个阶段的问题。 传统搜索的未来 除了上述的搜索增强我觉得下个时代的搜索还是会有很大变化空间的。有的公司在说神经搜索有的人在说语义检索还有人在说跨模态检索。总之大家都期望搜索能够有更强大的能力。推荐基于深度学习的神经语义搜索 - 智源社区 看看这篇文章详细了解神经搜索NLP模型 。 其实上述的搜索目标实现起来都是一种形式。大模型 向量通过大模型将各种模态的数据图片文本声音等等各种形式的内容映射成向量。但是下个时代的到来还有几个问题等待解决。第一个是算力问题把文本或者图片使用大模型转成向量需要算力这个过程是非常慢的。第二个是存储和检索问题这些转完的向量如何存储如何高效快速检索。因为通常文本内容例如一篇文章通常需要先进行分割按照行或者按照段落做切分然后再对切分后的内容使用模型转成向量。每个向量通常是一个512维度甚至更高维度的浮点型数组。这让原本的存储空间变得更大。所以存储是一个问题。除了存储的问题在向量中做检索通常是计算完成的。在海量数据中做检索已经很难了在限量中做计算需要的算力资源又是一个难题。我在一台128G内存96核心的服务器上使用elasticsearch做存储和检索亿级数据的检索性能已经是一个比较大的问题了。在千万级向量中检索是毫秒级别。 未来的搜索如何玩 想要做起来很容易。选取适合自己的模型可以在huggingFace上看一看。https://huggingface.co/models 首先先拿文本来说需要做文本嵌入寻找text-vex的模型这里推荐一个 可以看看。https://huggingface.co/moka-ai/m3e-base 假如想做多模态搜索又需要特定的模型。效果较好的例如Cliphttps://huggingface.co/openai/clip-vit-base-patch32  然后把转好的向量使用向量库存起来。这里我是用的elasticsearch 8.X版本。因为我本来就是做es搜索的对elasticsearch非常熟悉。其实也调研了非常多的向量数据库在大规模数据下es的读写性能都是非常出色的。至少单个节点去解决千万级别的向量数据的存储和检索还是很轻松的优化万了以后性能在毫秒级别。 跑起来总是很容易。想要有更好的效果却是不容易的。对于选模型来说是一个问题而且要经过大量的测试对比各个模型的效果才行。并且非常可能面临着模型不符合自己的使用场景的问题可能又要对模型进行微调。在huggingFace上模型非常多但是多数都是用英文语料训练的模型。往往不能够满足我们的需求。此外数据向量化的工程问题又要去写挺多的代码跑起来速度又不行又需要进行调优。关于数据转向量工程化的内容推荐一下Jina AI · GitHub。
http://www.pierceye.com/news/388760/

相关文章:

  • 重庆网站建设 熊掌号wordpress 被发文章
  • 网站建设管理视频广东省农业农村厅班子
  • 网站建设需要钱吗开发一个小程序流程
  • 通州富阳网站建设做足彩网站推广
  • 一个公司做网站需要注意什么条件车之家汽车官网
  • 石家庄网站建设网站建设网站的制作哪家好
  • 苏州晶体公司网站网站排名优化各公司的
  • 网站开发大致多少钱团队拓展训练
  • p2p网站建设方案卫龙模仿iphone做网站
  • 做盗版电影网站犯法吗Wordpress 淘宝客 页面
  • 自己做网站费用html5结构的网站
  • wordpress做资源分享站做网站的图哪来
  • 国外设计欣赏网站线上建模培训班哪个好
  • 微信网站建设合同怎么在本地搭建网站
  • 班级网站怎么做网页制作临沂网站制作方案
  • 泰州网站建设服务好wordpress调用分类名
  • 中英切换的网站咋做怎样在网站做推广
  • 初学网站开发书籍如何提升网站打开速度
  • 深圳微信网站建设公司哪家好网站 维护 页面
  • 做个企业网站需要多少钱北京西站到大兴机场
  • 数字博物馆网站建设动态设计是什么意思
  • 沧州市做网站价格wordpress构建自己的网站
  • seo外链网站源码新公司注册核名
  • 游戏网站建设的策划方案python做电子商务网站
  • pxhere素材网站网上搞钱的野路子
  • 有没有帮人做数学题的网站9377游戏盒子
  • 微信网站建设报价网站优化提升排名
  • wap网站分享代码自定义网站建设
  • 网站换域名了怎么办seo百度帐号注册
  • 淄博网站建设公司羊肉片机网站模板制作