当前位置: 首页 > news >正文

移动端网站制作案例德州宁津建设局网站

移动端网站制作案例,德州宁津建设局网站,建设网站行业云,店铺的网站怎么做吾名爱妃#xff0c;性好静亦好动。好编程#xff0c;常沉浸于代码之世界#xff0c;思维纵横#xff0c;力求逻辑之严密#xff0c;算法之精妙。亦爱篮球#xff0c;驰骋球场#xff0c;尽享挥洒汗水之乐。且喜跑步#xff0c;尤钟马拉松#xff0c;长途奔袭#xf… 吾名爱妃性好静亦好动。好编程常沉浸于代码之世界思维纵横力求逻辑之严密算法之精妙。亦爱篮球驰骋球场尽享挥洒汗水之乐。且喜跑步尤钟马拉松长途奔袭考验耐力与毅力每有所进心甚喜之。   吾以为编程似布阵算法如谋略需精心筹谋方可成就佳作。篮球乃团队之艺协作共进方显力量。跑步与马拉松乃磨炼身心之途愈挫愈勇方能达至远方。愿交志同道合之友共探此诸般妙趣。 诸君此文尚佳望点赞收藏谢之 这篇文章主要探讨在LangChain框架中连接外部的数据做数据增强的能力。我们的生活周围充斥着各种各样的数据例如本地的文档、网页上的知识、企业内部的知识库、各类研究报告、软件数据库以及聊天的历史记录等。这些数据无论是广泛的互联网数据还是具有特定价值的其他内部数据都是构建和优化大语言模型的重要资源。 数据增强模块的相关概念 你可能会问既然已经有了强大的大语言模型例如OpenAI的GPT-4为什么还需要连接外部数据呢原因其实很简单那就是大语言模型的知识是有限的。以GPT-4为例它的数据集只训练到2023年4月也就是说这个时间之后的数据并没有被模型学习和理解。所以到2023年下半年仍会看到ChatGPT在其界面上显示ChatGPT可能会产生关于人、时间、地点或事件不准确的信息。这是因为模型在训练数据集之外的知识领域中其预测能力是受限的。 除此之外还需要个性化的知识比如企业的内部知识。想象一下如果你有一个企业你可能希望你的聊天机器人能够理解和回答一些关于你的产品或服务的具体问题这些问题的答案往往需要依赖你的企业内部的专有知识。大语言模型无法直接访问这些知识因此需要将这些知识以某种方式连接到大语言模型。 连接外部数据不仅可以填补大语言模型的知识缺失而且还能让开发的应用程序更加可靠。当模型需要回答一个问题时它可以根据真实的外部数据进行回答而不是仅仅依赖于它在训练时学习的知识。例如当询问模型“2023年的新冠病毒疫苗有哪些副作用”时模型可以根据最近的医学研究报告来提供答案而不是依赖于它在两年前学习的可能已经过时的知识进行回答。 这些大语言模型不仅需要连接外部的数据填补缺失的知识同时还收到了提示词的限制因为构建好的提示词往往需要外部数据的加持。但是这种提示词的字符数量是有限的这就是我们通常所说的max tokens的概念。 为了解决大语言模型的这些限制问题LangChain设计了数据增强模块。设计这个模块的目的是检索与用户输入的问题相关的外部数据包括筛选相关问题的相关的文档。然后这些相关数据会形成提示词模板提交给LLM或Chat Model类型的模型包装器。这些模型包装器封装了各个大语言模型平台的底层API使得我们可以方便的与这些平台进行交互获取大语言模型平台的输出。 然而加载了这些外部的文档数据后我们经常希望对它们进行转换以更好的适应应用程序。最简单的例子是将一个长文档切割成多个较小的文档避免文档长度超过max tokens限制。为了实现这一目标LangChain框架提供了一系列内置的文档转换器这些文档转换器可以对文档进行切割、组合、过滤等。 LEDVR工作流 数据增强模块是一个多功能的数据增强集成工具我们可以方便地称作LEDVR。其中L表示加载器Loader、E代表嵌入模型包装器Text Embedding Model、D代表文档转换器Document Transformers、V表示向量数据库VectorStore、R表示检索器Retriever。 加载器 加载器负责从各种来源加载数据作为文档其中文档是由文本和相关元数据组成的。无论是简单的txt文档还是任意网页文本内容加载器都可以将他们加载为文档。 嵌入模型包装器 嵌入模型包装器是一个专门为各种文本嵌入模型交互而设计的类。它的作用与LLM模型包装器和聊天模型包装器一样。 文档转换器  文档转换器主要用来对文档进行切割、组合、过滤等各种转换。数据增强模块提供了一系列内置的文档转换器。最常见的文档转换是切割文档例如将大型文档切割为小片段文档。文本切割器是最常见的文档转换器工具。文档转换器的目的是将加载的文档转换为可被嵌入模型包装器操作的文档数据格式。 向量数据库 向量数据库是用于存储和检索嵌入向量的工具处理的数据是通过模型平台的文本嵌入模型Text Embedding Model转换的向量数据这是处理非结构化数据的一种常见方法。向量数据库负责存储嵌入数据并执行向量检索。在建索时可以嵌入非结构化查询以建索与嵌入数据最相似的嵌入向量。 检索器  检索器是一个接口返回非结构化查询的文档。它比向量存储库更通用。检索器无需存储文档只需要返回检索后的文档。
http://www.pierceye.com/news/614299/

相关文章:

  • 郑州网站建设多少钱wordpress分享获得积分
  • 贵阳网站设计模板建设工程监理招标网站
  • 上海专业的网页设计公司百度推广优化怎么做的
  • 河南城乡建设厅网站wordpress 主题 字体
  • 网站编辑的工作内容深圳网站设计公司有哪些
  • 设计深圳网站制作网站建设及维护招聘
  • 网站开发实训新的体会wordpress防止机器人注册
  • 购买的网站如何换背景自建网站如何被百度收录
  • 国外外贸网站手机销售网站制作
  • 海外永久网站众车网是哪家公司网站
  • 上海 网站开发 兼职布吉建设网站
  • 做网站资金来源是什么wordpress模版sns
  • 聊城wap网站建设如何分析网站竞争对手
  • 卓业网站建设flash 网站 收费
  • 两学一做 答题 网站自己做网站买东西
  • 深圳哪家公司做网站好购物网站开发问题域分析
  • 简单个人网站wordpress插件查询
  • 上海做网站搜索一下马来西亚的网站建设的竞争对手的分析
  • 建站优化易下拉系统163邮箱登录注册
  • c 做网站电子商务平台中搜索词拆解包括
  • 腾讯云10g数字盘做网站够么四川省建设人才网
  • 批量 网站标题中海园林建设有限公司网站
  • 鲜花网站数据库建设免费律师咨询
  • 团队网站建设哪家便宜制作公司网站流程
  • 青龙桥网站建设企业网页是什么
  • 上海网站建设备案号怎么恢复法律咨询网站开发
  • 烟台做网站价格动力网站建设
  • 北戴河网站建设墨刀制作网页教程
  • 成都网站设计开发做得好微信商城怎么开发
  • 江西省城乡建设培训网-官方网站上海建设集团有限公司