网站维护电话,如何选择网站开发语言,注册安全工程师难吗,个人网站 商城 备案目录 IntroductionLLM的限制扩展理解#xff1a;什么是机器学习扩展阅读#xff1a;机器学习的流程 LangChain Introduction
LLM的限制 大型语言模型#xff0c;比如ChatGpt4#xff0c;尽管已经非常强大#xff0c;但是仍然存在一些限制#xff1a;
知识更新#xff… 目录 IntroductionLLM的限制扩展理解什么是机器学习扩展阅读机器学习的流程 LangChain Introduction
LLM的限制 大型语言模型比如ChatGpt4尽管已经非常强大但是仍然存在一些限制
知识更新LLM的知识是基于训练数据的者意味着一旦训练完毕模型的知识就固定下来不能再进行更新。理解深度虽然LLM可以生成准确的、上下文相关的文本但它们并不能理解这些文本的深层含义知识基于它们在大量文本数据上的训练来模仿人类的语言。事实准确性LLM可能会生成一些事实上不准确的信息因为它们的目标是预测下一个词是什么而不是确保生成的所有信息都是准确的。偏见和公平性问题LLM可能会反映出其训练数据中的偏见。例如某红书的模型可以归纳总结一些旅游、美食攻略但有时候由于某些用户的思想特殊性也会出现一些*拳言论微博同理。X中文区的数据则更离谱容易出现一些触犯“底线”的言论。生成恶意内容的风险LLM可以被用来生成深度伪造内容如windows激活码或者恶意信息如钓鱼邮件从而被用于网络攻击、欺诈或者误导信息的传播。
扩展理解什么是机器学习
举一个小例子我以前特别喜欢玩一款叫作《梦幻西游》的游戏。弃坑之后游戏方的客服经理总给我打电话说 “Y哥能不能回来接着玩耍充值呀帮派的小伙伴都十分想念你……”。这时候我就想他们为什么会给我打电话呢这款游戏每天都有用户流失不可能给每个用户都打电话吧那么肯定是挑重点用户来沟通了。 其后台肯定有玩家的各种数据例如游戏时长、充值金额、战斗力等通过这些数据就可以建立一个模型 用来预测哪些用户最有可能返回来接着玩充钱
机器学习要做的就是在数据中学习有价值的信息例如先给计算机一堆数据告诉它这些玩家都是重点客户让计算机去学习一下这些重点客户的特点以便之后在海量数据中能快速将它们识别出来。
机器学习能做的远不止这些数据分析、图像识别、数据挖掘、自然语言处理、语音识别等都是以其为 基础的也可以说人工智能的各种应用都需要机器学习来支撑。现在各大公司越来越注重数据的价值人工成本也是越来越高所以机器学习也就变得不可或缺了。AI First —— Data First 扩展阅读机器学习的流程
假设我们从网络上收集了很多新闻有的是体育类新闻有的是非 体育类新闻现在需要让机器准确地识别出新闻的类型。
一般来说机器学习流程大致分为以下几步。 数据收集与预处理。例如新闻中会掺杂很多特殊字符和广告等无关因素要先把这些剔除掉。除此之外可能还会用到对文章进行分词、提取关键词等操作。 特征工程也叫作特征抽取。例如有一段新闻描述科比牢大职业生涯画上圆满句号今天正式退役了”。显然这是一篇与体育相关的新闻但是计算机可不认识牢大所以还需要将人能读懂的字符转换成计算机能识别的数值。这一步看起来容易做起来就非常难了如何构造合适的输入特征也是机器学习中非常重要的一部分。 模型构建。这一步只要训练一个分类器即可当然建模过程中还会涉及很多调参工作随便建立一个差不多的模型很容易但是想要将模型做得完美还需要大量的实验。 评估与预测。最后模型构建完成就可以进行判断预测一篇文章经过预处理再被传入模型中 机器就会告诉我们按照它所学数据得出的是什么结果。 LangChain
综上所述LangChain就是帮助我们引导、规范AI完成一系列复杂的应用任务以及通过工具整合来填补LLM各种缺陷的一个框架
比如知识准确性不够就可以接入搜索引擎或新闻站点或知识百科以获取最新资讯 比如理解的深度不够就提供一个思维链Chain一步一步引导AI完成整个思维过程的推导Agent