腾讯云快速建站,wordpress虚拟主机如何安装,赣州公司做网站,管局备案网站LLM幻觉缓减技术分为两大主流#xff0c;梯度方法和非梯度方法。梯度方法是指对基本LLM进行微调#xff1b;而非梯度方法主要是在推理时使用Prompt工程技术。LLM幻觉缓减技术#xff0c;如下图所示#xff1a; LLM幻觉缓减技术值得注意的是#xff1a;
检索增强生成… LLM幻觉缓减技术分为两大主流梯度方法和非梯度方法。梯度方法是指对基本LLM进行微调而非梯度方法主要是在推理时使用Prompt工程技术。LLM幻觉缓减技术如下图所示 LLM幻觉缓减技术值得注意的是
检索增强生成RAG知识检索https://arxiv.org/abs/2307.03987CoNLIhttps://arxiv.org/abs/2310.03951CoVehttps://cobusgreyling.medium.com/chain-of-verification-reduces-hallucination-in-llms-20af5ea67672 与专注于有限任务的传统人工智能系统不同LLM在训练过程中使用了大量的在线文本数据。当大模型语言生成功能应用在要求严格的应用程序时LLM幻觉就变得非常令人担忧例如 总结医疗记录 客户支持对话; 财务分析报告并提供错误的法律建议。
一、幻觉缓解分类法 这项研究对LLM幻觉缓解技术进行了总结分类为梯度方法和非梯度方法。
梯度方法包括复杂和不透明的解码策略、知识图谱、微调策略等。
非梯度方法包括RAG、自我优化和Prompt微调。
值得注意的是RAG方法分为四个部分
生成之前生成期间生成后端到端
Prompt工程缓解幻觉的原理在于定义
特殊上下文预期输出
二、最佳预防幻觉
预防幻觉的最佳方法不是单一的方法需要综合多种方法。
缓减幻觉需要考虑以下因素 在多大程度上依赖标签数据 引入无监督或弱监督学习技术以提高可扩展性和灵活性的可能性是什么 考虑梯度和非梯度方法以产生连贯和上下文相关的信息。 收集到的缓解幻觉的工作揭示了一系列不同的策略每种策略都有助于解决LLM中幻觉的细微差别。 通过反馈和推理的自我完善会产生有影响力的策略。 结构化比较推理引入了一种结构化的文本偏好预测方法增强了连贯性减少了幻觉。 监督微调可以通过知识注入和师生方法进行探索。 特定领域的知识被注入到较弱的LLM和使用反事实数据集来提高真实性的方法中。
参考文献
[1] https://cobusgreyling.medium.com/large-language-model-hallucination-mitigation-techniques-a75b6f873318