弄一个电影网站怎么做,如何建立公司企业网站,做网站公,树莓派做网站引言#xff1a;电商推荐系统的新突破
随着电子商务平台的蓬勃发展#xff0c;推荐系统已成为帮助用户在信息过载时代中筛选和发现产品的关键工具。然而#xff0c;传统的推荐系统主要依赖历史数据和用户反馈#xff0c;这限制了它们在新商品推出和用户意图转变时的有效性…引言电商推荐系统的新突破
随着电子商务平台的蓬勃发展推荐系统已成为帮助用户在信息过载时代中筛选和发现产品的关键工具。然而传统的推荐系统主要依赖历史数据和用户反馈这限制了它们在新商品推出和用户意图转变时的有效性。为了克服这些挑战研究人员和工程师们一直在探索新的方法来增强推荐系统的性能和适应性。
最近一项新的研究提出了一种结合了大语言模型Large Language Models, LLMs和推荐系统的方法这一方法通过构建一个推理知识图谱Inferential Knowledge Graph使得推荐系统能够更好地理解和预测用户的购买意图。
这项研究的核心在于一个名为LLM-KERecLarge Language Model based Complementary Knowledge Enhanced Recommendation System的系统它通过实体提取器从商品和用户信息中提取统一的概念术语并生成基于实体流行度和特定策略的实体对。大语言模型用于确定每对实体间的互补关系并构建互补知识图谱。此外新的互补回忆模块和实体-实体-商品Entity-Entity-Item, E-E-I权重决策模型通过使用真实的互补曝光-点击样本来细化排名模型的评分。
通过在三个行业数据集上进行广泛的实验结果表明LLM-KERec在性能上显著优于现有方法。此外详细分析显示LLM-KERec通过推荐互补商品来增强用户的消费热情。总而言之LLM-KERec通过整合互补知识并利用大语言模型来捕捉用户意图转变、适应新商品并在不断演变的电商环境中提高推荐效率从而克服了传统推荐系统的局限性。
论文标题: Breaking the Barrier: Utilizing Large Language Models for Industrial Recommendation Systems through an Inferential Knowledge Graph
论文链接:https://arxiv.org/pdf/2402.13750.pdf
LLM-KERec系统大语言模型与推荐系统的结合
1. 传统推荐系统的局限性
传统推荐系统在电子商务网站和在线平台广泛应用以解决信息过载问题。它们的主要目标是从用户过去的行为中推断出用户偏好推荐与用户兴趣相符的最合适的商品。然而这些系统主要依赖历史数据和用户反馈这使得它们难以捕捉用户意图的转变。尤其是在新商品不断涌现的情况下传统系统在冷启动场景中的表现受限难以适应不断变化的电子商务环境。此外用户交互样本的稀疏性导致现有的点击率预测模型在推荐替代品即用户已经点击或购买的商品方面比推荐互补商品即与用户购买的商品相辅相成的商品更有效。
2. LLM-KERec系统的创新构想
为了解决上述挑战提出了一种新颖的基于大语言模型的互补知识增强推荐系统LLM-KERec。该系统结合了传统模型的高效协同信号处理能力与大语言模型和互补图帮助用户快速找到他们偏好的商品。这种方法不仅减少了传统模型推荐结果的同质性还提高了整体点击率和转化率。LLM-KERec通过实体提取器从所有商品和用户账单信息中提取统一的概念术语称为实体然后基于实体的流行度和精心设计的策略生成实体对。大语言模型确定每对实体间的互补关系并构建互补知识图。此外新的互补召回模块和实体-实体-商品E-E-I权重决策模型通过真实的互补曝光-点击样本来优化排名模型的评分以实现互补商品的推荐。
3. LLM-KERec系统的整体框架
LLM-KERec系统的架构包括两个主要部分传统推荐模块和基于LLM的补充知识增强模块下图。 传统推荐模块在传统推荐架构中当用户打开应用程序时系统会自动发送请求到服务器。服务器触发召回模块返回大量候选商品然后通过粗排模型进行筛选最终通过精排模型和重排模型决定商品的展示顺序。这些模型通常使用历史曝光和点击日志进行训练因此现有推荐模型往往倾向于推荐基于用户正面反馈的相似商品。
基于LLM的补充知识增强LLM-KERec系统创建了一个统一的实体类别系统用于用户账单行为和所有商品之间的连接。每个商品或账单都被分类到一个独特的实体中这些实体作为各种内容之间的桥梁。利用世界知识和常识知识系统采用大语言模型来确定两个实体之间是否存在补充关系并构建补充知识图谱。然后使用真实的曝光和点击反馈训练实体-实体-商品E-E-I权重决策模型将知识注入排名模型中以提供个性化的推荐。
实体提取器的设计与作用
1. 实体字典的构建
在现实世界的应用中如支付宝用户的行为跨越多种场景每个场景都有不同的内容。为了将这些多样化的信息和知识统一起来建立了一个统一的关联模式即实体字典。在实体字典中每个实体代表一个特定的概念如“手机”或“可乐”。由专家小组精心设计的实体字典包含了数以万计的实体并且每周定期更新以适应新商品和内容的变化。
2. 从用户行为中提取实体
基于实体字典我们的工作重点转移到了从支付宝中的各种用户行为中提取实体包括账单、访问日志以及营销场景中商品的实体信息。这个提取过程可以看作是一个命名实体识别NER任务该任务在自然语言处理NLP领域已经被广泛研究。为了执行实体提取我们使用了BERT-CRF模型该模型结合了BERT的迁移能力和CRF的结构化预测。BERT-CRF模型使我们能够准确地从支付宝中的用户行为中提取实体下图。在基于大语言模型的互补知识增强中我们的主要目标是建立用户购买行为与推荐商品之间的联系。为此我们从每个用户最近的账单中提取实体形成他们最近的实体交易序列。此外我们还从商品信息中提取实体并为每个商品分配一个独特的实体作为其类别。 构建互补知识图谱
1. 实体对的生成策略
在构建互补知识图谱的过程中首先需要生成实体对。实体对的生成策略是基于实体的流行度和特定策略来确定的。这些策略包括对实体进行排序将它们分为极其流行、流行和不流行的类别并专注于流行实体之间的配对。此外也会构建包含极其流行和不流行实体的配对以确保图谱对不流行项的全面覆盖。通过这种分段组合策略可以在保证下游模块的可靠支持的同时最小化资源浪费。
此外在实际场景中经常会出现少数实体经常被购买而大多数实体很少被消费的长尾分布下图。如果只关注尾部实体组合就很难提高推荐系统的整体性能。 2. 大语言模型在知识图谱中的应用
大语言模型LLM因其在自然语言处理中的出色理解和推理能力而受到研究者的关注。在本研究中我们利用大语言模型来确定实体对中是否存在互补关系。我们使用Claude 21作为底层语言模型并精心设计了可靠的提示prompts来引导模型进行逐步分析并提供可靠的推理证据。通过这种方式我们可以增强推理结果的可解释性并通过手动注释样本来不断完善提示以达到推理结果的可接受准确度。
E-E-I权重决策模型
E-E-I权重决策模型是一个两阶段的互补知识增强过程下图包括排名阶段Ranking Stage和整合阶段Integration Stage。 1. 排名阶段
在E-E-I权重决策模型中我们采用了双塔架构其中两个塔的输出分别代表互补项和账单实体的表示。这两个输出的点积作为偏好级别指标。对于项的表示我们可以从数据库中提取丰富的特征集包括基本特征、统计特征和交互特征等。然而对于实体的表示由于缺乏具体信息来描述它们除了预先分配的ID之外需要使用图神经网络GNN和对比学习来从两个不同的视角——第一顺序可替代视角和第二顺序互补视角——来代表实体。
2. 整合阶段
整合阶段中召回模块通过新增互补召回路径来优化推荐确保不过量召回商品并基于E-E-I模型分数和用户最近购买记录选出最多k个互补商品。在训练精细排名模型时E-E-I模型提供分数和嵌入信息帮助模型更精确地评估商品。这解决了曝光偏差问题使排名模型能更全面地考虑互补商品结合用户行为进行个性化推荐提高了点击率和转化率。
三个工业数据集的测试结果
1. 离线性能比较 在三个工业数据集上图上进行的离线实验结果表明下表LLM-KERec在点击和转化的AUC值上均优于其他基线方法。例如在数据集A上LLM-KERec在点击AUC上达到了0.67284而在转化AUC上达到了0.82507这些结果都显著优于其他基线方法。这些数据集包括了不同的用户群体分布、用户意图和行为从而为系统的性能提供了全面的评估。 2. 在线A/B测试性能
在线A/B测试结果显示LLM-KERec在真实的工业应用场景中取得了显著的性能提升。在Super 567、消费者频道和支付结果页面的三个推荐场景中LLM-KERec分别实现了6.24%、6.45%和10.07%的转化率提升。这些结果证明了LLM-KERec在实际工业推荐场景中的有效性。
通过这些实验我们验证了LLM-KERec系统在处理互补商品推荐时的有效性并展示了其在不同场景下的性能优势。
不同大语言模型的比较
1. ChatGPT、ChatGLM和Claude的性能对比
在构建互补图时大语言模型的选择对于确定实体对之间的互补关系至关重要。我们对ChatGPT、ChatGLM和Claude三种模型进行了比较。基于手动评估的1000个互补实体对样本Claude模型在相关性评分上优于其他两种模型显示出更高的相关性水平。这表明Claude模型在理解和推理自然语言处理方面的能力更强能够更准确地识别实体对之间的互补关系。
2. 模型误判大语言模型需更精细的调整
在实际应用中即使是性能最佳的模型也会出现误判。例如ChatGPT将“老花镜”与“卸妆油”联系起来认为使用老花镜可以在卸妆后更好地观察面部皮肤状况下表。而ChatGLM则将“蛋糕”与“睡衣”联系起来认为人们可能在晚上穿着睡衣吃蛋糕。这些解释过于富有想象力强行建立了实体对之间的联系实际上这些实体对并不具有互补关系。这些错误案例表明即使是大语言模型也需要更精细的调整和优化以便更准确地捕捉和推理用户的购买行为和意图。 案例LLM-KERec系统具有更高的互补实体对转化率
我们计算并比较了LLM-KERec和基线模型推荐的一组互补实体对的转化率CVR。比较结果在下图中展示。在图中空白方块表示两个实体词之间没有关联关系而彩色方块表示实验组的CVR相对于基线组有所提高。红色方块代表实验组的CVR高于基线组而蓝色方块则表示实验组的CVR低于基线组。从图中可以观察到实验组推荐的互补对通常比基线组推荐的具有更高的CVR。
总结LLM-KERec系统的贡献与未来展望
1. LLM-KERec系统的贡献
LLM-KERec系统是一种创新的推荐系统它通过结合大语言模型LLM和互补知识图谱有效地解决了传统推荐系统在适应新商品和捕捉用户意图转变方面的局限性。通过在三个行业数据集上的广泛实验表明LLM-KERec系统在性能上显著优于现有方法。该系统的核心贡献包括 实体提取器的设计通过设计实体提取器LLM-KERec系统能够从商品和用户账单信息中提取统一的概念术语实体为构建知识图谱打下基础。 互补知识图谱的构建利用大语言模型判定实体对之间的互补关系并构建互补知识图谱。这一图谱不仅反映了用户的购买模式还能够根据实时反馈调整图边权重从而提升推荐的个性化和准确性。 E-E-I权重决策模型通过实体-实体-商品E-E-I权重决策模型LLM-KERec系统能够根据用户的最近账单和商品信息推荐互补商品进一步优化了排名模型的得分。
2. 未来展望
LLM-KERec系统的成功部署在推荐系统领域开辟了新的道路但仍有进一步的发展空间。未来的研究和开发可以集中在以下几个方面 实体提取器和知识图谱的持续优化随着电子商务环境的不断演变新商品的不断涌现实体提取器和知识图谱需要定期更新以适应变化保持推荐系统的时效性和准确性。 大语言模型的进一步探索当前研究已经比较了不同的大语言模型如ChatGPT、ChatGLM和Claude在构建互补知识图谱中的表现。未来可以进一步探索如何更有效地利用这些模型的推理能力以及如何将它们与推荐系统更紧密地结合。 个性化和上下文感知的增强通过深入理解用户行为和上下文信息推荐系统可以更准确地预测用户的需求提供更加个性化的推荐。 系统的可扩展性和效率随着数据量的增长和用户需求的多样化推荐系统需要在保证推荐质量的同时提高处理大规模数据的能力。 用户隐私和数据安全在提升推荐系统性能的同时保护用户隐私和数据安全是至关重要的。未来的研究需要在遵守数据保护法规的前提下探索更安全的数据处理和推荐方法。
总之LLM-KERec系统的提出为推荐系统领域带来了新的视角和方法其未来的发展有望进一步推动个性化推荐的边界为用户提供更加丰富和精准的购物体验。