网站源码下载网站,企业网站免费推广方案,国外超酷设计网站,平台系统维护是什么意思#x1f680; 优质资源分享 #x1f680;
学习路线指引#xff08;点击解锁#xff09;知识定位人群定位#x1f9e1; Python实战微信订餐小程序 #x1f9e1;进阶级本课程是python flask微信小程序的完美结合#xff0c;从项目搭建到腾讯云部署上线#xff0c;打造一… 优质资源分享
学习路线指引点击解锁知识定位人群定位 Python实战微信订餐小程序 进阶级本课程是python flask微信小程序的完美结合从项目搭建到腾讯云部署上线打造一个全栈订餐系统。Python量化交易实战入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统导读 美团是一个生活服务领域的平台需要大量知识来理解用户的搜索意图同时对于商家侧我们也需要利用现有的知识对海量信息进行挖掘与提取进而优化用户体验。今天分享的主题是知识图谱在美团推荐场景中的应用。主要包括以下几方面内容
美团知识图谱介绍美团推荐场景介绍美团推荐中的知识应用总结与展望
–
01 美团知识图谱介绍
首先介绍美团的知识图谱美团大脑。
美团所涉足的生活服务领域需要大量知识。例如当用户搜索“10人聚餐”的query时我们需要对它结合知识进行理解得到用户想找大桌或者找包间的意图。同时对于商家侧我们也需要利用UGC评论中挖掘出类似于“有大桌”、“有包间”这样的标签。基于知识的理解和匹配我们可以把满足需求的商家推荐给用户当用户点击进入商家详情页时有别于之前用户需要逐条查看海量评论费时费力我们从UGC中挖掘出细粒度的情感标签把大部分用户关心的细粒度特征显式地展示出来从而节省用户的时间提升用户体验。 因为生活服务领域需要大量的知识美团NLP中心从2018年开始就着手构建了生活娱乐领域超大规模的知识图谱——美团大脑。我们从餐饮图谱开始后来逐渐扩展至标签图谱、场景图谱、商品图谱、到综图谱等。 美团大脑目前是正在构建中的超大规模的生活服务领域知识图谱其主要的主体类型是商家千万级、商品十亿级、店菜亿级、海量的用户评价70亿量级以及从评价中挖掘出的场景标签百万级。
–
02 美团推荐场景介绍 美团推荐属于LBS基于位置的服务推荐它与电商推荐、新闻推荐、视频推荐等存在很大差异。LBS推荐中位置约束以及场景化的要求很高供给约束是区域型的其主目标是订单或者IPay业务新客订单而非Dau或者时长。此外LBS推荐的社交粘性较弱。 美团推荐存在着以下四点挑战
可解释性需求强烈可解释性可以直接影响用户的体验和决策从而促进交易达成美团的业务目标美团涉及的领域多、差异大领域包含了吃、住、行、游、购、娱等数据稀疏除了到餐外卖等高频业务外大部分业务的订单相对较少且新用户的占比偏高**时空场景复杂**我们需要考虑到本异地、时间、地点等因素。一个典型的本异地的场景例子是一个用户在出差前需要查看目的地酒店。有关时间因素的例子如一个用户在早上喜欢吃豆浆油条中午就喜欢吃正餐。又如一个用户在家和在公司喜欢点的外卖不一样这就是一个考虑地点因素的例子。
–
03 美团推荐中的知识应用
1. 可解释性需求强烈 比如对于一个商务人士他的搜索需求是“商务宴请”若我们仅仅直接向他推荐“湘江宴”与标签“湘菜”那么他无法得知商家是否能满足自己的宴请需求。如果我们将商家的“有大桌”“包间”等知识信息展示给他时那么他就可以轻松地判断出推荐的商家可以满足自己的需求。 因此知识图谱最典型的应用是结构化信息展示。例如我们可以从药品的说明书中挖掘出药品的功效来展示给消费者我们可以将知识图谱利用在商品筛选项中如用户搜索薯片时向其展示按口味区分的筛选项从而使他能够快速地选择符合口味的薯片进行购买。 除了利用知识图谱来向用户进行结构化信息展示之外我们还利用图谱路径来引导推荐。如相关搜索-召回的业务场景当一个用户输入一个query以后下滑了很久都没有进行点击那么我们就会为其推荐一部分更好的query。一个简单的做法就是直接使用知识图谱路径召回将query对应的实体在图谱中有连接的下位实体推荐给用户如“奶茶”对应的“珍珠奶茶”、“香草奶茶”等。这一方法的优点在于其召回的相关性较好这得益于知识图谱的质量很高缺点是召回率低因为用户的query含有噪声信息而知识图谱的实体较为纯净。在实际业务中我们更常用的做法是利用embedding进行召回具体做法是将用户历史query以及点击poi进行构图之后使用GNN模型来训练embedding。当用户输入一个query时我们在训练好的向量空间中搜索query向量的近邻向量作为候选召回。这一做法的优点是召回率高但是召回的bad case较多且即便embedding的质量非常高也无法避免bad case的出现。 美团在业务中会首先使用embedding召回的方法生成一系列候选召回集合。随后我们使用用户交互行为与知识图谱来进行构图。如上图所示query与poi、query与deal商家的团单是点击关系这部分来源于点击行为deal属于poi且每个poi都从属于一个类目这部分信息来源于知识图谱。我们通过两部分信息的结合构成一系列路径可以通过每一条路径来计算query属于哪一类poi类目的得分其对应于query对应的类目分布。通过计算交叉熵将不符合要求的候选召回过滤掉从而实现在召回率高的同时减少bad case。 基于上述embedding召回图谱路径过滤的方法美团推荐的默认词模块、热门搜索模块、相关搜索模块都得到显著的业务指标的提升尤其是相关搜索模块无结果率下降了10个百分点点击QV提升了34%。 我们还基于图谱的知识推理来生成推荐理由。以上图为例左侧是知识图谱可以通过它来学习每个用户到每个商户的路径分。比如学习到用户的家乡属于某一个城市以及这个城市的特色菜品同时这个菜品又隶属于某个商户若此时这一路径在当前用户对当前商户的所有路径中得分最高就可以按照这条路径生成推荐理由如“和你一样的四川老乡也喜欢这家店的水煮鱼”。可以看出这一方法生成的推荐理由是十分个性化的且其吸引力较强。 基于图谱的推荐理由生成在线上也取得了很好的收益。与从UGC中挖掘的推荐理由相比这一方法有两个优势。
首先这一方法不依赖商户评价数据这对新店较为友好我们可以使用用户交互行为和知识图谱来为用户提供个性化推荐理由。
第二由于生成的路径很灵活我们可以轻松地为用户从个性化与多维度的角度生成推荐理由。
2. 领域多、差异大 在美团推荐的场景下我们需要为用户同时推荐多个领域的内容。例如点评内容推荐我们需要为用户推荐的领域包括宠物、露营、旅游、运动、亲子、美食、野生动物等。传统模型使用一个向量表征用户其对用户多兴趣的建模比较粗糙。最近有一些多兴趣模型的工作使用多个向量表征用户对用户的兴趣建模更加精细。 已有的工作使用用户item序列id作为输入使用诸如多通道或者动态路由的结构来输出用户多个兴趣向量但存在两个问题。首先它们都以item为最小粒度忽视了item蕴含的丰富语义信息兴趣建模不精细。其次这些模型的可解释性不强它们无法回答用户的兴趣具体是什么以及item所从属的兴趣是什么。 在美团推荐场景中我们使用海量数据构建了基于常识的概念图谱。图谱中包含了事实、事件它们都包含了具体的语义信息如遛狗这一事件发生在周末晚上地点在狗咖或者撸狗店等需要使用到狗玩具、遛狗绳等。 我们想将概念图谱加入多兴趣建模中使得兴趣建模更加精细。如上图所示第一个点评内容包含了图谱中多个实体每个实体都对应于多个兴趣集合。我们想要建模的可解释性更强这就对应了三个目标
items需要有一个整体的兴趣集合每个item对应一个兴趣分布每个user对应一个兴趣分布 为了实现上述可解释性的目标我们采用了基于神经图灵机Neural Turing MachineNTM的记忆网络结构。NTM中的memory模块具有存储信息的能力控制器controller用于控制读写操作。NTM的好处在于可以使用memory模块存储items的兴趣集合实现了上述第一个目标通过read操作NTM可以得到用户交互的item的兴趣分布实现了前述第二个目标。但是原始的NTM无法存储user的兴趣于是我们提出了基于双重记忆力模块的NTM。 模型的输入是用户对应的item序列包含点击序列以及点击的item多关联的entity。
首先输入序列会通过异质图神经网络模型HGNN将item与entity在统一的向量空间中进行建模。
之后item和entity向量会输入至双重记忆网络Dual Memory Networks通过读写操作更新MI储存item的兴趣分布和MU储存user的兴趣分布。我们可以通过目标item使用读操作得到对应的兴趣分布。
最后我们使用聚合操作可以得到用户的兴趣分布。通过这一网络结构可以满足提出的三个目标。 我们使用上述网络架构在点评业务上进行了对比实验。实验结果发现与单兴趣模型与已有的多兴趣模型相比我们的模型在所有指标上都有不同程度的提升。 我们也进行了一些消融实验。当我们将网络结构中item memory去除后模型效果下降得最明显当我们将user interest去除后模型效果也有所下降。为了保证item与对应的entity所学习到的分布的一致性我们加入了KL散度损失函数进行约束。如果去除这一限制模型效果也略有下降。消融实验有力地证明了双重记忆网络的有效性。 模型训练完成后MI可以被看作一系列“槽”对应了每一个领域的兴趣。每个“槽”中存储了一些实体那么所有item有一个整体的兴趣集合。当一个item输入记忆网络时我们可以使用网络中的读操作得到item对应的兴趣分布。类似地user也可以得到对应的兴趣分布。
3. 数据稀疏 在美团的业务中到餐/外卖这一业务交互量较大但是如买菜业务的交互量就较小只有部分用户与部分item进行交互。美团拥有丰富的图谱知识我们发现买菜业务中的菜品其实与到餐/外卖业务中的菜品有一定关系。基于这一事实我们考虑使用知识图谱与交互量较大的业务领域使用跨域学习的方法来增强数据稀疏领域的业务效果。 我们采用的是单目标的跨域学习即只关注目标域中user和item的推荐效果。源域中的user、item以及知识图谱都作为网络的输入。这一方法的重点在于如何更好地将源域中的信息以及知识图谱中的信息融入目标域的向量表达中。 比如内容推荐场景包含的低频用户数量较多他们的点击行为少导致推荐效果较差。我们的解决方案是加入域外的知识图谱以及域外的交互行为。例如用户在域外的点击、搜索行为点击的poi在知识图谱中包含的知识如属于的类目、商圈、标签等都可以被用来构建一张更大的异构图进而在这张图上学习节点表征。最后我们在线上使用增强后的表征进行I2I/U2I的召回。 休闲娱乐推荐领域也属于低频的场景。不仅如此该领域内还包含了很多小域如按摩/足疗、洗浴/汗蒸、KTV等。这更加重了小域中的数据稀疏问题导致针对众多小域中的item进行整体排序十分困难。这时我们发现在“美团搜索”这个大域中很多实体或者搜索query可以对应于休闲娱乐小域中的实体或者用户意向例如用户搜索“狼人杀”时隐含了桌游的意向那么在休闲娱乐域我们就可以给他推荐“桌游馆”。 所以我们考虑使用美团首页搜索行为与休闲娱乐领域的行为构建一张异构图使得我们可以利用美团首页搜索行为信息增强休闲娱乐领域的节点表征。更具体地我们认为首页搜索行为仅在一个时间间隔内过去一周或者过去一个月对目标域有效所以我们采用了基于时序的采样和聚合。最终实验结果显示在原有模型中增加了跨域学习后在点击ndcg的指标上提升了26BP。
04 总结与展望
知识图谱在美团推荐中是一个十分重要的信息输入源。知识图谱的应用可以分为显式应用和隐式应用。显式应用是指直接将知识图谱应用于推荐中的展示引导和结构召回如知识展示、路径召回、图谱推荐理由解决了可解释需求强烈的问题。隐式应用是指将知识图谱通过表征更容易、更广泛地嵌入下游任务。它可以通过引入概念性常识图谱解决用户多兴趣建模中领域差异大的问题还可以通过知识跨域增强改善目标域的数据稀疏问题。
之后我们会在两个方向上继续探索知识图谱在推荐中的应用。首先我们会继续聚焦于通用推荐场景建模如继续优化用户多兴趣、引入物品多模态、对用户与物品交互行为进一步探索场景时空性等。其次针对很多业务中面临的数据稀疏问题我们会着重探索推荐公平性、跨域学习以及图预训练。
–
05 精彩问答
Q1知识图谱在图谱路径引导推荐中召回阶段和排序阶段是不是使用一个算法模型还是一个模型将两个阶段的任务全部完成了
A首先我们在做图谱路径引导推荐时召回阶段使用的是GNN模型如同质图模型GraphSage或者异质图模型R-GAT、R-GCN等。图谱其实在召回中的作用是对召回候选集进行过滤去掉不太相关的bad case。其次在一般工业级应用中不会在召回层和排序层使用同一个模型这可以让不同业务的同学分开优化各自负责的部分。
Q2图谱路径到推荐理由的转化是人工适配还是机器自动完成
A目前我们会通过人工提前确定一些模板。模型利用知识图谱得到路径分最高的路径后去填充模板中对应的槽。在工业级的产品中因为基于模型的文本生成算法出现bad case的概率较高且不太可控影响用户体验实际业务场景中会比较慎重地使用。
Q3双重记忆网络在线上使用性能如何
A双重记忆网络主要用于用户多兴趣建模的召回场景。我们目前的使用方式是t1调度更新定期离线训练模型得到模型参数和item向量每天infer得到user向量。线上使用时我们直接使用得到的向量作为user和item的兴趣向量表征在向量空间中通过ANN算法索引性能不是问题。
今天的分享就到这里谢谢大家。
技术干货文章请关注微信公众号“DataFunTalk”。