当前位置: 首页 > news >正文

专业的单位网站开发开发链接购买平台

专业的单位网站开发开发,链接购买平台,网站建设打广告,学网站开发需要学什么来源#xff1a;36氪概要#xff1a;对于个性化分发与推荐#xff0c;Netflix都是一个走在前面的公司。其首页的个性化推荐策略不断被后来者所模仿。对于个性化分发与推荐#xff0c;Netflix都是一个走在前面的公司。其首页的个性化推荐策略不断被后来者所模仿。近日#… 来源36氪概要对于个性化分发与推荐Netflix都是一个走在前面的公司。其首页的个性化推荐策略不断被后来者所模仿。对于个性化分发与推荐Netflix都是一个走在前面的公司。其首页的个性化推荐策略不断被后来者所模仿。近日Netflix官方在Medium上的技术博客发表了一篇文章介绍了Netflix在个性化推荐领域最新的进展即影视作品的封面图个性化。为什么要在这个方面做个性化这个方面的个性化有什么挑战Netflix采取了什么策略来应对这些挑战多年来Netflix的个性化推荐系统的主要目标一直都是在合适的时间向合适的用户推荐其感兴趣的内容。在大量的用户以及海量的用户匹配上给每一个用户找到其感兴趣的内容是至关重要的。但推荐的作用还不止于此。这背后还有很多问题比如为什么你应该关心我们推荐的任何特别的影视作品呢对于一个用户不熟悉的新作品我们说些什么才能激发起你的兴趣呢我们怎么才能让你相信一个作品值得一看呢回答这些问题对于帮助我们的用户发现优秀的影视作品是至关重要的尤其是对于那些并不为人所熟知的或一些新的作品。解决这一挑战的一个途径是从我们用来描述影视作品的封面图入手。如果代表影视作品的封面图捕捉到了一些吸引人的东西那么它就会充当你的入口给你一些视觉上的“证据”来解释为什么这个作品可能对你来说是合适的。这些封面图可能会突出你所认识的一个演员捕捉到一个激动人心的时刻比如令人激动的汽车追逐或者包含一个戏剧性的场景来传达电影或电视节目的精髓。如果我们在你的主页上呈现出完美的画面正如他们所说的一张图像胜过千言万语那么也许你会尝试一下。这是Netflix与传统媒体产品不同的另一种方式在为每个用户提供个性化的推荐和个性化的视觉效果上我们有超过1亿种不同的产品。一个没有配图的Netflix主页。在之前的工作中我们讨论了为每个用户推荐的每个影视作品找到一个完美封面图的努力。通过多臂bandit算法我们可以为作品找到最合适的封面图。以《怪奇物语》为例获得了大部分用户的欢迎。然而考虑到品味和喜好的多样性如果我们能找到对于每一位用户来说的最佳封面图来突出一个与他们特别相关的主题岂不是更好为《怪奇物语》提供的封面图不同的图涵盖了节目中的广泛主题。作为灵感启发让我们挖掘一些让封面图的个性化变得有意义的场景。考虑下面的例子不同的用户有不同的观看历史。箭头左侧是一个用户过去看过的三个影视作品。在箭头右侧是我们为会员推荐的颇受欢迎的作品及其封面图。让我们考虑一下尝试怎么将电影《心灵捕手》的封面图变得个性化。在这里我们可以根据一个成员喜欢不同类型和主题的程度来将这个决定个性化。对于看过很多浪漫电影的人来说如果我们展示的是包含Matt Damon和Minnie Driver的封面图可能会引发他们对《心灵捕手》的兴趣。而如果我们使用的是包含著名喜剧演员Robin Williams的封面图那么看过很多喜剧的人可能会被吸引到这部电影里去。在另一个场景中让我们想象一下对演员们的不同喜好会如何影响电影《低俗小说》封面图的个性化。一位看过Uma Thurman许多电影的用户可能会对包含Uma的《低俗小说》的封面图作出积极回应。与此同时如果封面图具有John Travolta的特色的话其粉丝可能对看《低俗小说》更感兴趣。当然并不是所有的个性化封面图都能找到如此清晰和明显的场景。因此我们不会在这里穷尽所有规则而是依靠数据来告诉我们应该使用什么图片。总的来说通过封面图的个性化我们帮助每一个影视作品向每一个用户展现出最好的一面从而提高我们的用户体验。需要克服的挑战在Netflix我们一直积极拥抱个性化。通过算法来不断改善用户体验的许多方面。其中就包括主页的序列选择每个位置选什么影视作品以及向用户发送的消息等等。对于我们来说每一个新方面的个性化都面临着独特的挑战。对封面图的个性化展示也不例外也展现出了不同的挑战。封面图个性化的一个挑战是我们只能选择一个封面图来代表我们为特定位置选择的影视作品。相比之下典型的推荐设置让我们向用户提供多种选择这样我们就可以从用户的选择中了解他们的偏好。这意味着在一个封闭的循环中运行图像选择是一个“先有鸡还是先有蛋”的问题如果一个用户播放了一个影视作品它只能来自我们决定向那个成员展示的封面图。但我们想要理解的是当为一个影视作品呈现某一特定的封面图时它会影响一个用户播放或不播放一个影视作品。什么时候当一个用户在播放一个影视或不时不会考虑我们展示的是哪个图片。因此封面图的个性化问题还要在传统的推荐问题之上需要与算法互相配合。当然要想正确地学习如何个性化封面图我们需要收集大量的数据以找到一些信号来表明对一名用户来说一个特定的封面图要比其他的封面图要好得多。另一个挑战是理解改变向用户展示的封面图会产生什么影响尤其是在一个影视作品的不同系列之间。改变封面图是否会降低影视作品的可识别性使其难以在视觉上再次定位作品例如如果用户之前觉得有兴趣但还没有看过或者改变封面图本身会导致用户重新考虑它因为有了更好的选择很显然如果我们能找到更好的封面图给一个用户我们应该使用它。但是持续的变化也会让人们感到困惑。不断变换的图像也会带来一个归因问题因为不清楚是哪个图像导致一个用户对影视作品感兴趣。第三要理解封面图与我们在同一页面或会话中选择的其他封面图之间的关系是一种挑战。也许一个醒目的特写人物在一个影视作品的页面上是很突出的因为它比其他的封面图更引人注目。但如果每个封面图都有相似的图像那么整个页面看起来就不那么吸引人了。孤立地看每一个封面图可能还不够我们需要考虑如何在一个页面的各个影视作品中选择一组不同的图像。除了其他作品的封面图之外封面图的效果可能取决于作品的其他资料例如简介预告片等。因此我们可能需要一个多样化的选择让每个选项在保障吸引力的同时实现互补。为了实现有效的个性化我们还需要为每一个影视作品建立一个良好的封面图库。这意味着我们需要一些材料具有吸引力、信息性和代表性从而避免“点击诱饵”。一组影视作品的图片也需要足够多样化以覆盖对内容不同方面感兴趣的广大潜在受众。毕竟一张封面图的吸引力和展现的信息怎么样取决于看到它的那个人。因此我们需要有封面图不仅能突出影视作品中不同的主题而且还能突出不同的美学。我们的艺术家和设计师团队努力创造各种各样的图像。他们还考虑了个性化算法该算法会在生成封面图的创作过程中选择图像。最后在规模化上面封面图个性化也面临着工程上的挑战。一个挑战是我们的用户体验是非常直观的因此包含了大量的图像。因此对每一个作品都使用个性化意味着系统在峰值时需要每秒处理超过 2000 万个低延迟请求。这样的系统必须是强大的如果不能正确地渲染UI中的封面图就会大大降低用户的体验。我们的个性化算法还需要在影视作品发布时迅速做出反应这意味着在冷启动的情况下快速学习个性化。然后在推出之后算法必须不断地适应因为封面图的效果会随着时间的推移而变化而用户的品味也会发生变化。情境化的bandit算法Netflix的推荐引擎有很大一部分是由机器学习算法驱动的。传统上我们会收集一批关于我们的用户如何使用这项服务的数据。然后我们在这批数据上运行一种新的机器学习算法。接下来我们将通过一个A/B测试来测试这一新的算法以对抗当前的系统。A/B测试可以帮助我们在随机分组的成员中进行尝试,了解新算法是否优于当前的系统。A组的成员使用当前的系统而B组的成员则得到新的算法。如果发现B组的成员与Netflix有更高的互动那么我们就会向全体成员推出新的算法。不幸的是这批处理方法会带来遗憾regret许多成员长时间没有从更好的体验中受益。如下图所示。为了减少这种遗憾我们放弃了批量机器学习考虑在线机器学习。对于封面图的个性化我们使用的特定在线学习框架是情景化的bandits。与其等待收集完整的数据再等待构建学习一个模型然后等待A/B测试结束情景化的bandits会迅速找出对于每个用户和情境来说最佳的个性化封面图。简单地说情景化的bandit是一种在线学习算法它可以权衡收集训练数据所需的成本这些数据是在持续的基础上学习无偏见的模型所必需的而这些数据的好处是将学习模型应用到每个用户的使用场景中。在我们之前的非个性化的图像选择工作中我们使用了非情景化的bandit无论情景如何我们都找到了较好的图像。对于个性化来说用户都是是在场景中的因为我们期望不同的用户对图像做出不同的反应。情景化的bandits的一个关键属性是他们的设计目的是尽量减少遗憾。在高层次上通过在学习模型的预测中注入受控随机化来获得情景化bandits的训练数据。随机化方案的复杂性可以从简单的具有均匀随机性的Epsilon-Greedy算法到封闭循环变化为闭环方案其随着模型不确定性而自适应地改变随机化程度。一般来说我们将此过程称为数据挖掘data exploration。可供影视作品使用的候选封面图的数量以及系统将被部署的总体用户的数量将决定数据挖掘策略的选择。通过这样的挖掘我们需要记录每个封面图选择的随机化信息。这种日志记录允许我们纠正倾斜的选择倾向从而以一种无偏见的方式进行离线模型评估如后面所述。由于我们向用户展示的封面图可能不会使用预测的最佳图像因此在情景化的bandit中进行挖掘通常会产生成本或遗憾。这种随机化对用户体验以及我们的度量标准有什么影响由于有超过1亿的用户挖掘带来的遗憾值通常非常小并且在我们的大量用户基础上进行分摊每个成员都暗中帮助为一小部分目录提供关于封面图的反馈。这使得每个用户的挖掘成本可以忽略不计这是在选择情景化的bandit来改善我们用户体验的关键方面的一个重要考虑因素。如果成本高随机化和对情景化的bandit的挖掘就不那么合适了。在我们的在线挖掘计划中我们获得了一个训练数据集为每一个用户、作品、图像元组记录无论这个选择是否导致了影视作品的播放。此外我们还可以控制对封面图的挖掘使封面图的选择不会经常发生变化。这样就可以更清楚地说明用户对特定封面图的参与程度。我们还会通过观察用户参与的质量来仔细判断每一个观察结果的标签从而避免学习一种推荐“点击诱饵”图片的模式吸引用户开始播放但最终导致低质量的互动。模型训练在这个在线学习环境中我们会根据情景来为每个用户挑选最好的封面图。通常情况下每个影视作品都会有几十个备选的封面图。为了学习选择模型我们可以考虑通过在一个影视作品中独立地为用户的封面图进行排序来简化问题。即使有了这种简化我们仍然可以通过影视作品来学习用户的图像偏好因为对于每一个备选的图像来说有一部分会引起用户的参与而另一部分则不会。这些偏好可以被建模来预测每一个用户、作品、图像元组以及用户将享受高质量参与度的可能性。这些可以是监督学习模型也可以是与Thompson Sampling、LinUCB或Bayesian方法相匹配的情景化bandit这些方法可以智能地平衡用数据挖掘做出最好的预测。潜在信号在情景化的bandit中情景通常被表示为作为模型输入的特征向量。有很多信号可以作为这个问题的特征。特别地我们可以考虑用户的许多属性他们所看的影视作品及类型用户与特定作品的互动他们的国家他们的语言偏好使用的设备每天的使用时间和每星期的使用情况。由于我们的算法会结合我们的个性化推荐引擎来选择图像所以我们还可以使用关于我们的各种推荐算法如何看待影视作品的信号而不管用什么图片来呈现它。一个重要的考虑因素是有些图片在备选库中自然会比其他图片更好。我们观察了数据挖掘中所有图片的总体播放率。我们之前的非个性化封面图选择使用了整体的差异来决定一个影视作品的最佳封面图。在我们新的情境个性化模型中整体的播放率仍然很重要并且个性化推荐仍会与非个性化图像排名有一定重合。图像选择封面图对用户的最佳分配是一个选择问题从一个影视作品的可用图像池中找到最佳的备选图像。一旦模型被训练成如上所述我们就用它来为每一个情景化的图像排名。该模型预测在给定的用户背景下给定封面图的播放率。我们根据这些概率对一组图像进行排序选出最有可能性的一组图像。这是我们给那个特定用户的图像。效果评估为了评估我们的情景化bandit在上线之前我们可以使用一种称为重播的离线技术。这种方法允许我们根据记录的挖掘数据来回答反事实问题图1。换句话说如果我们用不带偏见的方式使用不同的算法那么我们可以将历史会话中发生的事情进行比较。图1:根据记录的数据计算重放指标的简单示例。对于每个成员分配一个随机的图像第一行。系统记录了用户的印象以及这个页面是否播放了影视作品绿色圆圈或者没有播放红圈。通过匹配随机分配和模型分配重合的部分黑色方块计算该子集的分数来计算新模型的重播指数。重播让我们看到如果我们假设图片是通过一种新的算法来选择的而不是之前使用的算法那么我们就可以看到成员们是如何参与我们的为其提供的影视作品的。对于图像我们感兴趣的是几个指标尤其是像上面所描述的“播放率”。图 2 显示了与随机选择或非情境 bandits 相比情境 bandits 如何提高记录中用户的平均参与率。图2:基于图像探索数据记录中重播率不同算法选择的图像平均分数越高越好。随机绿色表示随机选择图像简单的 bandit 算法黄色选择具有最高分数的图像。情境 bandit 算法蓝色和粉红色根据情境为不同的成员选择不同的图像。图3:基于个人资料文件类型的情景图像选择示例。Comedy 指主要观看喜剧片的个人资料Romance 代表看爱情片最多的用户个人资料。情景化bandit选择了著名喜剧演员Robin Williams的形象并选择了一对亲吻情侣的照片让他们更倾向于Romance。经过对多种离线模型进行试验之后我们找到了可以提高重播率的模型我们最终进行了A/B测试在多种情况下将个性化情境 bandit 与非个性化 bandit 进行比较。正如我们所假设的那样个性化的工作方式使我们的核心指标产生了显著的提升。我们还发现在离线模型下测量重播率与线上模型之间的合理性关联。在线结果也产生了一些有趣的见解。例如在用户没有与影像作品进行过交互的情况下个性化带来的提升就更大了。这是有道理的因为我们认为当一个影视作品不那么为人所熟知的时候封面图对用户来说就更重要了。结论通过这种方法我们已经开始了第一步为我们的推荐选择个性化的封面图从而使服务质量更好。这使得我们的用户发现新内容的方式有了显著的改进。所以我们已经把它推广给了所有用户这个项目是第一次我们不仅对推荐内容进行了个性化而且对推荐的方式也进行了个性化。但还有很多机会可以扩大和改进这种最初的方法。这些机会包括开发一种算法来处理冷启动方法是将新图像和新影视作品尽快地个性化例如使用计算机视觉技术。另一个可能性是将这种个性化的方法扩展到我们使用的其他类型的艺术作品以及其他描述我们的作品的材料比如例如简介元数据和预告片。原文链接https://medium.com/netflix-techblog/artwork-personalization-c589f074ad76未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能互联网和脑科学交叉研究机构。由互联网进化论作者计算机博士刘锋与中国科学院虚拟经济与数据科学研究中心石勇、刘颖教授创建。未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市云脑研究计划构建互联网城市云脑技术和企业图谱为提升企业行业与城市的智能水平服务。  如果您对实验室的研究感兴趣欢迎支持和加入我们。扫描以下二维码或点击本文左下角“阅读原文”
http://www.pierceye.com/news/314263/

相关文章:

  • 经典网站建设邢台网站建设策划
  • 系统数据库与建设网站网站提交入口大全
  • 网站做数据分析的意义西安网站建设kxccc
  • 免费建个人网站alexa排名搜索
  • 做的网站第二年续费多钱店铺装修模板
  • 这么自己建设网站中卫网站设计厂家
  • 公司网站制作哪家公司好广州建设执业资格注册中心网站
  • 北京所有做招聘类网站建站公司Apache Wordpress伪静态处理
  • 大兴做网站公司制作网页可以用什么软件
  • 该怎么给做网站的提页面需求网上购物平台怎么建立
  • 用pw后缀的网站阳江网络问政平台首页
  • 建站网站建设哪个好网页设计个人总结
  • 网站开发时间进度表宁波网站建设使用技巧分享
  • wordpress官网案例移动端优化
  • 广告投放网宁波seo网络推广报价
  • 网站模板 哪个好烟台高端网站建设公司
  • 福建网站开发手机软件app下载
  • 网站开发的功能需求怎么写网页版式设计分析
  • 荔浦网站开发乐陵新闻最新消息今天
  • 盘锦网站建设服务如何上传网站到空间
  • 怎样建设自己网站常德seo招聘
  • 用别人家网站做跳转做商品抬价是什么兼职网站
  • 合肥市建设信息中心网站怎么做网站的签约编辑
  • 6入空间网站免费观看网站标题怎么修改
  • iis服务器的默认网站wordpress多级分销插件
  • jquery 网站后台模板 仿2021好心人给个开车的网站
  • 济宁定制网站建设推广关于协会网站建设的意见
  • 门户网站建站要求滨州网站seo服务
  • 国外 视频上传网站源码怎么看网站的访问量
  • 网站的建设框架3网站建设