当前位置: 首页 > news >正文

怎么做像表白墙的网站海天建设集团网站

怎么做像表白墙的网站,海天建设集团网站,如东做网站,合肥建设云平台证书查询原文地址#xff1a;Zero-Shot Intent Classification with Siamese Networks 通过零样本意图分类有效定位域外意图 2021 年 9 月 24 日 意图识别是面向目标对话系统的一项重要任务。意图识别(有时也称为意图检测)是使用标签对每个用户话语进行分类的任务#xff0c;该标签…原文地址Zero-Shot Intent Classification with Siamese Networks 通过零样本意图分类有效定位域外意图 2021 年 9 月 24 日 意图识别是面向目标对话系统的一项重要任务。意图识别(有时也称为意图检测)是使用标签对每个用户话语进行分类的任务该标签来自预定义的标签集。 分类器在标记数据上进行训练并学习区分哪个话语属于哪个类别。如果一个看起来不像任何训练话语的话语来到分类器有时结果会很尴尬。这就是为什么我们也会对“域外”话语进行分类这些话语根本不属于域。 意图分类器对话语进行分类。在这里示例领域是机票预订和“嘿兄弟你是机器人吗?”是一个域外的话语。作者图片 问题是用户和我们开发人员生活在不同的语言中。开发人员希望留在语义丛林中的安全农场(所谓的领域)但用户并不十分了解分类器或聊天机器人NLU是如何工作的(他们也不必知道)。你不能指望用户保持在正确的语义领域相反你应该赋予你的聊天机器人处理良好话语的技能。 你的安全语义农场在口语的野性。你永远不知道从野外来的是什么!作者图片 在这篇文章中我们将讨论如何通过检测哪些话语属于域哪些话语不在域内来保持域的完整性Chris是我们的司机语音助手。首先我将介绍Chris域和话语然后我们将讨论什么zero-shot学习文本分类与Siamese网络。 Chris Domain and Data Chris是司机的语音助手。我们的Chris是一个驾驶助手由德国自动实验室制造。Chris可以发送/阅读短信WhatsApp消息打电话给电话联系人播放音乐导航响应天气查询和聊天。 我们的 Chris在左边。Chris和他的能力在右边。图片来自德国汽车实验室网站。 Chris是一个以任务为导向的会话代理因此用户的话语通常简洁而切中要害。这些是典型的用户话语: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23play music some music please stop the music send a message send a message to Tess send a whatsapp read my messages do I have any new messages display the latest message start the navigation show navigation show the map stop the navigation nearest gas station find a parking spot read it no cancel cancel yes next no next tell me the time how is the weather today意图名称由子域名和动作名称组成。以下是与上述话语相对应的一些意图名称: 1 2 3 4 5 6 7 8 9 10 11music.play music.pause messages.write messages.read navigation.start navigation.stop universals.accept universals.reject universals.next misc.time misc.weather域外话语呢?下面是一些例子: 1 2 3 4 5 6 7 8 9 10 11hey siri launch siri wake up siri open my instagram share my video on instagram delete my facebook account play my audibooks set an alarm show alarms please delete all alarms open the doors这是完全正常的用户要求一些功能你的聊天机器人根本没有。例如打开车门根本不在克里斯的技能范围内。尽管UX团队在每个包装中都包含了关于Chris技能的指导方针但用户可能会跳过它..这就是为什么您的聊天机器人NLU应该始终准备好处理广泛的域外话语用户要求的是他们可以想象到的聊天机器人可以实现的能力而不是用户手册中写的那些。 简短的话语乍一看可能很“容易”但也有一些挑战。语音识别错误可能会给人带来困难特别是在短的话语中因为语义上至关重要的单词可能会从话语中丢失(例如“play music”中的“play”)。此外语音引擎必须在正确的时间开始倾听否则它可能会错过一个单词短的话语如“yes”“no”这对解决上下文至关重要。从WER的角度来看仅仅缺少3个字母并不是一个严重的ASR错误但如果您的代理多次要求用户批准则可能会给用户带来挫败感。所有的语音机器人都有声学和语义方面的挑战永远不要低估使用语音的挑战。 什么是zero-shot文本分类? 零短文本分类是在一组类标签上训练分类器并用分类器在训练集中没有看到的类标签来测试分类器的任务。NLP最近的工作集中在更广泛的背景下的zero-shot学习zero-shot学习NLP现在意味着训练一个模型来完成它没有明确训练的任务。GPT-3是一个zero-shot学习者吸引了相当多的关注。 在zero-shot分类中我们用一些视觉线索或类名向分类器描述一个看不见的类。对于zero-shot文本分类通常使用意图名称来描述意图的语义。当我第一次开始做Chris NLU时数据是用于“常规”意图分类的。然后我开始尝试并找到了我们的类命名方案**域。动作(音乐)。玩,导航。开始等等)确实非常适合zero-shot学习。 将标签和话语嵌入到同一空间 zero-shot文本分类的常用方法是将意图名称和话语嵌入到同一空间中。这种zero-shot算法可以像我们人类一样通过语义组来学习意图名称和话语之间的语义关系。这根本不是一个新想法研究人员使用单词向量来表示固定维度的文本和意图名称(例如在Veeranna at all.2016)。通过Transformers的发明密集表示经历了一场革命现在我们有了更多高质量的句子和单词Embeddings。 在我们的研究中我们首先使用平均池词向量来表示话语然后使用BERT对我们的话语进行编码来生成话语向量。首先让我们看看当我们使用词向量时意图名称是如何与话语结合在一起的。我们使用了100维手套向量。我们通过平均一个话语的词向量来生成句子Embedding。为了得到标签的Embedding(例如music.play)我们平均了域(music)和动作(play)的Embeddings。在为所有话语生成Embedding之后我们使用t-SNE将数据集转换为二维(出于可视化目的)。下面的散点图显示了所有数据集的话语和意图名称具有相同意图的话语用相同的颜色表示 Chris的话语每种颜色都代表一种意图。 这就是话语和意图名称的排列方式 Embedding意图名称和话语到同一空间 如果我们放大一点我们会看到意图名称和相应的话语确实非常一致 放大到上面的视觉效果 数据集的话语创建了一个相当漂亮的散点图没有太多的异常值相同的意图的话语与意图名称组合在一起。 如果我们想用BERT嵌入话语和意图名称呢?这对话语很有效但意图名称不是真实的句子和简短的表达。BERT是针对完整句子进行训练的对于像我们的意图名称这样的简短表达可能不太有效。在这种情况下我们可以通过BERT为话语创建768维Embeddings并通过词向量为意图名称创建100维Embeddings。为了将它们嵌入到相同的空间中我们需要计算一个投影矩阵φ将768个模糊的话语向量投影到100维意图向量上。由于我们有标注的数据我们可以通过回归来学习投影矩阵。(尽管包含正则化以防止过拟合很重要)。然后我们有一个类似于上面的视觉对齐。 用于zero-shot文本分类的Siamese网络 上面的探索性数据分析告诉我们意图名称和话语之间的语义相似性是非常明显和可学习的。然后我们可以要求Siamese神经网络学习意图名称和话语之间的相似性。 传统的意图分类器输入一个话语并生成一个类标签。通常我们用LSTM或BERT对话语进行编码然后将编码后的话语输入到Dense层并得到一个类标签 传统的意图分类器。by作者 我们的zero-shot意图分类器会学习标签和话语在语义上是否相似。我们使用了Siamese网络架构这对于计算语义相似度非常有用。我们的Siamese网络输入一个意图名称和一个话语输入相关或不相关的输出。 架构与我在我之前的SiameseNN文章中描述的相同。该体系结构包括 LSTM/BERT层对话语和标签进行编码然后是距离层计算话语和标签之间的语义距离最后是一个Dense层将距离向量压缩为二进制值 该体系结构仍然是一个文本分类器但此时输入数为2输出向量维数仅为1。输出为二进制0表示标签与话语不相关1表示该话语属于该标签的类。 Siamesezero-shot意图分类器。作者图片 我们可以向Siamese分类器询问任何我们想要的标签(即使分类器以前从未见过这个标签)只要我们能为标签提供一个良好的Embedding。这对于域外的话语来说是很好的因为即使你没有任何标记好的类数据或只有几个例子Siamese zero-shot分类器仍然可以决定一个话语是否与Chris域相关或与域不相关。 Siamese网络用于语义相似已经有很长一段时间了但是玩一些技巧可以让我们毫不费力地获得zero-shot意图预测模型。有时候这个想法一直就在你面前但你必须从不同的角度去看待它。 在本文中我们继承了一种全新的方法来解决“传统”的意图分类问题。首先我们对Chris的话语进行了语义分组。然后我们刷新了关于Siamese网络的知识。最后我们看到了如何使用Siamese网络进行zero-shot分类。 我希望所有的读者都喜欢我们的Chris的能力和数据并希望在更多的Chris文章中见到你。在那之前请保持关注和健康❤️ 参考文献 Language Models are Few-Shot Learners, https://arxiv.org/abs/2005.14165Are Pretrained Transformers Robust in Intent Classification? A Missing Ingredient in Evaluation of Out-of-Scope Intent Detection https://arxiv.org/pdf/2106.04564.pdfDetecting Out-Of-Domain Utterances Addressed to a Virtual Personal Assistant https://www.microsoft.com/en-us/research/wp-content/uploads/2014/09/IS14-Orphan2.pdfUsing Semantic Similarity for Multi-Label Zero-Shot Classification of Text Documents , https://www.esann.org/sites/default/files/proceedings/legacy/es2016-174.pdf
http://www.pierceye.com/news/1907/

相关文章:

  • wordpress自动分享网站优化seo怎么做
  • qq刷赞网站推广软件磁县网站建设
  • 佛山市企业网站seo点击软件弱电工程公司网站怎么做
  • 网络推广的公司西安网站建设 乐云seo
  • 现货黄金什么网站可以做直播seo排名快速
  • 凡科可以做淘客网站吗用来做微网站的
  • wordpress汉化版插件优化网站关键词
  • 用手机能建网站吗电商网站建设的意义
  • 如何查看一个网站的访问量曹鹏wordpress教程 下载
  • 用前端框架做自适应网站免费网站域名注册个人
  • 盘锦建网站软件开发工具与环境实践报告
  • 广州微信网站建设费用海南做网站公司哪家好
  • 如何建设好一个公司网站企业网站打不开的原因
  • 企业的网站建设需要做什么seo建设者
  • 网站建设首选 云端高科wordpress写网页教程
  • 做一手机网站需要多少钱asp.net mvc 5 网站开发之美 pdf
  • 网站管理员登录wordpress4.5注册插件
  • 如皋做网站的网站的改版怎么做
  • 做网站的实验报告设计网站公司力荐亿企邦
  • 专门做防盗门的网站网站丢了数据库还在
  • wpf视频教程 -.net购物网站开发网站做外链的具体步骤
  • 信阳市住房建设局网站小程序微信怎么开发
  • 做推广哪家网站好青岛网站开发哪家好
  • 网站流量一直下降梧州论坛
  • 东莞网站建设的公司建设网站的用途
  • 怎么建立一个网站让外国人浏览云南住房和城乡建设厅网站首页
  • wordpress目录权限管理夫唯seo培训
  • 微网站建设方案seo博客优化
  • 宜昌网站建设多少钱无锡百度网站推广
  • 用cms创建自己带数据库的网站和在本机搭建网站运行平台的心得体会关键词优化排名软件推荐