当前位置: 首页 > news >正文

扬州工程建设信息网站免费网站模板大全

扬州工程建设信息网站,免费网站模板大全,windows优化工具,门户网站是网络表达吗来源#xff1a;中国计算机协会作者#xff1a;黄鹤 王长虎概要#xff1a;“What I cannot create, I do not understand.” 这是著名物理学家费曼的一句名言。把这句话放在人工智能领域#xff0c;可以理解为#xff1a;要想让机器真正理解某样东西#xff0c;就得让… 来源中国计算机协会作者黄鹤   王长虎概要“What I cannot create, I do not understand.” 这是著名物理学家费曼的一句名言。把这句话放在人工智能领域可以理解为要想让机器真正理解某样东西就得让它学会如何创造那样东西。“What I cannot create, I do not understand.” 这是著名物理学家费曼的一句名言。把这句话放在人工智能领域可以理解为要想让机器真正理解某样东西就得让它学会如何创造那样东西。近年来深度学习研究可谓如火如荼特别是在计算机视觉领域深度学习算法在人脸识别和物体分类等应用上已经超越了人的分辨力。那么机器在图像理解方面真的足够智能了吗套用费曼的那句话如果机器学习算法能够生成逼真的图像那它就应该真正理解图像了吧然而机器学习算法在生成图像的能力上还很不理想只能生成很模糊的、缺乏细节的图像。幸运的是随着生成对抗网络(Generative Adversarial Net, GAN)的出现生成式模型迎来了一个美好的春天。什么是生成对抗网络生成对抗网络是伊恩·古德费洛(Ian Goodfellow)在2014年提出的。他最早想要解决的问题是如何生成高质量的人工数据集以弥补真实数据的不足跟“对抗”没有半点关系。当时他遇到的难点是如何衡量生成的数据的质量。简单的办法是希望生成的数据与真实数据尽可能相似也就是用L1范数或L2范数作为损失函数又或者直接简单地在两个真实样本之间插值产生样本。但古德费洛又发现这些方法的效果都不理想于是就想到训练一个神经网络来判别生成样本的好坏。他用一个生成器生成假样本用另一个判别器去区分真假样本这就是GAN的雏形。在训练的过程中生成器努力地欺骗判别器而判别器努力地学习如何正确区分真假样本这样两者就形成了对抗的关系——至此也就产生了生成对抗网络。随后各种关于GAN的论文如雨后春笋般破土而出。具体而言一个GAN主要包含两个独立的神经网络生成器(Generator)和判别器(Discriminator)见图1。生成器的任务是从一个随机均匀分布里采样一个噪声z然后输出合成数据G(z)判别器获得一个真实数据x或者合成数据G(z)作为输入输出这个样本为“真”的概率。图1  生成对抗网络的一般结构GAN的目标函数如公式1所示。D(x)表示判别器认为x是真实样本的概率而1-D(G(z))则是判别器认为合成样本为假的概率取对数相加就能得到公式1的形式。训练GAN的时候判别器希望目标函数最大化也就是使判别器判断真实样本为“真”判断合成样本为“假”的概率最大化与之相反生成器希望该目标函数最小化也就是降低判别器对数据来源判断正确的概率。公式1  生成对抗网络的目标函数虽然“对抗机制”很巧妙地让我们免去了设计复杂目标函数的烦恼但GAN也存在一些问题。实际应用中由于生成器的更新依赖于判别器所以如果判别器学习得不好生成器也会学习得不好。为了缓解这个问题在实际训练中我们常常让判别器更新若干次之后再让生成器更新一次。即便如此GAN的训练过程还是非常不稳定而且生成的数据的多样性仍不如真实样本此谓“模式收缩”(mode collapse)。后来研究者们通过一系列的理论研究发现导致训练不稳定以及模式收缩的主要原因是最早的GAN中对真实分布与模拟分布的距离度量方法不合适于是提出用更平滑的度量来代替原来的方法进而提出了WGAN-GP[1]等方法。其中的数学推导较复杂有兴趣的读者可以自行阅读原论文。GAN带来了什么改变GAN从提出到现在不过三年时间但是与之相关的论文已经是浩如星海。从很多计算机视觉领域的论文里我们可以发现往往在旧的方法基础上加一个判别器套上对抗机制也能取得比原先要好的效果。而对GAN为什么能取得更好的效果学术界仍没有统一的意见和完备的解释。以图像生成为例一个比较普遍的解释是之前我们在图像生成式模型中使用的基于L1范数和L2范数的损失函数过于注重生成样本与真实样本“像素级”的一一对应而且最后经过均值以后每个像素的误差都变成一样导致生成的图像比较模糊。即使以L1范数做损失函数比L2范数更接近稀疏解理论上会比基于L2范数的方法获得更锐利的图像但生成图像的质量仍然不理想。GAN有什么特别之处呢正如古德费洛最早的灵感是设计一个神经网络来判断生成样本的好坏一样GAN的最大的优势来自于判别器的引入让我们不用费尽心思为一些难以直接用数学公式衡量好坏的任务设计目标函数。例如在计算机视觉领域有一个研究热点是风格迁移可把自拍照转换成卡通风格或把风光照转换成符合某个画家画风的图像等等。在这类应用中很难用数学公式直接衡量生成的图像的风格是否合适而如果要用基于范数的损失函数则需要大量成对的标注数据。但有了GAN我们就可以让判别器来学习判断图像的风格。因为判别器学习的是图像风格而不是图像里的物体所以只需要符合同一种风格的图像就能训练不需要对应图像中的物体。在自然语言处理的任务中也类似例如在聊天机器人方面采用基于范数的损失函数可能会让机器人固定地针对某些问题产生某些固定答案这是过拟合的表现。而实际上我们知道同一个意思有很多种表达想要让机器人学会用不同方式来表达同一个意思就可以利用GAN。因此GAN最大的魅力就在于这种对抗机制的普适性相信它会在很多目标函数复杂的研究领域取得突破性进展。虽然对抗机制给我们带来了很多便利但它也有明显的缺点。在很多复杂的图像生成任务上GAN的表现并不如人意例如它会经常生成扭曲的人体。反观基于范数的方法即使生成复杂的图像也能保证物体基本轮廓的正确。这种区别主要来自于范数目标函数是对每个像素操作的把生成图像与真实图像的像素一一对应上也就相当于约束了物体的轮廓而GAN则对图像整体做判断并没有对物体轮廓做约束。所以现在用GAN做图像生成的模型在训练生成器的时候会加上一个L1或者L2范数的损失函数。实验结果表明这样做确实会比单纯使用对抗目标函数效果更好。除此之外GAN实际上是一个统一了生成式模型与判别式模型的框架。一般而言我们用GAN是为了用它的生成器生成以假乱真的数据所以我们通常把它归为生成式模型。而实际上它的判别器也是一个判别式模型能够在一些特定的任务中体现它的价值。最近SIGIR会议的最佳论文IRGAN就是利用GAN把信息检索(information retrieval)领域的生成式模型和判别式模型结合起来。在信息检索领域通常有两种流派即生成式模型和判别式模型。生成式模型做的是给定一个问题(query)输出与它最匹配的文档(document)而判别式模型是输入一个问题和文档对输出两者匹配的程度。可以看到GAN的框架很直接地把二者联系起来了生成模型的输出就是判别模型的输入判别模型的输出又能促进生成模型的学习。GAN在计算机视觉上的应用目前GAN的最基本的应用就是生成以假乱真的图像。图像生成的任务主要分两种第一种是生成某种类别的图像第二种是根据用户的描述生成符合描述的图像。目前第一种图像生成的任务已经取得了很好的效果例如2016年发表的PPGN[2]模型在视觉效果上已经取得了行业顶尖的效果见图2其生成的火山图像整体上已经可以达到以假乱真的效果。而根据描述生成图像的任务目前达到的效果还差强人意。这个任务的难点在于生成器并不是学到了如何生成每个物体之后把它们组合起来而是尝试一次到位生成整张图像这与人类绘画的过程不一样。GAN根据文字生成单个物体的图像效果很不错但在多物体的复杂图像上效果就差得多有时候甚至难以分辨生成的图像内容。如图3所示根据文字生成的图像能够让人分辨出大概的内容但如果不看文字的话图第一行右边两张图还是会让人摸不着头脑。可见在文字转换为图像这个领域还有非常大的研究空间。图2   PPGN模型生成的火山图像[2]图3 PPGN模型根据文字生成的图像[2]另一种很热门的应用是图像转换(image-to-image translation)图像风格迁移只是其中一小类而已。具体而言图像转换可以包含很多种例如把一张夏天的图像转换成冬天的样子给用笔画的物体轮廓填上彩色的细节纹理给手机拍摄的照片自动虚化使之看起来像单反相机拍摄的一样等等。今年初发表的CycleGAN[3]模型就是利用了对抗机制与范数损失函数结合的办法加上类似对偶学习(dual learning)的对偶模型设计使得模型能够在无标注的数据集上取得良好的表现。图 4为CycleGAN模型图像转换的例子其中普通马与斑马的相互变换让人印象深刻。除此之外图像转换还包括人脸变换可以把不笑的人脸变成笑脸、给人带上或摘下眼镜、改变发型等可见GAN有希望结合到众多手机P图软件里面进一步丰富软件的功能和趣味性。图5为IcGAN[4]模型对人脸做变换的例子从黑发变金发、从直发变爆炸头、把微笑变成露齿笑甚至改变性别不得不赞叹GAN的神奇力量犹如鬼斧神工。图4  CycleGAN的图像转换例子[3]图5   IcGAN人脸变换的例子[4]GAN还可以应用于图像描述即给图像配上一段详细的描述。这个任务上也很能体现GAN的优势在我们描述一张图像的内容时由于着眼点不同可以有不同的描述而以往的模型对于一张图只能生成一个固定描述。最近的一篇论文提出的RTT-GAN[5]模型则实现了上述“看图写作”的能力给出一张图以及对图中一些物体的简短描述模型会生成一段连贯的篇章而用户可以通过控制先描述的物体来改变图像中物体的描述顺序从不同的描述中体会到不同的观测视角如图6所示。图6   RTT-GAN的看图写作例子[5]GAN在自然语言处理上的应用与生成图像相比生成文本的难度要大得多因此GAN在自然语言处理上的效果并不理想。例如当判别器返回的梯度是1时我们能够直接更新像素这种更新反映在图像上是有意义的。但在自然语言方面一个词1是什么意思呢也许我们可以规定“iPhone6”1“iPhone7”但对于多数词而言不存在这种规则。即使通过词向量(word embedding)在高维空间里面向量的分布也是很稀疏的一个词向量加减一个数很可能对应不上其他任何词的向量这样的更新对生成器的学习也就没有帮助。但之前我们提到的图像描述又是怎么做到的呢要想训练GAN生成文本不得不提到强化学习中的策略梯度方法。这是一种基于蒙特卡洛搜索的方法模型在生成下一个词之前会生成一个字典大小的多项式概率分布。假设搜索宽度是d那么就从这个多项式分布里随机抽取d个词以此类推直到生成长度达到限制n或者出现句尾符。我们再把生成的这些句子放到判别器里获得对应的分数之后再通过反向梯度从后往前更新每次生成的多项式分布以及前面的神经网络参数。在GAN中使用策略梯度的方案最早出现在去年的SeqGAN模型中后面用GAN做自然语言处理的研究也基本沿用了这套方案。GAN在自然语言处理方面的论文主要涉及的是人机对话、机器翻译、问答等。GAN是人类走向人工智能的一大助力人类对人工智能的追求从未止步。从传统的机器学习到如今的深度学习人类已经能够在某些任务上创造出具有自我决策能力的“智能体”如大家耳熟能详的围棋大师AlphaGo。在早期的传统机器学习时代人们需要精心设计如何从数据中提取有用的特征设计针对特定任务的目标函数再利用一些通用的优化算法来搭建机器学习系统。在深度学习崛起之后人们很大程度上不再依赖于精心设计的特征而让神经网络去自动学习有用的特征。但针对具体任务我们还是需要设计具体的目标函数以约束模型的学习方向 否则学习出来的模型所做的事可能并不是我们原来所设想的那样。但是自从有了生成对抗网络我们在很多场景中不再需要精心设计的目标函数了而是让判别器自己学效果会更好。如图 7所示从传统机器学习到深度学习我们让特征学习自动化了生成对抗网路的出现进一步把目标函数的学习也自动化了。再加上去年谷歌提出的一种利用神经网络让深度学习模型学会优化自身的算法learn2learn[6]把最后一步优化也给自动化了。人工智能算法从理论上可以完全实现从输入到输出的自动化它的下一步发展应该是能根据不同任务自动设计神经网络模型的算法了让我们拭目以待。图7  从传统机器学习到自动化人工智能算法
http://www.pierceye.com/news/659352/

相关文章:

  • 南京做网站营销网站后台忘记账号密码
  • 敦化建设局网站饰品做国际贸易哪些网站
  • 网站做js跳转怎么创建公司
  • 网站建设合同需要交印花税吗怎么做网站卖美瞳
  • 小程序价格为什么比网站建设高自定义wordpress的实用技巧
  • 企业网站模板源码有哪些报价网站制作
  • 网站建设与网页设计实训报告二级建造师建设云网站
  • 网站后缀gov汕头网站建设小程序
  • 一个空间做多个网站wordpress大改动
  • 桂林北站到机场大巴专线时刻表wordpress 分类 标签
  • 自媒体网站源码模板dede重庆永川网站建设报价
  • 国外酷炫网站网页前端设计流程
  • 子午谷网站建设世界杯网页设计素材
  • 关于网站建设申请报告电商网站建设价位
  • 网站评价系统源码wordpress笔记本主题
  • 大庆市建设大厦网站广告设计海报
  • 惠州建设工程交易网站网络营销专业的职业生涯规划
  • 网站页面架构图阿里云的企业网站建设
  • 做微商网站有专门做网站的公司吗
  • 潍坊网站建设方案托管天津建站网
  • 前端如何做双语网站信誉好的唐山网站建设
  • 创建网站目录应注意电子商务类网站设计
  • 哪个网站专做进口商品的企业网站建设的方案ppt
  • 网站结构如何优化wordpress4.7.10漏洞
  • 官方网站举例流量型网站
  • DW个人网站怎么做长沙民企人才网
  • 电脑做网站教学友情链接交易
  • 为什么选php语言做网站重庆网站优化seo公司
  • 仿站侵权吗字体设计图片
  • 王建设医生个人网站智能网站搭建