在社保网站上怎么做员工的退费,设计平面创意,一个可以做行程的网站,做网站需要那些软件来源#xff1a;AI前线作者#xff1a;Gary Marcus策划#xff1a;孙瑞瑞如果你仔细观察就会发现#xff0c;最新的系统#xff0c;包括 DeepMind 大肆宣传的 Gato#xff0c;仍然被同样的老问题所困扰。在普通人看来#xff0c;人工智能#xff08;AI#xff09;领域… 来源AI前线作者Gary Marcus策划孙瑞瑞如果你仔细观察就会发现最新的系统包括 DeepMind 大肆宣传的 Gato仍然被同样的老问题所困扰。在普通人看来人工智能AI领域似乎正在取得巨大的进步。比如一些新闻稿和富有感染力的媒体账号的报道OpenAI 的 DALL·E 2一种人工智能程序似乎可以根据任何文本的描述创建出壮观的图像另一个名为 GPT-3一个自回归语言模型的 OpenAI 系统可以谈论任何事情Alphabet 旗下 DeepMind 在今年 5 月发布了一个名为 Gato 的系统该系统似乎已经能够很好地完成 Alphabet 交给它的每一项任务。DeepMind 的一位高管甚至吹嘘说在追求具有人类智慧的灵活性和智谋的通用人工智能AGI的道路上“The Game is Over!” 埃隆·马斯克Elon Musk最近也表示如果我们在 2029 年之前还没有实现通用人工智能AGI他会感到非常惊讶。但我想说的是千万不要被这些信息所愚弄。机器有朝一日可能会像人类一样聪明甚至可能会比人类更加聪明但这场游戏远未结束。在制造出真正能够理解和推理我们周围世界的 AI 机器方面我们还有很多事情要做。我们现在真正需要的是少一点装腔作势多做一些基础的研究。可以肯定的是人工智能确实在某些方面取得了进展比如合成图像看起来越来越逼真语音识别可以在嘈杂的环境下工作。但这距离我们所追求的人类级别的通用人工智能还很远比如可以理解文章和视频的真正含义或处理各种意想不到的障碍和干扰。我们仍然面临着多年来一直存在的挑战让人工智能变得可靠让它能够应对不同寻常的情况。以最近著名的 Gato 为例它被称为“万事通”我们来看一下它是如何为一张投球手投掷棒球的图片配上文字说明的。系统返回三种不同的答案分别是“棒球运动员在棒球场上投球”、“一个人在棒球场上向投球手投球”和“在棒球比赛中一名击球手和一名在泥土中的接球手”。除了第一个答案是正确的其他两个答案都包括了在图像中看不到的其他玩家的“幻觉”信息。该系统并不知道图片中的实际内容而是识别出大致相似图像中的典型内容。任何一个棒球迷都知道这是投球手刚刚扔出的球而不是反过来——虽然我们知道接球手和击球手就在附近但他们很明显没有出现在图像中。图片来源Bluesguy来自 NY/Flickr同样DALL-E 2 无法区分“蓝色立方体顶部的红色立方体”和“红色立方体顶部的蓝色立方体”之间的区别。今年 5 月发布的新版系统也仍然无法分辨“宇航员骑着马”和“马骑着骑宇航员”之间的区别。图片来源Imagen摘自 Chitwan Saharia 等人的“具有深度语言理解的照片级真实感文本到图像扩散模型”。当你看到像 DALL-E 这样的系统出错时可能觉得结果很有趣但是如果其他的 AI 发生错误会导致严重的问题。举个例子最近一辆自动驾驶的特斯拉Tesla直接向一名拿着停车标志的工作人员开过去并且只有在司机干预时才减速。该系统可以识别人类自身就像他们在训练数据中出现的那样)也可以识别他们通常的停车标识位置就像他们在训练图像中出现的那样但当遇到这两种情况组合在一起时对系统来说停车标识处于一个不寻常的位置它便无法减速。不幸的是事实上这些系统仍然不可靠并试图让大家注意不到这些信息。Gato 在 DeepMind 报告的所有任务中都表现良好但很少像其他当代系统那样出色。GPT-3 常常能写出流畅的散文但仍然难以完成基本的算术而且它对现实情况的掌控力非常有限容易写出诸如“一些专家认为吃袜子的行为有助于大脑从冥想导致的改变状态中走出来”这样的句子但从来没有专家说过这样的话。如果你粗略地看一下近期的头条新闻却都不会告诉你这些问题。这里的次要背景是人工智能领域最大的研究团队不再出现在学术界而是出现在企业中——同行评议曾是学术界的头等大事。与大学不同企业没有公平竞争的动机。企业没有把引人注意的最新论文提交给学术审查而是通过新闻稿的方式发表吸引记者并避开同行评审。这样我们只知道他们想让我们知道的东西。在软件行业中有一个词来形容这种策略: demoware试用软件这种设计在演示过程中看起来不错但在现实世界中却不一定足够好。通常试用软件会变成雾化太监软件是为了震慑竞争对手而发布但却永远不会发布的产品。不过最终还是会自食其果。冷聚变可能听起来很棒但你在商场里还是买不到。人工智能的代价很可能是一个充满失望预期的冬天。太多的产品比如无人驾驶汽车、自动放射科医生和通用数字代理已经被各种演示并公开但从未交付使用。就目前而言投资资金一直在兑现谁会不喜欢自动驾驶汽车呢?但如果可靠性和应对异常值等核心问题一直得不到解决投资就会枯竭。我们除了制造许多深层假象、留下碳排放量庞大的网络以及在机器翻译、语音识别和物体识别方面的进展除了这些过早的炒作之外其他方面的进展就太少了。深度学习提高了机器识别数据模式的能力但它有三个主要缺陷。讽刺的是它学到的模式是肤浅的而不是概念性的它产生的结果很难解释并且这些结果很难用于其他过程比如记忆和推理。正如哈佛大学计算机科学家 Les Valiant 指出的那样“未来的核心挑战是统一制定……学习和推理的构想。”如果你不能真正理解停车标志是什么你是无法对付一个拿着停车标志的人的。目前我们被困在一个 局部最低限度 的困境中公司追求的是基准而不是基础性的想法他们一直用已经拥有的技术进行小规模的改进而不是停下来追寻更本质性的问题。但我们需要更多的人提出一些本质的问题比如如何构建既能学习又能推理的系统而不是追求直接面向媒体的酷炫的演示。相反目前的工程实践远远领先于科学技能并且在努力地使用尚未完全理解的工具而不是开发新工具和更清晰的理论基础这也是为什么基础研究仍然至关重要。人工智能研究界的大部分人比如那些高呼“游戏结束”的人甚至没有看到这一点这是令人心碎的。想象一下如果一些外星人只通过低头看地上的影子来研究所有的人类互动它注意到一些影子比其他的大而且所有的影子在晚上都会消失甚至可能注意到影子在某些周期性的间隔内有规律地增长和缩小但却不曾抬头看看太阳也没有认识上面的三维世界。人工智能研究人员是时候该抬头看一看了我们不能再仅靠 PR 来“解决 AI”。注这是一篇观点和分析文章作者或作者所表达的观点不一定是《科学美国人》的观点。文章来源https://www.scientificamerican.com/article/artificial-general-intelligence-is-not-as-imminent-as-you-might-think1/作者介绍Gary Marcus 是一位科学家畅销书作家和企业家以与深度学习先驱 Yoshua Bengio 和 Yann LeCun 的辩论而闻名。他是 Geometric Intelligence 的创始人兼首席执行官这是一家于 2016 年被 Uber 收购的机器学习公司也是 Robust AI 的创始人。他是五本书的作者包括 The Algebraic MindKlugeThe Birth of the Mind 和 The New York Times 畅销书 Guitar Zero。他最近与欧内斯特·戴维斯Ernest Davis合著的《重启人工智能》Rebooting AI是福布斯关于人工智能的 7 本必读书籍之一。自 1992 年发表第一篇论文以来他一直是认知和人工智能混合模型的拥护者。未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市大脑研究计划构建互联网城市大脑技术和企业图谱为提升企业行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。 如果您对实验室的研究感兴趣欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”