当前位置: 首页 > news >正文

17网一起做网站宁波市内做公司网站的公司

17网一起做网站,宁波市内做公司网站的公司,wordpress下载管理员,购物网站 购物车界面如何做来源#xff1a;AI科技评论“高等数学里程碑式的研究”#xff0c;114页论文让AI文理双修#xff0c;也许不久后机器出的高数试卷就会走进高校课堂#xff0c;这下可以说“高数题不是人出的了”。人工智能虽然给我们带来了诸多便利#xff0c;但也不免受到了各种质疑。在互… 来源AI科技评论“高等数学里程碑式的研究”114页论文让AI文理双修也许不久后机器出的高数试卷就会走进高校课堂这下可以说“高数题不是人出的了”。人工智能虽然给我们带来了诸多便利但也不免受到了各种质疑。在互联网领域表现良好的人工智能在数学领域的很多表现却被认为是“出乎意料地糟糕”。基于Transformers的语言模型在零样本和少样本等各种自然语言处理NLP任务中取得了令人难以置信的成功。但是“这些模型在解决数学问题方面基本上是失败的。”中国科学院院士、普林斯顿大学数学系和应用数学研究所教授、北京大数据研究院院长鄂维南曾表示神经网络可以帮助我们有效地表示或逼近高维函数深度神经网络是一个有效的工具它带来的影响是巨大的。以上思路更多还是基于深度学习在特征提取上的优势然而在更简单或“低维”函数的、符号逻辑层面的推理中神经网络真的毫无希望了吗回归人工智能发展萌芽阶段符号语言的思想为数理逻辑的产生和发展奠定了基础。当时人们试图将对一切事物的理解与认知化为符号语言以及符号间的推理以此思路构建的模型以符号为基底但或许可以尝试另一种思路就是先用神经网络挖掘符号的特征。在最新的一项研究中用神经网络的方法精确求解低维的数学问题被证实非常有效。值得一提的是该项研究中还用到了OpenAI Codex。作为一种生成软件源代码的深度学习模型Codex 可以理解十几种编程语言通过 API 提供的 Codex 模型在 Python 编程中也具有极强的能力它在执行编程任务时能够考虑到上下文信息包括转译、解释代码和重构代码。该研究还被其研究团队称为“第一项可以规模化自动解决、评分和生成大学水平数学课程问题”的工作打破了人们普遍认为的神经网络不能解决高等数学问题的观点。“这些所谓不成功的研究只使用了基于文本的预训练而既对文本进行预训练又对代码进行微调的神经网络可以通过程序合成成功解决大学水平的数学问题。”论文地址https://arxiv.org/pdf/2112.15594v1.pdf1秒速解高数机器学习模型真的可以解决单变量函数的图形绕轴旋转产生的体积、洛伦兹吸引子及其投影、奇异值分解SVD方法的几何图形等问题吗这项研究展示了机器学习在这方面的强大能力。机器学习模型可以大规模很好地解决麻省理工学院包括单变量微积分、多变量微积分、微分方程、概率和统计学导论在内的数学课程问题。不仅如此该团队的研究证实它还可以解决MATH数据集的问题“MATH数据集是衡量模型的数学问题解决能力的基准该数据集的主要来源是高中数学竞赛如AMC 10、AMC 12和AIME等。目前为止最先进的 Transformers 如GPT-3只对文本进行了预训练GPT-3取得的最好成绩总体准确率为6.9%并且在所有题目上的准确率都低于8.8%”。图1图中展示了模型可求解的高数问题。例如在微积分18.01-02中求由两个二维图形限定的二维区域围绕z轴旋转一周得到的体积右上在微分方程18.03中求解洛伦兹奇异吸引子右下在线性代数18.06中画出奇异值分解SVD的几何图形右下。“以前使用Transformers解决数学课程问题的工作之所以失败是由于像GPT-3一样的Transformers只在文本上进行了预训练。”研究团队认为此前工作使用验证或预测表达式树的联合训练输出虽然在解决小学水平的数学问题如MAWPS和Math23k时准确率超过80%。然而这种方法的有效性并未在高中、数学奥林匹克或大学水平的数学课程中得到扩展。后来有人通过与图神经网络GNN配对预测算术表达式树expression trees并在文本上预训练Transformers来求解大学水平问题且准确率高达95%。但是这个结果仅限于数字答案并局限于特定课程不容易扩展到其他课程。而本文的这项研究证明把问题变成编程任务进行程序合成是大规模解决数学和STEM课程的关键。“对文本进行预训练并对代码进行微调的 Transformers 可以在MATH数据集和大学水平的数学课程上取得完美表现。”如图1所示研究团队将麻省理工学院课程中的数学问题和MATH数据集进行处理并将其作为输入传给OpenAI Codex Transformers使要解决的问题转化为编程任务然后执行自动生成程序。问题不同运行程序的输出形式也不同包含数字输出形式甚至可以通过程序合成从文本中产生图片输出形式。该团队用prompt生成法prompt generation methods 使Transformers能够为每个随机抽到的问题生成带图的解题程序和方案。相比之下这项工作可以输出包括图表在内的多种模式并且不需要专门的训练就可以扩展到其他数学课程。他们还对原始问题和转化后的问题进行了对比量化并通过调查评估了生成问题的质量和难度。表1针对六门课程18.01, 18.02, 18.03, 18.05, 18.06, 6.042和MATH数据集的六个主题预-代数代数中级代数计数和概率预-微积分数论中的一些问题的解决方案。解决方案可包含数字答案、方程式和图表等。在上表所列的麻省理工学院的数学课程中使用该方法可以很好地自动解决、评分和生成问题并且所有这些都是实时的每个问题处理时间竟不到一秒。2关键研究实验题目来自麻省理工学院六门课程中随机抽取的25个问题和MATH数据集的六个主题中各随机抽取5个问题。并且为了说明他们的研究结果不是过度拟合训练数据他们还用了在训练期间网上查不到的新的应用线性代数课程COMS3251来进行验证。技术代替人进行解题时并不是使用技术对问题进行重大修改而是努力提取问题的本质因此该团队使用Codex对问题进行了整理。图2问题的扩充和重组得到正确的Codex输出。上图中显示了使用Codex将课程问题转化为编程任务并运行程序以解决数学问题的方法。每个面板的左半部分显示了原始问题和通过添加问题背景、互动或简化后而重新表述的问题。添加问题背景是非常有必要的对学生和程序来说解题域是选择合适的解题方法的必要信息。例如如果没有问题背景一个关于网络的问题可能是关于神经网络的问题也可能是关于通信网络的问题。面板A中对微积分方程问题的主题背景进行了补充将其重新表述为一个编程任务的问题。补充背景包括澄清含糊不清的定义和运算符或有一个以上标准用法的符号说明学生通过学习课程就会知道的隐含假设包括课程的主题或课题指出学生从与问题相关的讲座或教科书章节中学到的适当方法。面板B中使用了Python库、sympy库和streamplot库的背景用于解题和绘制可视化图。如果程序的语法与Python版本不兼容或者数据类型有错误又或者没有使用库合成程序在执行中可能无法得到正确的答案。面板C中显示了概率和统计学中的一个例子原始问题被转化为生成模拟的概率编程任务。在做题时学生可以从课程的主题和涵盖的材料中得到一些信息在这个过程中要通过了解问题背景确定所需要的是什么类型的答案对处理形式有一个合理预期。例如概率或组合学中的许多问题可能需要用阶乘、组合函数或指数来回答。因此在实验中也必须要提供背景以便用正确的方法来处理问题。面板D考虑到NLP模型在处理长而复杂的文本方面有困难因此将较长的问题分解成了具体的编程任务并删除了多余的信息。通过互动产生了多个图交互式使用Codex可以使可视化图很好地被绘制出来并且可以发现缺失的功能或需要的库。面板E来自《计算机科学数学》对问题进行了简化处理简化包括删除多余的信息将长的句子结构分解成较小的组成部分并将提示转换为编程格式。概括提炼出简洁的提示和一系列较短的问题可以提高Codex性能。除此之外他们还考虑了原始课程问题转化为Codex 提示的三种情况原样提示。原始问题和Codex 提示是相同的自动提示转换。原始问题和Codex提示不同Codex提示是由其本身自动生成的手动提示转换。原始问题和Codex提示不同Codex提示是由人生成的。当把问题转化为Codex提示时又出现了一个关键性的问题原始问题与之后产生正确答案的提示在语义上的接近程度如何图3按课程和类别划分的所有问题的余弦相似度分布。如图3所示为了测量原始问题和转化后之间的差距他们使用Sentence-BERT嵌入之间的余弦相似度。Sentence-BERT使用siamese和triplet网络结构对预训练的BERT模型进行了微调。Sentence-BERT能够在句子层面上产生语义嵌入从而可以在长篇文本中进行语义相似度比较。应用他们的方法对于难度较低的课程修改少量原始问题高余弦相似度分数就可以达到Codex提示输出一个提供正确答案的程序。而每个框图左边的线代表每门课程的基准相似度分数通过平均每门课程中所有这样的问题组之间的相似度计算得出。他们还做了原始问题和产生正确答案的转换版本之间的相似性分数的直方图用来评估。图4最右边的一列代表了按原样或做了非常小的改动就能正确回答问题所占的百分比。使用Codex进行提示生成也会产生一些问题。在某些课程中直接用未经转化的原始问题来提示Codex并不能得到正确的答案。因此需要将原始问题的形式进行转化他们将其主要分为三类主题背景。为Codex提供与一般课程和具体问题相关的主题和副主题可以帮助指导Codex产生正确答案。例如对于概率中的条件预期问题提供有关贝叶斯定理、预期值等背景。库背景。为Codex提供解决特定问题所需的编程包/库也是非常有帮助的。例如引导Codex使用Python中的Numpy包以解决线性代数问题。定义背景。很多时候Codex缺乏某些术语的定义基础。例如Codex并不清楚扑克牌中 Full House 的含义。明确这些术语的定义并让Codex理解它们可以更好地指导其程序合成。此外他们还使用Codex通过从数据集中创建一个有编号的问题列表为每门课程生成了新的问题。这个列表在生成随机数量的问题后会被切断其结果将用于提示Codex生成下一个问题。重复进行此过程就可以为每门课程生成许多新问题。图5学生调查问题。学生要对60个问题中的每一个问题进行评分。如上图所示他们还在麻省理工学院和哥伦比亚大学选修过这些课程或其同等课程的学生中进行了长时间调查比较了机器生成的问题和人写的问题在每门课程中的质量和难度。图6. 学生调查结果。A组基于学生的评分比较了人工编写的问题和本文研究方法为每门课程产生的问题的难度。该图显示了1最容易和5最难之间的难度评分的平均值以及它们的95%置信区间。B组显示的是人工编写的和机器生成的问题被评为适合和不适合该课程的百分比。C组显示了被评为人写的或机器生成的问题的百分比。然而该研究还有一些局限性如Codex只能接受基于文本的输入因此该团队的方法无法对输入图像进行处理无法回答带有必要视觉组成部分的问题如数字或图表。其次本研究没有涉及高级数学证明的问题他们强调这是研究的广度所带来的限制而不是Codex的限制。并且他们的方法最后一步是通过执行一个程序来完成的例如使用Python解释器存在局限性。此外理论上复杂性结果也不适用于本研究解决的具体实例。3总结该团队的研究证明对文本进行预训练并对代码进行微调的 Transformers能够解决训练能够通过程序合成解决、评定和生成大学水平的数学问题。问题集的生成和分析进一步验证了这些惊人的结果。这项研究成功证实了现代程序设计语言可以作为一种替代性的表述和计算环境。由他们的方法不需要额外的训练就可以扩展到其它STEM课程并且可以给高等教育带来巨大的帮助。他们的研究证实了用现代编程语言进行的神经网络合成是更有活力和广泛适用的有可能解决更广泛的问题。尽管任何有限的计算都可以被表示为足够大的表达式树但人们可能会看到所需的表达式树的大小可能是任意大的。与图灵完备语言相比这种灵活性得到了加强因为已经存在的大量程序语料库让可用的标记表达式树的数量黯然失色。“程序输出在本质上也更适合人类阅读。因为使用抽象化、模块化和高级逻辑的能力可以更清晰地说明解决问题的方法。”此外程序生成可以通过解释性的注释以及函数和变量的名称直接传达逻辑推论。值得一提的是在他们的这项研究中在Codex的一些输出中看到了这样的解释文字和推导。“这种正式和非正式语言的统一是我们方法论的一个固有的优势。”参考资料1. CQ Choi, 7 revealing ways AIs fail: Neural networks can be disastrously brittle, forgetful, and surprisingly bad at math. IEEE Spectr. 58, 42–47 (2021)未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市大脑研究计划构建互联网城市大脑技术和企业图谱为提升企业行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。  如果您对实验室的研究感兴趣欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”
http://www.pierceye.com/news/49933/

相关文章:

  • 新手学建设网站书籍网站首页ico怎么做
  • 网站建设行情网站如何做付费
  • 公司网站建设费属于宣传费吗建设网站 请示 报告
  • 企业网站公告怎么做天商阳光网站邮箱
  • 石家庄外贸做网站手机怎么安装网站程序
  • 东莞最近三天的新闻大事搜索引擎优化方案模板
  • 做网站asp用什么软件重庆制作网站模板建站公司
  • 网站群建设原则洛阳哪家网站做的好
  • 哪个小说网站版权做的好处做网站应该用什么配置的手提电脑
  • 织梦网站做站群长春网站设计网站建设网站制作880元
  • 做网站建设需要做哪些工作济南做网站互联网公司有哪些
  • 宁夏住房城乡建设厅网站怎样成立网站
  • 网站策划方案自建网站系统
  • 做网站电脑和手机都是一样可以看吗wordpress 自定义搜索
  • 网站建设简介淄博php 建设网站制作
  • 常州网站建设公司信息精品ppt模板免费下载
  • 美食网站设计目的个人网站代码编写
  • 提供零基础网站建设教学培训wordpress 群晖 局域网
  • dw网站建设怎么放在网上wordpress英文导航模板
  • wordpress网站模版永登网站设计与建设
  • 网站中木马怎么办推广软文范例大全500
  • 手机端网站开发价格朝阳网络推广公司
  • 网站建设优化过程中的优化策略网站建设招标评分标准
  • 网站建设云服务做番号网站的 违法
  • 网站 文章排版健康陕西app管理端最新版
  • 浏览器网站建设的步骤过程oppo商城
  • 网站平台建设方案wordpress 七牛
  • 山东新华电脑学院学网站开发wordpress词汇插件
  • 建设工程安全管理网站郴州人为什么不像湖南人
  • seo站长工具推广平台行业门户网站大全