建设网站前的需求分析,如何建立淘宝客网站,网站优化 价格,在崇左app官方网下载概要#xff1a;中国工程程院院士、北京大学教授高文应邀参加JDD京东金融全球数据探索者大会#xff0c;并进行了以“探索大数据#xff0c;迎接人工智能时代”为主题的演讲。 来源#xff1a;亿欧 11月6日#xff0c;京东举行JDD京东金融全球数据探索者大会#xff0c;在… 概要中国工程程院院士、北京大学教授高文应邀参加JDD京东金融全球数据探索者大会并进行了以“探索大数据迎接人工智能时代”为主题的演讲。 来源亿欧 11月6日京东举行JDD京东金融全球数据探索者大会在全球范围内寻求志同道合的伙伴共同探索大数据和人工智能在金融领域的最佳实践。中国工程程院院士、北京大学教授高文应邀做会议演讲演讲主题为“探索大数据迎接人工智能时代”。 高文院士重点观点如下 要满足三个条件AI系统就不需要外部数据的支持。这三个条件是集合是封闭的规则是完备的约束是有限的不可以有递归。 人工智能现在大概发展到“刚上小学”的阶段后面还有很长的路要走人工智能至少还有10-20年的好日子过。 人工智能的发展还是要靠学习、靠知其所以然的研究。 一、大数据时代 我们现在这个时代确实是已经从大数据时代移到人工智能时代。为什么这样讲呢实际上这和大数据本身的内涵关联性比较强。我们知道大数据本身的规模越来越大从原来的EB级正在往ZB级发展数据本身在不停地增加我们称为数据泛滥。这个数据泛滥包括很多比如和零售相关有很多数据再早一点是科学的数据不管哪种数据都是和网络关联的个人自媒体出来以后网络数据又非常多。 以前大家都把它叫做大数据最近有一个讲法大数据不是规模大而是垃圾多的数据叫大数据利用率低的数据。比如视频数据、网络的个人数据。大数据本身的概念越来越大但这个数据大了以后到底怎么使用怎么发展最近一段时间大家都深入讨论。 比如说数据是不是越大越好是不是什么东西都一定要一个数据回答是No。最近有一个非常好的案例Alpha Go下围棋以前是需要使用人类下围棋的数据同时自己尝试了三千万局的数据最近的Alpha Zero不需要人类对弈数据了自己会生产数据。现在我们就可以提问什么样的情况不需要外部数据自己生产数据就够了我和有些专家讨论觉得什么样的AI系统不需要外部数据就可以战胜人实际上就是满足三个条件 1、集合是封闭的不管你是状态集还是什么集你的集合是封闭的我们知道围棋集合是封闭的。 2、规则是完备的。也就是说下棋什么地方能下什么地方不能下这个规则是完全完备的不能随便更改。 3、约束是有限的也就是说你在约束条件下不可以递规因为有了递规之后往下推延就停不下来而有限的时候就能停下来。满足这三个条件不需要外部数据系统自己产生数据就够了。所以可以想见今后有很多的情况你去判断这个人和机器最后谁能赢满足这三个条件机器一定赢不管德扑、围棋类似的情况很多了。 是不是所有的情况都是这样当然不是。你可以看现在很多的交易、物流、零售其实它有很多的条件一直在变不满足刚才的条件这时候你需要很多外部的数据。有外部数据就够了当然不是外部数据怎么用它自己不会去产生一个用法这个用法需要人需要通过人工智能这些手段去用这些数据。所以人工智能实际上就是从大数据科学到人工智能非常自然的迁移过程。 二、人工智能时代 人工智能发展阶段 最近人工智能非常热热到每一个人每一个投资人都说我要投人工智能或者我要干人工智能这件事好不好呢不知道。但我们可以看看历史以史为鉴可以知道很多事情人工智能发展到去年刚好是60年。我们看看60年的发展实际上是经历了三个阶段 第一个阶段20年1956年到1976年。第二个阶段从1976到2006年30年2006年是第三波浪潮刚刚开始它会持续多长时间不知道可能25年可能35年也可能是40年。当然按照20、30下面到底是40年、30年甚至60年都不知道。但你知道这个规律就应该知道人工智能绝不是已经把所有的事情做完了如果用人的一生来比喻人工智能其实现在大概刚上小学有的还不到小学所以现在它的历程可能只是1/10后面有很长的路可走。 在人工智能路上有很多关键人物不能忘记图灵不能忘记计算机领域特别重要的一个奖图灵奖其他学科有诺贝尔奖诺贝尔时代没有计算机后来有了计算机以后大家就想计算机界也应该设一个和诺贝尔奖相当的奖这个奖就是图灵奖现在全世界一共65个人得了一个图灵奖姚期智教授是华人当中唯一得到图灵奖的。 在人工智能领域得到图灵奖的一共8位马文·明斯基1969约翰·麦卡锡1971艾伦·纽厄尔1975赫伯特·西蒙1975爱德华·费根1994拉吉·瑞迪1994莱斯利·瓦伦特2010犹大·伯尔2011。整个计算机科学领域人工智能实际上是插在宝塔尖的1/8。莱斯利·瓦伦特犹大·伯尔后面这两位是2010年和2011年获奖都是和概率推理、概率学习、因果学习有关的两个学者。 总体来说人工智能到现在有三个主要的代表性的学派哪三个呢 第一个是用逻辑的方法做人工智能通常我们把它叫做逻辑主义学派或者叫做符号主义学派。 第二个是以连接主义为基本工具就是用神经元网络今天的深度学习就是它一个典型的代表 第三个学派从搞控制论的人比较主张的一个学派更多的是做这种自适应和进化、计算。这三个学派里各有千秋不能说哪个好哪个坏。 什么叫人工智能我们今后可能就是人类智能和人工智能的一个对决其实人工智能是人类智能的一个计算机的实现从对决的角度它永远不可能超过人类智能只是说在某一个特定的方面它可能胜出但从智能本身它没办法胜出。我们看看智能的定义其实智能有很多方面包括逻辑能力语言能力、空间能力、感知能力包括音乐感知的能力肢体的控制能力。后面这几个是比较难的包括人的内省、自我反省包括人际关系的能力包括自然探索的能力比如发现一些新的东西完全没有任何线索你能想出我要做这个我把这个问题解决掉。自然探索的能力包括图像、图形的感知能力。 其实智能分为这九个能力而现在的人工智能在这九个方面只有三个做的还可以有六个方面还相当的远所以我们说现在的人工智能要想挑战人类智能路还很长。 为什么我们说人工智能60年呢因为1956年当时有一个里程碑式的会议达特茅斯会议。当时人工智能这几个元老还很年轻他们集聚到一起开了两个月的会讨论怎么样让机器具有人的智能、定出了人工智能的最终目标以及什么叫人工智能。现在看起来1956年定义的人工智能的白皮书到现在一点都不过时。所以我们说年轻人还是非常厉害的三四十岁的年轻人在计算机刚刚兴起的时候连人工智能概念都还没有他们就提出来我们要怎么做这个东西这是非常了不起的一件事现在看起来确实他们做的是对的。 这次会议开了以后全世界很多学校都开始跨入到人工智能热潮当中典型的像斯坦福大学、CMU、MIT、哈佛大学很多人都在做相关的这些研究那个阶段大家采用的技术手段主要是逻辑主义或者符号主义。 什么叫逻辑或者符号呢实际上就是他认为一切的推理我都可以用逻辑演算的方式来实现我只要定义了整个逻辑演算的体系做一个规则就可以完成任何事可以进行推理、数学证明可以创作、奏乐等等。其实我们小学就学过代数运算逻辑也是一种运算但它不是用的代数运算而是布尔运算和代数运算非常接近。有了这个运算就可以对它进行推理推理你要使用一个工具他们使用了演绎推理的工具。 我们知道到现在为止最主要的自然科学的定理使用的都是演绎推理的方式来完成的。比如说亚里士多德的三段论体系就是非常典型的演绎推理欧几里得的几何学也是用这样完成的牛顿力学麦克斯韦、爱因斯坦全都是用演绎定理推出来的。 所有演绎推理的基础是满足三段论方程什么叫三段论我有一个大前提这是一个一般的原理我有一个小前提是我要研究的特殊情况根据大前提、小前提得到一个结论这个结论是根据一般情况对特殊情况做出一个判断这就完成了演绎推理这就叫三段演绎推理。 所有的基础逻辑的方法都是这样做的为了做这个当时设计了很多的人工智能语言用这种语言可以写人工智能的方程机器就可以去证明。 当然这听起来很好而且第一次浪潮大家都认为十年之内人工智能一定可以完成很多事但一直到1976年前后大家发现一开始定的那么高调的东西绝大多数都实现不了加上当时有人落井下石。1973年有一个英国人发了一个报告给AI拨一大盆冷水。 他把AI研究分三类系统A是指自动机、B是机器人、C为中央神经系统。自动机和中央神经系统研究是有价值的但进展太慢机器人的研究毫无价值而且非常令人失望所以他建议把所有的机器人研究都取消掉A和C因为它本身令人失望所以也是非常低调。这个报告出来以后各国政府全部都把对人工智能投入的经费砍掉马上就进入了严冬。所以1976年实际上是人工智能第一次的严冬的到来。 1976年之后尽管没有经费但学者的可爱之处是给钱也做不给钱也做。因为做逻辑的前面已经把自己的体量拉的很大。当时做神经网络的基本上没有得到什么钱所以本身就是教授带几个学生在那玩这个领域虽然面临寒冬了但对他来讲没有变化反正盛夏的时候没有钱寒冬的时候还是没钱所以带着学生继续玩。 这一玩玩出花样来1976年开始有很多做神经元网络的不停的写东西、发东西一直到1986年出来一个让人眼睛一亮的东西这个东西叫BP算法即误差反传网络。以往的神经元网络只能做非常小的事做不了大事。但这个东西出来以后可以做大事了所以就推动了这个领域发展的速度非常快。 但它也只能解决一些问题。一开始人们也是期待要解决很多问题但遥遥无期到最后又来了第二次的低谷包括日本第五代机的失败当时在斯坦福大学要建一个知识百科全书的项目都失败了使得第二次人工智能又跌入了低谷。 第三次是从2006年开始的现在是人工智能的三个大牛一位在多伦多大学Geoffrey Hinton一位在蒙特利尔大学Yoshua Bingeo一位在纽约大学Yann LeCun这一年分别发表了三篇文章在讲一件事。这个文章出来了以后当时大家并不知道这个东西要怎么用这个东西被谁给激活了李凯和李飞飞做的ImageNet主要操刀是李飞飞做的。 ImageNet是一个全球的图像识别比赛在2012年以前都是用常规的方法2012年开始有一个参赛队用了这个方法比别的队错误率马上降低了一半。到2013年其它方法全部退出全都是深度学习2014年不停地改进。所以可以看出2015年的时候错误率已经降的非常多深度学习的网络也非常多。到2016年的时候几乎做到不光人没法比错误率已经低到不需要再做了所以李飞飞选择2017年宣布这个比赛停止不再做了因为其实已经没有太大促进意义了。 所以今天的第三轮由于深度学习由于刚才所说的产业界的热情参与我们产生了很多新的企业有很多新的机遇这是非常好的事。 人工智能发展机遇 在这个机遇下国家干了什么国家有一个中国人工智能2.0的发展战略研究这是中国工程院一起来搞的今年发布了一个重大研究计划这里面主要是做五个关键技术和一批应用。12月14日亿欧将在北京举办2017AI产业应用峰会科技部撰写《中国人工智能2.0规划编制》的专家李修全博士将出席现场。 这五个关键技术包括大数据智能这和前面讲的大数据关联性非常强。第二个方面是群体智能依靠群体的力量推进智能的研究。第三个是跨媒体智能要把声音、图像、文字、自然语言所有这些东西联结在一起来研究智能这是跨媒体智能未来所希望达到的目标。第四个是人机混合增强智能人和机器混合起来怎么样让智能更高能力更强。第五个是自主智能系统其实就是无人机。我们有五个支柱上面是应用下面是基础支撑。 那么这样一个轮廓在国家战略上来说已经进行了非常圆满的布局这个是不是够了其实还不是。如果看整个人工智能学科的轮廓包括计算机视觉、语言识别、自然语言、人机交互、机器人学习等等这样的方向这些方面目前大的布局是沉浸到应用这个方面。 涉及到人的九类智能我们在逻辑语言文字和图形图像来说现在已经做的相当不错中间六类还是有相当的距离需要探索。 总结一下历史总是这样螺旋前进的人工智能的三次浪潮也是从符号主义到连接主义。这个符号主义到现在为止已经有30多年比较寂寞了但它作为人类智能的一个高等抽象应该是发挥作用的所以怎么发挥作用这个是未来大家可以慢慢观察。 连接主义就是神经元网络、深度学习目前是非常大行其道的但怎么样解决小数据甚至没有数据的学习实际还是有相当大的挑战特别是很多的学习结果是不可解释的这是最大的挑战。行为主义是注重自适应和进化这是从人从猴子演化过来它可能更接近。它怎么样在学习方面做得更好还是需要探索。 不管是企业、国家投资大家利用好天时地利要好好干一场。我想人工智能肯定至少还有10年到20年左右的好日子过大家珍惜这个机会。当然人工智能既然是一个少年少年主要的成长靠什么靠学习靠知其所以然的学习的研究中国下一代人工智能也会在这个方面进行一些布局知道今后的方向也许对在座各位会有点帮助。