尼罗发表小说做的的网站是哪个,厦门seo推广,品牌建设和品牌打造对企业的意义,怎么做一个国外网站乾明 发自 凹非寺 量子位 报道 | 公众号 QbitAI江湖上#xff0c;一直流传着一种叠叠乐的试炼。规则很简单#xff0c;从下方的积木中#xff0c;抽一根往上搭。你能往上搭几层#xff1f;对MIT团队研发的机器人来说#xff0c;玩这个游戏基本上不费吹灰之力。而且#x…乾明 发自 凹非寺 量子位 报道 | 公众号 QbitAI江湖上一直流传着一种叠叠乐的试炼。规则很简单从下方的积木中抽一根往上搭。你能往上搭几层对MIT团队研发的机器人来说玩这个游戏基本上不费吹灰之力。而且它只需要训练大约300次就行了一般的机器人少说也要训练上万次。研究团队说这个机器人并不醉心叠叠乐。接下来要进军工业界组装手机等消费产品等等。叠叠乐有什么难的从上面的动图中可以看出叠叠乐是一个牵一发而动全身的游戏。与国际象棋、围棋等纯粹的认知任务或者游戏不同机器人需要掌握物理技能比如探测、推、拉、放置、对齐积木等等。这就要求它必须进行交互的感知和操作这种情况是很难在计算机上模拟出来的。机器人必须要在接触积木塔的同时来学习如何移动积木。MIT的研究团队说关键的挑战在于如何利用实际上的尝试从相对较少的实验中去学习。他们给出的方法是——聚类学习视觉触觉两开花简单来说就是搜集视觉触觉数据然后对数据聚类建立相应的模型。为了搜集数据研究团队定制了一个行业标准的 ABB IRB 120机械臂。然后在机器人能够触及的范围内搭建了一个积木塔开始第一段的训练期。机械臂的配件有3个一个是用来操作积木软齿夹钳也可以反馈触感一个是用来控制操作积木的力度的力感应腕带还有一个外部摄像头用来收集视觉图像。想让机器人学会玩叠叠乐传统的做法是收集积木、机器人、积木塔之间可能发生的一切。这显然会带来大量的数据在成千上万次的尝试中寻找可行的模式耗费的计算资源可想而知。MIT研究团队的做法是模仿人类玩这个游戏的方式。在训练期中机器人会随机选择一个积木以及推动的积木的位置。 然后用较小的力道试图将积木推出塔外。对于每一次尝试计算设备都会记录相关的视觉、触觉、力度等指标并标注是否成功。按照这种方法机器人只训练大约300次就对这些测量结果进行聚类分组。比如一组数据可能代表机器人在难以移动的积木上的尝试而另一组数据则代表一个比较容易移动的积木上的尝试。对于每个数据集群研究团队都给机器人开发了一个简单的模型根据当前的视觉和触觉数据来预测移动一个积木的行为。他们说让机器人建立聚类然后学习每个聚类的模型而不是学习一个能完全捕捉可能发生的一切的模型能够极大地提高了机器人学习游戏的效率。结合这些模型机器人还会实时地“学习”当机器人小心地推动一个积木块时计算机会通过它摄像头和钳子接收视觉和触觉反馈并将这些反馈结果与机器人先前做出的动作进行比较。然后考虑这个动作的后果即是否能够在特定的结构下用特定的力度把特定的积木块抽出来放到上面并确保积木塔不倒。最后这项研究的论文已于近日刊发在了Science Robotics上。作者为Nima Fazeli、Miquel Oller、Jiajun Wu、Zheng Wu和Joshua Tenenbaum。如果你感兴趣请收好传送门See, feel, act: Hierarchical learning for complex manipulation skills with multisensory fusionhttp://robotics.sciencemag.org/content/4/26/eaav3123