公司不需要做网站了,服务器上的网站不能访问,邵阳营销型网站建设,廊坊网络公司有哪些笔记整理 | 王泽元#xff0c;浙江大学在读硕士#xff0c;研究方向为图神经网络#xff0c;对比学习。什么是外推#xff1f;指从已知数据的孤点集合中构建新的数据的方法。与插值#xff08;interpolation#xff09;类似#xff0c;但其所得的结果意义更小#xff0… 笔记整理 | 王泽元浙江大学在读硕士研究方向为图神经网络对比学习。什么是外推指从已知数据的孤点集合中构建新的数据的方法。与插值interpolation类似但其所得的结果意义更小而且更加受不确定性影响。第一张图展示了原始数据的分布现在我们对原始数据进行线性拟合得到图二其中蓝色部分就是插值所得到的结果红色部分就被称为外推所得到的结果从图三可以看出外推的点相比插值所得到的点其误差会更大作者发现前馈神经网络在学习简单多项式的时候外推的表现不好而图神经网络在比训练集大很多的网络上完成有挑战的任务如预测物理系统的演化时间、学习图算法、解决数学问题中表现的很好。作者对这种差别进行深入研究研究通过基于梯度下降训练的神经网络是如何外推的它们在训练集之外学到了什么。经过分析明确了在什么情况下多层感知机和图神经网络可以外推出良好的结果并且提供了一个假设外推的成功依赖于对模型架构和输入的非线性编码作者首先在多层感知机上进行外推实验下面四张图是文章在让两层的多层感知机上训练得到的结果。其中蓝色是训练数据、灰色是需要拟合的数据、黑色是多层感知机训练的数据。可以看出来在训练集之外多层感知机预测的结果将会快速的收敛到线性方程但是仅是需要拟合的数据是线性的并不能让多层感知机拟合的效果变好还需要添加一个条件训练集的数据分布需要涵盖所有方向。左图展示的如果涵盖的方向有差别会产生什么效果右图定量的分析了不同训练集分布会产生的误差。fix1指将一维设为常数、negd指的是限制n维为负数、all指涵盖所有数据。可以看出数据涵盖的越全面得到的误差就会越小文章之后分析了GNN文章先让图神经网络学习动态规划算法可以看到学习的动态规划算法中间有一个非线性操作min经过实验发现使用min作为aggregator操作的效果比其他操作效果更好。至此文章提出了线性算法对齐的假设及我们使用min操作对齐动态规划的dp操作图神经网络中的多层感知机就可以对齐动态规划中的线性操作。因此图神经网络可以获得良好的外推效果。由此推论我们可以得到在一些图神经网络任务中目标方程分解为线性方程和非线性方程我们可以先对输入进行非线性操作多层感知机去拟合线性部分。这样做就可以得到好的外推效果文章还发现不同的图的拓扑结构会影响不同任务的外推效果。在寻找最大节点任务中对于没有节点度数限制的图表现的效果会更好。环、阶梯图、正则图、路径这种有度数限制的图会导致外推失败。在寻找最短路径任务中过密或过于稀疏的图都会对外推造成影响。但是文章未对这些现象做出过多解释需要对图的深入研究才能回答这些问题。欢迎有兴趣的同学阅读原文。 OpenKGOpenKG中文开放知识图谱旨在推动以中文为核心的知识图谱数据的开放、互联及众包并促进知识图谱算法、工具及平台的开源开放。点击阅读原文进入 OpenKG 网站。