在线网站排名工具,跨境电商卖什么产品最赚钱,山东泰安网络推广,做名片哪个网站可以找作者#xff1a;Chase Roberts编译#xff1a;ronghuaiyang导读养成良好的单元测试的习惯#xff0c;真的是受益终身的#xff0c;特别是机器学习代码#xff0c;有些bug真不是看看就能看出来的。在过去的一年里#xff0c;我把大部分的工作时间都花在了深度学习研究和实…作者Chase Roberts编译ronghuaiyang导读养成良好的单元测试的习惯真的是受益终身的特别是机器学习代码有些bug真不是看看就能看出来的。在过去的一年里我把大部分的工作时间都花在了深度学习研究和实习上。那一年我犯了很多大错误这些错误不仅帮助我了解了ML还帮助我了解了如何正确而稳健地设计这些系统。我在谷歌Brain学到的一个主要原则是单元测试可以决定算法的成败可以为你节省数周的调试和训练时间。然而在如何为神经网络代码编写单元测试方面似乎没有一个可靠的在线教程。即使是像OpenAI这样的地方也只是通过盯着他们代码的每一行并试着思考为什么它会导致bug来发现bug的。显然我们大多数人都没有这样的时间所以希望本教程能够帮助你开始理智地测试你的系统让我们从一个简单的例子开始。试着找出这段代码中的错误。def make_convnet(input_image): net slim.conv2d(input_image, 32, [11, 11], scopeconv1_11x11) net slim.conv2d(input_image, 64, [5, 5], scopeconv2_5x5) net slim.max_pool2d(net, [4, 4], stride4, scopepool1) net slim.conv2d(input_image, 64, [5, 5], scopeconv3_5x5) net slim.conv2d(input_image, 128, [3, 3], scopeconv4_3x3) net slim.max_pool2d(net, [2, 2], scopepool2) net slim.conv2d(input_image, 128, [3, 3], scopeconv5_3x3) net slim.max_pool2d(net, [2, 2], scopepool3) net slim.conv2d(input_image, 32, [1, 1], scopeconv6_1x1) return net你看到了吗网络实际上并没有堆积起来。在编写这段代码时我复制并粘贴了slim.conv2d(…)行并且只修改了内核大小而没有修改实际的输入。我很不好意思地说这件事在一周前就发生在我身上了……但这是很重要的一课由于一些原因这些bug很难捕获。这段代码不会崩溃不会产生错误甚至不会变慢。这个网络仍在运行损失仍将下降。几个小时后这些值就会收敛但结果却非常糟糕让你摸不着头脑不知道需要修复什么。当你唯一的反馈是最终的验证错误时你惟一需要搜索的地方就是你的整个网络体系结构。不用说你需要一个更好的系统。那么在我们进行完整的多日训练之前我们如何真正抓住这个机会呢关于这个最容易注意到的是层的值实际上不会到达函数外的任何其他张量。假设我们有某种类型的损失和一个优化器这些张量永远不会得到优化所以它们总是有它们的默认值。我们可以通过简单的训练步骤和前后对比来检测它。def test_convnet(): image tf.placeholder(tf.float32, (None, 100, 100, 3) model Model(image) sess tf.Session() sess.run(tf.global_variables_initializer()) before sess.run(tf.trainable_variables()) _ sess.run(model.train, feed_dict{ image: np.ones((1, 100, 100, 3)), }) after sess.run(tf.trainable_variables()) for b, a, n in zip(before, after): # Make sure something changed. assert (b ! a).any()在不到15行代码中我们现在验证了至少我们创建的所有变量都得到了训练。这个测试超级简单超级有用。假设我们修复了前面的问题现在我们要开始添加一些批归一化。看看你能否发现这个bug。 def make_convnet(image_input): # Try to normalize the input before convoluting net slim.batch_norm(image_input) net slim.conv2d(net, 32, [11, 11], scopeconv1_11x11) net slim.conv2d(net, 64, [5, 5], scopeconv2_5x5) net slim.max_pool2d(net, [4, 4], stride4, scopepool1) net slim.conv2d(net, 64, [5, 5], scopeconv3_5x5) net slim.conv2d(net, 128, [3, 3], scopeconv4_3x3) net slim.max_pool2d(net, [2, 2], scopepool2) net slim.conv2d(net, 128, [3, 3], scopeconv5_3x3) net slim.max_pool2d(net, [2, 2], scopepool3) net slim.conv2d(net, 32, [1, 1], scopeconv6_1x1) return net你看到了吗这个非常微妙。您可以看到在tensorflow batch_norm中is_training的默认值是False所以添加这行代码并不能使你在训练期间的输入正常化值得庆幸的是我们编写的最后一个单元测试将立即发现这个问题(我知道因为这是三天前发生在我身上的事。)再看一个例子。这实际上来自我一天看到的一篇文章(https://www.reddit.com/r/MachineLearning/comments/6qyvvg/p_tensorflow_response_is_making_no_sense/)。我不会讲太多细节但是基本上这个人想要创建一个输出范围为(0,1)的分类器。class Model: def __init__(self, input, labels): Classifier model Args: input: Input tensor of size (None, input_dims) label: Label tensor of size (None, 1). Should be of type tf.int32. prediction self.make_network(input) # Prediction size is (None, 1). self.loss tf.nn.softmax_cross_entropy_with_logits( logitsprediction, labelslabels) self.train_op tf.train.AdamOptimizer().minimize(self.loss)注意到这个错误吗这是真的很难提前发现并可能导致超级混乱的结果。基本上这里发生的是预测只有一个输出当你将softmax交叉熵应用到它上时它的损失总是0。一个简单的测试方法是确保损失不为0。def test_loss(): in_tensor tf.placeholder(tf.float32, (None, 3)) labels tf.placeholder(tf.int32, None, 1)) model Model(in_tensor, labels) sess tf.Session() loss sess.run(model.loss, feed_dict{ in_tensor:np.ones(1, 3), labels:[[1]] }) assert loss ! 0另一个很好的测试与我们的第一个测试类似但是是反向的。你可以确保只有你想训练的变量得到了训练。以GAN为例。出现的一个常见错误是在进行优化时不小心忘记设置要训练的变量。这样的代码经常发生。class GAN: def __init__(self, z_vector, true_images): # Pretend these are implemented. with tf.variable_scope(gen): self.make_geneator(z_vector) with tf.variable_scope(des): self.make_descriminator(true_images) opt tf.AdamOptimizer() train_descrim opt.minimize(self.descrim_loss) train_gen opt.minimize(self.gen_loss)这里最大的问题是优化器有一个默认设置来优化所有变量。在像GANs这样的高级架构中这是对你所有训练时间的死刑判决。但是你可以通过编写这样的测试来轻松地发现这些错误:def test_gen_training(): model Model sess tf.Session() gen_vars tf.get_collection(tf.GraphKeys.VARIABLES, scopegen) des_vars tf.get_collection(tf.GraphKeys.VARIABLES, scopedes) before_gen sess.run(gen_vars) before_des sess.run(des_vars) # Train the generator. sess.run(model.train_gen) after_gen sess.run(gen_vars) after_des sess.run(des_vars) # Make sure the generator variables changed. for b,a in zip(before_gen, after_gen): assert (a ! b).any() # Make sure descriminator did NOT change. for b,a in zip(before_des, after_des): assert (a b).all()可以为鉴别器编写一个非常类似的测试。同样的测试也可以用于许多强化学习算法。许多行为-批评模型有单独的网络需要根据不同的损失进行优化。下面是一些我推荐你进行测试的模式。让测试具有确定性。如果一个测试以一种奇怪的方式失败却永远无法重现这个错误那就太糟糕了。如果你真的想要随机输入确保使用种子随机数这样你就可以轻松地重新运行测试。保持测试简短。不要使用单元测试来训练收敛性并检查验证集。这样做是在浪费自己的时间。确保你在每个测试之间重置了计算图。总之这些黑箱算法仍然有很多方法需要测试花一个小时写一个测试可以节省你几天的重新运行训练模型并可以大大提高你的研究效率。因为我们的实现有缺陷而不得不放弃完美的想法这不是很糟糕吗这个列表显然不全面但它是一个坚实的开始英文原文https://medium.com/keeper6928/how-to-unit-test-machine-learning-code-57cf6fd81765