哪个网站可以免费下载电视剧看,织梦免费企业模板网站,自己做的网站怎么查,昆明网络营销软件摘要#xff1a; 本套自测题专为SVM及其应用而设计#xff0c;目前超过550人注册了这个测试#xff0c;最终得满分的人却很少#xff0c;[doge],一起来看看你的SVM知识能得多少分吧#xff0c;顺便还能查漏补缺哦。Introduction机器学习强大如一座军械库#xff0c;里面有…摘要 本套自测题专为SVM及其应用而设计目前超过550人注册了这个测试最终得满分的人却很少[doge],一起来看看你的SVM知识能得多少分吧顺便还能查漏补缺哦。
Introduction 机器学习强大如一座军械库里面有各种威力惊人的武器不过你首先得学会如何使用。举个栗子回归Regression是一把能够有效分析数据的利剑但它对高度复杂的数据却束手无策。支持向量机Support Vector MachinesSVM就好比一把锋利的小刀特别是在小数据集上建模显得更为强大有力。本套测试题专为SVM及其应用而设计目前超过550人注册了这个测试排行榜一起来看看你的SVM知识能得多少分吧顺便还能查漏补缺。Helpful Resources1.十大常用机器学习算法附Python和R代码2.SVM原理及代码 Skill test Questions and Answers假定你用一个线性SVM分类器求解二类分类问题如下图所示这些用红色圆圈起来的点表示支持向量据此回答问题1和21.如果移除这些圈起来的数据决策边界即分离超平面是否会发生改变AYes B. No答案ATips: 如果改变这三个点中任意一个点的位置就会引入松弛约束条件决策边界就会发生变化。 2. 如果将数据中除圈起来的三个点以外的其他数据全部移除那么决策边界是否会改变ATrue B. False答案BTips: 决策边界只会被支持向量影响跟其他点无关。 3.关于SVM泛化误差描述正确的是A超平面与支持向量之间距离BSVM对未知数据的预测能力CSVM的误差阈值答案BTips: 统计学中的泛化误差是指对模型对未知数据的预测能力。 4. 如果惩罚参数C趋于无穷下面哪项描述是正确的A若最优分离超平面存在必然能够将数据完全分离B软间隔分类器能够完成数据分类C以上都不对 答案ATips: 如果误分类惩罚很高软间隔不会一直存在因为没有更多的误差空间 5. 以下关于硬间隔描述正确的是ASVM允许分类存在微小误差BSVM允许分类是有大量误差C以上均不正确 答案ATips: 硬间隔意味着SVM在分类时很严格在训练集上表现尽可能好有可能会造成过拟合。 6. 训练SVM的最小时间复杂度为O(n2)那么一下哪种数据集不适合用SVM?A大数据集 B. 小数据集 C. 中等大小数据集 D. 和数据集大小无关 答案A有明确分类边界的数据集最适合SVM 7. SVM的效率依赖于A核函数的选择 B. 核参数 C. 软间隔参数C D. 以上所有 答案DTips: SVM的效率依赖于以上三个基本要求它能够提高效率降低误差和过拟合 8. 支持向量是那些最接近决策平面的数据点。ATRUE B. FALSE 答案A 9. SVM在下列那种情况下表现糟糕A线性可分数据 B. 清洗过的数据 C. 含噪声数据与重叠数据点 答案CTips: 当数据中含有噪声数据与重叠的点时要画出干净利落且无误分类的超平面很难 10. 假定你使用了一个很大γ值的RBF核这意味着A. 模型将考虑使用远离超平面的点建模B模型仅使用接近超平面的点来建模C模型不会被点到超平面的距离所影响D以上都不正确 答案BTips: SVM调参中的γ衡量距离超平面远近的点的影响。对于较小的γ模型受到严格约束会考虑训练集中的所有点而没有真正获取到数据的模式、对于较大的γ模型能很好地学习到模型。 11.SVM中的代价参数表示A交叉验证的次数B使用的核C误分类与模型复杂性之间的平衡D以上均不是 答案CTips:代价参数决定着SVM能够在多大程度上适配训练数据。如果你想要一个平稳的决策平面代价会比较低如果你要将更多的数据正确分类代价会比较高。可以简单的理解为误分类的代价。 假定你使用SVM学习数据X数据X里面有些点存在错误。现在如果你使用一个二次核函数多项式阶数为2使用松弛变量C作为超参之一请回答12-13。12.当你使用较大的CC趋于无穷则A仍然能正确分类数据B不能正确分类C不确定D以上均不正确 答案ATips: 采用更大的C误分类点的惩罚就更大因此决策边界将尽可能完美地分类数据。 13.如果使用较小的CC趋于0则A误分类B正确分类C不确定D以上均不正确 答案ATips:分类器会最大化大多数点之间的间隔少数点会误分类因为惩罚太小了。 14.如果我使用数据集的全部特征并且能够达到100%的准确率但在测试集上仅能达到70%左右这说明A欠拟合 B.模型很棒 C.过拟合 答案CTips:如果在训练集上模型很轻易就能达到100%准确率就要检查是否发生过拟合。 15.下面哪个属于SVM应用A文本和超文本分类B图像分类C新文章聚类D以上均是 答案DTips: SVM广泛应用于实际问题中包括回归聚类手写数字识别等。 假设你训练SVM后得到一个线性决策边界你认为该模型欠拟合。据此回答16-18题16.在下次迭代训练模型时应该考虑A增加训练数据B减少训练数据C计算更多变量D减少特征 答案CTips:由于是欠拟合最好的选择是创造更多特征带入模型训练。 17.假设你在上一题做出了正确的选择那么以下哪一项会发生1.降低偏差2.降低方差3.增加偏差4.降低方差 A1和2B2和3C1和4D2和4 答案CTips:更好的模型会降低偏差并提高方差 18.假如你想修改SVM的参数同样达到模型不会欠拟合的效果应该怎么做A增大参数CB减小参数CC改变C并不起作用D以上均不正确 答案ATips:增大参数C会得到正则化模型 19.SVM中使用高斯核函数之前通常会进行特征归一化以下关于特征归一化描述正确的是1经过特征正则化得到的新特征优于旧特征2特征归一化无法处理类别变量3SVM中使用高斯核函数时特征归一化总是有用的A1 B. 1 and 2 C. 1 and 3 D. 2 and 3答案B 假定你使用SVM来处理4类分类问题你使用了one-vs-all策略据此回答20-2220.此种情况下要训练SVM模型多少次A.1B.2C. 3D. 4 答案DTips:使用one-vs-all策略就要训练4次 每次把一个类当成正类其他的类当作负类然后学习出4个模型对新数据取函数值最大的那个类作为预测类别 21. 假定用one-vs-all训练一次SVM要10秒那么总共应该训练多少秒A20B40C60D80 答案BTips:每个训练10秒要训练4次那就是40秒 22. 假设现在只有两个类这种情况下SVM需要训练几次A1B2C3D4答案ATips:两个类训练1次就可以了 假设你训练了一个基于线性核的SVM多项式阶数为2在训练集和测试集上准确率都为100%据此回答23-2423. 如果增加模型复杂度或核函数的多项式阶数将会发生什么A导致过拟合B导致欠拟合C无影响因为模型已达100%准确率D以上均不正确 答案ATips:增加模型复杂度会导致过拟合 24. 如果增加模型复杂度之后你发现训练集上准确率还是100%可能是什么原因造成的1.数据不变适配更多的多项式项或参数算法开始记忆数据中的一切2.数据不变SVM不必在更大的假设空间中搜索分类超平面 A1B2C1 and 2D以上均不正确 答案C 25.以下关于SVM核函数说法正确的是1. 核函数将低维数据映射到高维空间2. 是一个相似度函数similarity function A1B2C1 and 2D以上均不正确 答案COverall Distribution至今超过350人参与了这项测试得分分布情况如下原文链接干货好文请关注扫描以下二维码