怎么做二维码转到网站,北京中燕建设公司网站,爱搜索中级网站建设,天津城市建设招标网站技术特征#xff1a;1.一种基于粒子群位置更新思想灰狼优化算法的k-means文本分类方法#xff0c;其特征在于#xff1a;包括以下步骤#xff1a;s1:对文本数据进行预处理#xff0c;得到预处理后文本数据#xff1b;s2#xff1a;采用余弦角度为相似性度量#xff0c;…技术特征1.一种基于粒子群位置更新思想灰狼优化算法的k-means文本分类方法其特征在于包括以下步骤s1:对文本数据进行预处理得到预处理后文本数据s2采用余弦角度为相似性度量分别计算预处理后文本数据向量中的每一个数据对象到每一个初始灰狼个体的初始聚类中心点间的距离并按相似度最接近的原则分别将预处理文本数据中的数据对象分配到对应的k个类簇中直到所有的数据对象分配完毕形成k个类簇再计算下一个灰狼个体的数据分配结果直到灰狼种群中所有的灰狼个体都计算完毕得到n种初步文本聚类结果s3分别计算每一个灰狼个体到数据中心点间的距离之和,分别得到了n个灰狼个体的适应度评估函数值s4对n个适应度评估函数值进行按序排列选出适应度评估函数值最小的前三只狼作为α狼β狼δ狼并根据α狼β狼δ狼三只狼的位置计算灰狼种群中其他灰狼个体到这三只狼的距离并计算其余灰狼个体位置更新的中间变量的值s5将带有粒子群位置更新思想的所有灰狼个体进行位置更新s6判断粒子群位置更新思想改进的灰狼优化算法的k-means聚类算法是否达到最大迭代次数如果否则执行步骤2如果是输出α狼的适应度值及其位置xα根据xα聚类中心得到的最终文本数据分配结果。2.根据权利要求1所述的一种基于粒子群位置更新思想灰狼优化算法的k-means文本分类方法其特征还在于所述文本数据进行预处理步骤如下s1采用分词软件划分反映完整文本句意的最小单位的词组s2筛选无意义词组s3采用向量空间模型进行数学建模对分词后的本文数据采用词频统计进行分词权重计算提取文本数据中的关键词s4使用word2vec模型进行词的向量化用向量化之后的文本数据向量作为聚类的数据输入。3.根据权利要求1所述的一种基于粒子群位置更新思想灰狼优化算法的k-means文本分类方法其特征还在于所述余弦角度作为相似性度量公式如下其中xi(i1,2,3...,n)表述数据对象向量xj(j1,2,3,...,n)表示中心点向量。4.根据权利要求1所述的一种基于粒子群位置更新思想灰狼优化算法的k-means文本分类方法其特征还在于适应度评估函数值公式如公式如下其中k代表聚类个数。5.根据权利要求1所述的一种基于粒子群位置更新思想灰狼优化算法的k-means文本分类方法其特征还在于所述灰狼个体进行位置更新根据如下公式进行其中灰狼位置更新速度通过如下公式确定其中w称为惯性因子r7r8r9是属于[0,1]间的随机数分别表示控制种群中其余狼与三只头狼之间距离的参数范围为在[02]之间分别表示位置更新后的灰狼个体位置代表当前灰狼的位置。