建站极速通,有没有专门做装修的网站,惠州网站制作推广公司排名,企业网站模板PHP 实现敏感词 / 停止词 过滤(附敏感词库)PHP实现了敏感词/停用词过滤(带敏感词库)#xff0c;过滤敏感单词和字符是网站#xff0c;的一项基本功能#xff0c;因此有必要设计一个好的、高效的过滤算法。在敏感词过滤算法中#xff0c;必须减少计算量#xff0c;而DFA算法…PHP 实现敏感词 / 停止词 过滤(附敏感词库)PHP实现了敏感词/停用词过滤(带敏感词库)过滤敏感单词和字符是网站的一项基本功能因此有必要设计一个好的、高效的过滤算法。在敏感词过滤算法中必须减少计算量而DFA算法中几乎没有计算量只有状态转移。因此需要DFA算法来更高效地过滤敏感词。整理过滤函数代码如下/***注意[多过滤词过滤字符中的敏感词]*AuthorHeZe*日期2021/1/614:48*param$list一维数组过滤词[‘小明’’小红’’大白’’小白’’小黑’’我’’你’]*param$string输入文本就像小白喜欢小黑喜欢的大黄一样*returnstring过滤后的单词如**喜欢*喜欢大黄*/functionDoFilterWords($list$string$symbol’* ‘){$ count0//非法字数$敏感词’ ‘//非法词语$ stringAfter$ string//替换后的内容$pattern’/’。内爆(‘ | ‘$list)。/I ‘//定义正则表达式If (preg _ match _ all ($ pattern$ string$ matches)){//匹配结果$ PatternList$ matches[0]//数组匹配到$ countcount($ patternList)$敏感词内爆(‘’$ patternList)//将敏感词数组转换为字符串//合并匹配的数组并替换它们$ replace arrayarray _ combine($ patternListarray_fill(0count($patternList)$ symbol))$stringAfterstrtr($string$ ReplaceArray)//结果替换}$log’原句是[{ $ string }]br/’if($count0){$log。’敏感词尚未匹配’}else{$log。’匹配[{$count}]个敏感词[{ $敏感词}]br/’。替换为[{ $ StringAfter }]’}返回$ log}使用方法//筛选同义词库$list[‘小明’’小红’’大白’’小白’’小黑’’我’’你’]//输入文本$string’喜欢你小白喜欢小黑爱吃的大黄’//调用函数$resDoFilterWords($list$string’ *)echo $ res//输出结果原句是[喜欢你小白喜欢小黑爱吃的大黄][3]敏感词搭配[你小白小黑]替换为[喜欢**喜欢*爱大黄]最后 附上敏感词、停止词 词库https://gitee.com/zehe/stopwords转载请注明出处~ ~ ~ ~ ~