哪些网站是phpwind做的,湖南长沙人才市场招聘官网,滁州市建设局网站,电子商务专业网站设计这篇文章主要介绍了Python通过正则表达式获取、过滤或者替换HTML标签的方法#xff0c;感兴趣的小伙伴们可以参考一下本文实例介绍了Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法#xff0c;具体内容如下python正则表达式转义符:. 匹配除换行符以外的任意…这篇文章主要介绍了Python通过正则表达式获取、过滤或者替换HTML标签的方法感兴趣的小伙伴们可以参考一下本文实例介绍了Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法具体内容如下python正则表达式转义符:. 匹配除换行符以外的任意字符\w 匹配字母或数字或下划线或汉字\s 匹配任意的空白符\d 匹配数字\b 匹配单词的开始或结束^ 匹配字符串的开始$ 匹配字符串的结束\W 匹配任意不是字母数字下划线汉字的字符\S 匹配任意不是空白符的字符\D 匹配任意非数字的字符\B 匹配不是单词开头或结束的位置[^x] 匹配除了x以外的任意字符[^aeiou] 匹配除了aeiou这几个字母以外的任意字符常用的python正则表达式限定符代码/语法说明:*重复零次或更多次重复一次或更多次?重复零次或一次{n}重复n次{n,}重复n次或更多次{n,m}重复n到m次关于python正则表达式命名组:命名组:(?P.....)这篇文章里面还提到了界定( 问号开头,前向则有个前向界定 (?…)后向界定 (?…)前向非界定 (?后向非界定 (?!.....)Python通过正则表达式获取,去除(过滤)或者替换HTML标签代码举例1、Python通过正则表达式取html中天气信息代码示例:#!/usr/bin/env python#-*- coding: utf8 -*-import rehtml 多云if name main:p re.compile(])print p.sub(, html)Python通过正则表达式取html中温度信息代码示例:#!/usr/bin/env python#-*- coding: utf8 -*-import rehtml 14℃ if name main:p re.compile(])print p.sub(, html)2、Python通过正则表达式去除(过滤)HTML标签示例代码:# -*- coding: utf-8-*-import re##过滤HTML中的标签#将HTML中标签等信息去掉#param htmlstr HTML字符串.def filter_tags(htmlstr):#先过滤CDATAre_cdatare.compile(//]*//\]\],re.I) #匹配CDATAre_scriptre.compile(]*[^,re.I)#Scriptre_stylere.compile(]*[^,re.I)#stylere_brre.compile()#处理换行re_hre.compile(?\w[^]*)#HTML标签re_commentre.compile()#HTML注释sre_cdata.sub(,htmlstr)#去掉CDATAsre_script.sub(,s) #去掉SCRIPTsre_style.sub(,s)#去掉stylesre_br.sub(\n,s)#将br转换为换行sre_h.sub(,s) #去掉HTML 标签sre_comment.sub(,s)#去掉HTML注释#去掉多余的空行blank_linere.compile(\n)sblank_line.sub(\n,s)sreplaceCharEntity(s)#替换实体return s##替换常用HTML字符实体.#使用正常的字符替换HTML中特殊的字符实体.#你可以添加新的实体字符到CHAR_ENTITIES中,处理更多HTML字符实体.#param htmlstr HTML字符串.def replaceCharEntity(htmlstr):CHAR_ENTITIES{nbsp: ,160: ,lt:gt:,62:,amp:,38:,quot:,34:,}re_charEntityre.compile(r?(?P\w);)szre_charEntity.search(htmlstr)while sz:entitysz.group()#entity全称如keysz.group(name)#去除;后entity,如为gttry:htmlstrre_charEntity.sub(CHAR_ENTITIES[key],htmlstr,1)szre_charEntity.search(htmlstr)except KeyError:#以空串代替htmlstrre_charEntity.sub(,htmlstr,1)szre_charEntity.search(htmlstr)return htmlstrdef repalce(s,re_exp,repl_string):return re_exp.sub(repl_string,s)if namemain:sfile(169it.com_index.htm).read()newsfilter_tags(s)print news以上就是本文的全部内容希望对大家的学习有所帮助。