做网站却不给客户源代码,广西网络电视,网站设计报告总结,郑州做商城网站Python爬虫之PyQuery使用PyQuery简介pyquery能够通过选择器精确定位 DOM 树中的目标并进行操作。pyquery相当于jQuery的python实现#xff0c;可以用于解析HTML网页等。它的语法与jQuery几乎完全相同#xff0c;对于使用过jQuery的人来说很熟悉#xff0c;也很好上手。初始化…Python爬虫之PyQuery使用PyQuery简介pyquery能够通过选择器精确定位 DOM 树中的目标并进行操作。pyquery相当于jQuery的python实现可以用于解析HTML网页等。它的语法与jQuery几乎完全相同对于使用过jQuery的人来说很熟悉也很好上手。初始化有 4 种方法可以进行初始化可以通过传入 字符串、lxml、文件 或者 url 来使用PyQueryfrom pyquery import PyQuery as pqfrom lxml import etreed pq()#传入字符串d pq(etree.fromstring())#传入lxmld pq(urlhttp://baidu.com/) #传入urld pq(filenamepath_to_html_file) #传入文件基本CSS选择器html歌手高空拍MV坠亡佛祖朱龙广金婚常见租房陷阱靳东回应发错诗词煤老板们的影视江湖1024程序员节美的合并小天鹅京昆高速4车相撞from pyquery import PyQuery as pqdoc pq(html)# 获取所有a标签print(doc(body .mh-col li a))注意类名用.id用#标签用标签名另外选择的是具有层级关系从左到右不是直接的父子的关系。运行结果如下歌手高空拍MV坠亡佛祖朱龙广金婚常见租房陷阱靳东回应发错诗词煤老板们的影视江湖1024程序员节美的合并小天鹅京昆高速4车相撞操作html歌手高空拍MV坠亡佛祖朱龙广金婚常见租房陷阱靳东回应发错诗词煤老板们的影视江湖1024程序员节美的合并小天鹅新闻京昆高速4车相撞from pyquery import PyQuery as pqdoc pq(html)items doc(.mh-col)#.find()查找嵌套元素alist items.find(li a)print(alist)#查找所有子元素alist2 items.children()print(alist2)#查找指定的子元素alist3 items.children(.g-ellipsis1)print(alist2)#查找父元素#注意一个元素只有一个父元素body items.parent()print(body)#查找祖先元素content items.parents()print(content)#查找兄弟元素li doc(.mh-col .g-ellipsis1)print(li.siblings())#遍历 单个元素#遍历所有的a标签alist doc(.mh-col li a).items()for a in alist: print(a)获取信息获取属性a doc(.mh-col li .g-a-noline8)print(a.attr[href])print(a.attr.href)获取文本a doc(.mh-col li .g-a-noline8)print(a.text())获取HTMLa doc(.mh-col li .g-a-noline8)print(a.html())简单的DOM操作#addClass、removerClass#修改类名a doc(.mh-col li .g-a-noline8)print(a)a.removeClass(g-a-noline8)print(a)a.addClass(g-a-noline8)print(a)#attr、css#修改属性和样式a doc(.mh-col li .g-a-noline8)print(a)a.attr(name,link)print(a)a.css(font-size,14px)print(a)#remove#删除标签li doc(.mh-col .g-ellipsis8)print(li)li.find(a).remove()print(li)更多的DOM操作https://pyquery.readthedocs.io/en/latest/api.html