当前位置: 首页 > news >正文

小型服务器做网站网页设计与制作课程教学要求

小型服务器做网站,网页设计与制作课程教学要求,黄冈做网站公司,青岛产品宣传片制作一、简介 XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素#xff0c;并且 XQuery 和 XPointer 都构建于 XPath 表达之上。 参照 二、安装 1 pip3 install lxml三、使用 1、导入 1 from lx…一、简介 XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素并且 XQuery 和 XPointer 都构建于 XPath 表达之上。 参照 二、安装 1 pip3 install lxml三、使用 1、导入 1 from lxml import etree2、基本使用 from lxml import etreewb_data divulli classitem-0a hreflink1.htmlfirst item/a/lili classitem-1a hreflink2.htmlsecond item/a/lili classitem-inactivea hreflink3.htmlthird item/a/lili classitem-1a hreflink4.htmlfourth item/a/lili classitem-0a hreflink5.htmlfifth item/a/ul/div html etree.HTML(wb_data) print(html) result etree.tostring(html) print(result.decode(utf-8))从下面的结果来看我们打印机html其实就是一个python对象etree.tostring(html)则是不全里html的基本写法补全了缺胳膊少腿的标签。 Element html at 0x39e58f0 htmlbodydivulli classitem-0a hreflink1.htmlfirst item/a/lili classitem-1a hreflink2.htmlsecond item/a/lili classitem-inactivea hreflink3.htmlthird item/a/lili classitem-1a hreflink4.htmlfourth item/a/lili classitem-0a hreflink5.htmlfifth item/a/li/ul/div/body/html3、获取某个标签的内容(基本使用)注意获取a标签的所有内容a后面就不用再加正斜杠否则报错。 写法一 html etree.HTML(wb_data) html_data html.xpath(/html/body/div/ul/li/a) print(html) for i in html_data:print(i.text)Element html at 0x12fe4b8 first item second item third item fourth item fifth item写法二直接在需要查找内容的标签后面加一个/text()就行 html etree.HTML(wb_data) html_data html.xpath(/html/body/div/ul/li/a/text()) print(html) for i in html_data:print(i)Element html at 0x138e4b8 first item second item third item fourth item fifth item4、打开读取html文件 #使用parse打开html的文件 html etree.parse(test.html) html_data html.xpath(//*)br#打印是一个列表需要遍历 print(html_data) for i in html_data:print(i.text)html etree.parse(test.html) html_data etree.tostring(html,pretty_printTrue) res html_data.decode(utf-8) print(res)打印 divulli classitem-0a hreflink1.htmlfirst item/a/lili classitem-1a hreflink2.htmlsecond item/a/lili classitem-inactivea hreflink3.htmlthird item/a/lili classitem-1a hreflink4.htmlfourth item/a/lili classitem-0a hreflink5.htmlfifth item/a/li/ul /div5、打印指定路径下a标签的属性可以通过遍历拿到某个属性的值查找标签的内容 html etree.HTML(wb_data) html_data html.xpath(/html/body/div/ul/li/a/href) for i in html_data:print(i)打印 link1.html link2.html link3.html link4.html link5.html6、我们知道我们使用xpath拿到得都是一个个的ElementTree对象所以如果需要查找内容的话还需要遍历拿到数据的列表。 查到绝对路径下a标签属性等于link2.html的内容。 html etree.HTML(wb_data) html_data html.xpath(/html/body/div/ul/li/a[hreflink2.html]/text()) print(html_data) for i in html_data:print(i)打印 [second item] second item7、上面我们找到全部都是绝对路径每一个都是从根开始查找下面我们查找相对路径例如查找所有li标签下的a标签内容。 html etree.HTML(wb_data) html_data html.xpath(//li/a/text()) print(html_data) for i in html_data:print(i)打印 [first item, second item, third item, fourth item, fifth item] first item second item third item fourth item fifth item8、上面我们使用绝对路径查找了所有a标签的属性等于href属性值利用的是/—绝对路径下面我们使用相对路径查找一下l相对路径下li标签下的a标签下的href属性的值注意a标签后面需要双//。 html etree.HTML(wb_data) html_data html.xpath(//li/a//href) print(html_data) for i in html_data:print(i)打印 [link1.html, link2.html, link3.html, link4.html, link5.html] link1.html link2.html link3.html link4.html link5.html9、相对路径下跟绝对路径下查特定属性的方法类似也可以说相同。 html etree.HTML(wb_data) html_data html.xpath(//li/a[hreflink2.html]) print(html_data) for i in html_data:print(i.text)打印 [Element a at 0x216e468] second item10、查找最后一个li标签里的a标签的href属性 html etree.HTML(wb_data) html_data html.xpath(//li[last()]/a/text()) print(html_data) for i in html_data:print(i)打印 [fifth item] fifth item11、查找倒数第二个li标签里的a标签的href属性 html etree.HTML(wb_data) html_data html.xpath(//li[last()-1]/a/text()) print(html_data) for i in html_data:print(i)打印 [fourth item] fourth item12、如果在提取某个页面的某个标签的xpath路径的话可以如下图 //*[id“kw”] 解释使用相对路径查找所有的标签属性id等于kw的标签。 #!/usr/bin/env python # -*- coding:utf-8 -*- from scrapy.selector import Selector, HtmlXPathSelector from scrapy.http import HtmlResponse html !DOCTYPE html htmlhead langenmeta charsetUTF-8title/title/headbodyulli classitem-a idi1 hreflink.htmlfirst item/a/lili classitem-0a idi2 hrefllink.htmlfirst item/a/lili classitem-1a hrefllink2.htmlsecond itemspanvv/span/a/li/uldiva hrefllink2.htmlsecond item/a/div/body /htmlresponse HtmlResponse(urlhttp://example.com, bodyhtml,encodingutf-8) # hxs HtmlXPathSelector(response) # print(hxs) # hxs Selector(responseresponse).xpath(//a) # print(hxs) # hxs Selector(responseresponse).xpath(//a[2]) # print(hxs) # hxs Selector(responseresponse).xpath(//a[id]) # print(hxs) # hxs Selector(responseresponse).xpath(//a[idi1]) # print(hxs) # hxs Selector(responseresponse).xpath(//a[hreflink.html][idi1]) # print(hxs) # hxs Selector(responseresponse).xpath(//a[contains(href, link)]) # print(hxs) # hxs Selector(responseresponse).xpath(//a[starts-with(href, link)]) # print(hxs) # hxs Selector(responseresponse).xpath(//a[re:test(id, i\d)]) # print(hxs) # hxs Selector(responseresponse).xpath(//a[re:test(id, i\d)]/text()).extract() # print(hxs) # hxs Selector(responseresponse).xpath(//a[re:test(id, i\d)]/href).extract() # print(hxs) # hxs Selector(responseresponse).xpath(/html/body/ul/li/a/href).extract() # print(hxs) # hxs Selector(responseresponse).xpath(//body/ul/li/a/href).extract_first() # print(hxs)# ul_list Selector(responseresponse).xpath(//body/ul/li) # for item in ul_list: # v item.xpath(./a/span) # # 或 # # v item.xpath(a/span) # # 或 # # v item.xpath(*/a/span) # print(v)
http://www.pierceye.com/news/676271/

相关文章:

  • 网站建设与推广长春云电脑永久免费版手机版
  • 营销型网站建设优化建站坂田建设网站
  • 大型网站方案自己做网站详细流程
  • 网站开发中为什么有两个控制层南昌网站建设技术托管
  • 网站如何加入百度联盟易名中国网站
  • 海报在线制作免费网站网站建设费用明细湖南岚鸿
  • 宝塔服务器搭建网站教程盐城网站建设兼职
  • 南京网站制作公司怎么样wordpress思维导图
  • 学校网站建设和维护情况沈阳网页设计公司有哪些
  • 安徽网站建设电话网站建设动态静态
  • 网站建设规划设计公司排名摄影公司网站开发
  • php安防企业网站源码seo中文
  • 用什么开发和建设网站最好wordpress登录安全插件
  • 做网站哪个服务商便宜wordpress添加script
  • dede wap网站外贸客户开发的渠道有哪些
  • 营销型网站网站设计免费域名注册 国外
  • 杭州网站制作公司网站厦门网站建设 首选猴子网络
  • 公司如何建站合肥网站设计
  • wordpress单页导出wordpress head 优化
  • 建筑模版东莞网站建设技术支持北京网页制作服务商
  • 网站html地图怎么做的wordpress 国内视频网站
  • 哪个网站做的简历比较好龙岗做网站公司icxun
  • 海外网站开发网站打开慢怎么回事
  • 外贸导向企业网站搜索引擎大全排名
  • 网站域名怎么做变更企业查询系统
  • 12306网站多少钱做的怎么研发软件app
  • 手机端建站井冈山保育院网站建设
  • 服装设计网站怎么做wordpress网站商务通
  • 重庆建设医院官方网站医疗网站源码
  • 大学生想做网站天元建设集团有限公司商业承兑汇票拒付最新消息