当前位置: 首页 > news >正文

免费html5中文网站素材项目管理app

免费html5中文网站素材,项目管理app,网站建设微信商城开发,腾讯企业邮箱免费版目录 前言1. 基本知识2. 常用API3. 简易Demo 前言 关于爬虫的基本知识推荐阅读#xff1a;Python爬虫从入门到应用#xff08;超全讲解#xff09; 该知识点需要提前安装相关依赖#xff1a;pip install lxml 1. 基本知识 XPath#xff08;XML Path Language#xf… 目录 前言1. 基本知识2. 常用API3. 简易Demo 前言 关于爬虫的基本知识推荐阅读Python爬虫从入门到应用超全讲解 该知识点需要提前安装相关依赖pip install lxml 1. 基本知识 XPathXML Path Language是一种用于在XML文档中定位和选择节点的语言 在XML文档中通过路径表达式path expression来定位节点这些路径描述了节点在层次结构中的位置 一、节点 在XML文档中所有的内容都以节点的形式存在 主要有两种类型的节点 元素节点Element Nodes代表XML文档中的元素比如 book、title等文本节点Text Nodes代表元素节点中的文本内容 二、路径表达式XPath使用路径表达式来选取节点或节点集。路径表达式可以基于节点名称、位置、属性等来定位节点 常见的路径表达式包括 /从根节点开始选择节点//选取节点不考虑它们的位置.选取当前节点..选取当前节点的父节点选取属性 三、轴Axis轴定义了相对于当前节点的节点集 常用的轴包括 ancestor选取所有祖先节点child选取所有子节点parent选取父节点preceding-sibling选取当前节点之前的所有同级节点following-sibling选取当前节点之后的所有同级节点 四、操作符支持一系列操作符用于比较、计算和连接表达式 包括算术运算符、-、*、div、mod、关系运算符、!、、、、等 五、函数Functions一系列内置函数用于执行各种操作如字符串处理、数值计算、节点操作等 常见的函数包括 string()、contains()、count()、concat()等 2. 常用API xpath() 方法根据XPath表达式选择节点或节点集合 text 属性获取节点的文本内容 attrib 属性获取节点的属性值 find() 方法查找第一个匹配的节点 findall() 方法查找所有匹配的节点 以下是方法示例 from lxml import etree# XML字符串 xml_str bookstorebook categoryFictiontitle langenHarry Potter/titleauthorJ.K. Rowling/authoryear2005/yearprice29.99/price/bookbook categoryNon-Fictiontitle langenThe Elements of Style/titleauthorWilliam Strunk Jr./authoryear1999/yearprice9.95/price/book /bookstore # 创建Element对象 root etree.fromstring(xml_str)以下为方法示例 # xpath() 方法示例 titles root.xpath(//title/text()) print(Titles:) for title in titles:print(title)截图如下 text属性 输出First Book Title: Harry Potter # text 属性示例 first_book_title root.xpath(/bookstore/book[1]/title)[0].text print(\nFirst Book Title:, first_book_title)attrib属性 输出First Book Category: Fiction # attrib 属性示例 first_book_category root.xpath(/bookstore/book[1]/category)[0] print(\nFirst Book Category:, first_book_category)find方法 输出First Non-Fiction Book Title: The Elements of Style # find() 方法示例 first_non_fiction_book_title root.find(.//book[categoryNon-Fiction]/title) print(\nFirst Non-Fiction Book Title:, first_non_fiction_book_title.text)findall方法 # findall() 方法示例 all_authors root.findall(.//author) print(\nAll Authors:) for author in all_authors:print(author.text)截图如下 3. 简易Demo 根据以上的API以及输出结果可稍微了解一些知识 以下为简单的XML示例来演示XPath的使用 还是刚刚那个xml文档不过弄成文件放置 from lxml import etreedef main():# 读取XML文件with open(books.xml, r) as file:xml_data file.read()# 解析XMLroot etree.fromstring(xml_data)# 使用XPath选择所有书籍的标题titles root.xpath(/bookstore/book/title/text())print(书籍标题:)for title in titles:print(title)# 使用XPath选择所有语言为英语的书籍标题english_titles root.xpath(/bookstore/book/title[langen]/text())print(\n语言为英语的书籍标题:)for title in english_titles:print(title)# 使用XPath选择所有价格低于10美元的书籍标题cheap_titles root.xpath(/bookstore/book[price 10]/title/text())print(\n价格低于10美元的书籍标题:)for title in cheap_titles:print(title)if __name__ __main__:main()截图如下 注意我在上述Demo中都用到etree.fromstring()但在其他文章又看到etree.HTML() 接下来阐述下这几个的差异 etree.HTML()etree.parse()etree.fromstring()解析HTML字符串将传入的字符串解析为HTML文档并构建相应的ElementTree对象解析本地文件或可读文件对象中的XML或HTML文档解析XML字符串类似于etree.HTML() 对于这几个函数的选择 本地的HTML文件可以使用etree.parse()函数来解析HTML字符串可以使用etree.HTML()函数来解析对于XML字符串可以使用etree.fromstring()函数 再次举例一个html的例子 from lxml import etreehtml !DOCTYPE html html langen headmeta charsetUTF-8title测试/title /head bodydiv classcontainerheaderh1欢迎来到我的网站/h1navullia hrefhttps://www.example.com/首页/a/lilia hrefhttps://www.example.com/about关于我们/a/lilia hrefhttps://www.example.com/contact联系我们/a/li/ul/nav/headersectionh2最新文章/h2articleh3文章标题1/h3p文章内容1/p/articlearticleh3文章标题2/h3p文章内容2/p/article/sectionasideh2侧边栏/h2ulli链接1/lili链接2/lili链接3/li/ul/asidefooterp版权所有 © 2024/p/footer/div /body /html # 解析HTML root etree.HTML(html)# 选择所有链接 links root.xpath(//a) print(所有链接:) for link in links:print(文本:, link.text)print(URL:, link.attrib[href])# 查找侧边栏中的链接 sidebar_links root.xpath(//aside//li) print(\n侧边栏链接:) for link in sidebar_links:print(文本:, link.text)结果输出如下
http://www.pierceye.com/news/608285/

相关文章:

  • 英文网站建设方案 ppt模板国内代理ip免费网址
  • 城乡建设网站 资料员深圳定制型网站建设
  • 浦江网站建设微信开发手机html编辑器
  • 做网站的个人总结论坛内网站怎么建设
  • 那里有个人做网站的如何建设网页制作的网站
  • 佛山网站建设玲念建站会议管理系统
  • 网站开发需要什么资质天马行空网站建设
  • 猎聘网网站建设目标怎么做网站上的模拟动画
  • 南通制作企业网站福州做网站设计
  • 上什么网站做会计教育wordpress cookies
  • 山东网站备案号四川省建筑信息网
  • 网站开发可以用哪些语言中国十二冶金建设有限公司网站
  • 中药网站模板襄阳seo优化服务
  • 做爰片免费观看网站会展企业网站建设方案
  • 国内空间没备案可以打开网站吗dw做网站 怎么做背景图片
  • host绑定网站国外网站风格
  • 安顺建设局网站wordpress 分页
  • 重庆做网站个人外网登录不了WordPress
  • 医药平台网站建设网站排名做不上去
  • 网站关键词优化培训怎样使用wordpress
  • wordpress多站做网站空间百度云和阿里云区别
  • 衡水企业网站制作公司3000块钱在朋友圈投放广告
  • 做网站没有公网北京网页制作教程
  • 运城哪家做网站的公司好小商铺装修
  • 如何访问win7下做的网站时间轴网站模板
  • html5网站制作软件做app找哪个网站吗
  • 网站名称怎么备案外贸商城网站模板
  • 网页设计网站网站建设课程设计客户关系管理流程图
  • 网站开发遇到的难题品牌策划公司有哪些
  • 网站如何做视频链接网络服务器可提供的常见服务