当前位置: 首页 > news >正文

网站开发项目设计文档如何创建微信小程序商店

网站开发项目设计文档,如何创建微信小程序商店,wordpress后台logo,国外h5制作网站本次小编向大家介绍的是根据用户的需求输入想爬取的内容及页数。 主要步骤#xff1a; 1.提示用户输入爬取的内容及页码。 2.根据用户输入#xff0c;获取网址列表。 3.模拟浏览器向服务器发送请求#xff0c;获取响应。 4.利用xpath方法找到图片的标签。 5.保存数据。 代码…本次小编向大家介绍的是根据用户的需求输入想爬取的内容及页数。 主要步骤 1.提示用户输入爬取的内容及页码。 2.根据用户输入获取网址列表。 3.模拟浏览器向服务器发送请求获取响应。 4.利用xpath方法找到图片的标签。 5.保存数据。 代码用面向过程的形式编写的。 关键字requests库xpath,面向过程 现在就来讲解代码书写的过程 1.导入模块 import parsel # 该模块主要用来将请求后的字符串格式解析成re,xpath,css进行内容的匹配 import requests # 爬虫主要的包 from urllib.request import urlretrieve # 本文用来下载图片 import os # 标准库本文用来新建文件夹 每个模块的作用都已经备注了。 2.提示用户输入内容和页数 if not os.path.exists(王一博图片): os.mkdir(王一博图片) # 判断有没有该文件夹如果没有就创建改文件夹 k input(请输入你想搜索的关键字) num int(input(请输入你想搜索的页数)) 3.准备好url和header header {user-agent: Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Mobile Safari/537.36 } base_url https://www.duitang.com/search/?kw k typefeed#!s-p title_url [] n 0 user-agent是服务器识别浏览器的重要参数我们就用这个来蒙骗服务器user-agent在浏览器里可以找到那么现在我们就关注右边这样header就找到了注意要以字典的形式 4.发送请求、 for i in range(num): title_url base_url str(i) respons requests.get(title_url, headersheader).text html parsel.Selector(respons) # 解析数据 -- parsel 转化为Selector对象Selector对象具有xpath的方法能够对转化的数据进行处理pic_url html.xpath(//div[classmbpho]/a/img/src).extract() 一切准备就绪后就可以发送请求了。request.get.text返回的是网页的源代码然后将源代码转换为Selector对象再通过xpath的方法找到图片的网址。5.保存数据 获取图片的图片的链接后我们就可以保存了。 for url in pic_url: n n 1 file_path 王一博图片 / str(n).jpg urlretrieve(url, file_path) # 下载图片具体的用法可以去搜索下很简单的 print(第%d张图片下载成功 % n) 注意这里的for循环是在上面的循环里嵌套的。 最后来看看全部的代码吧 import parsel # 该模块主要用来将请求后的字符串格式解析成re,xpath,css进行内容的匹配 import requests from urllib.request import urlretrieve # 本文用来下载图片 import os # 标准库本文用来新建文件夹 if not os.path.exists(王一博图片): os.mkdir(王一博图片) # 判断有没有该文件夹如果没有就创建改文件夹 k input(请输入你想搜索的关键字) num int(input(请输入你想搜索的页数)) header {user-agent: Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Mobile Safari/537.36 } base_url https://www.duitang.com/search/?kw k typefeed#!s-p title_url [] n 0 for i in range(num): title_url base_url str(i) respons requests.get(title_url, headersheader).text html parsel.Selector(respons)pic_url html.xpath(//div[classmbpho]/a/img/src).extract() # print(pic_url) for url in pic_url: n n 1 file_path 王一博图片 / str(n).jpg urlretrieve(url, file_path) # 下载图片具体的用法可以去搜索下很简单的 print(第%d张图片下载成功 % n) 来看看运行的结果以搜索王一博搜索5页为例。然后你就发信多了一个王一博的文件夹了点开就可以看见王一博的帅照了。到此这篇关于python根据用户需求输入想爬取的内容及页数爬取图片方法详解的文章就介绍到这了,更多相关python爬取图片方法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家
http://www.pierceye.com/news/957523/

相关文章:

  • 怎么管理好自己的网站自建vps和买机场哪个好
  • 站长之家素材网站郴州建网站
  • 服装微商城网站建设贵州建设考试网站
  • 安徽省建设安全协会网站htm5移动网站开发
  • 棋盘游戏类网站开发wordpress副标题怎么写
  • 重庆城市关键词优化ppt
  • 网站营销外包公司简介wordpress 微信二维码
  • 做酒业网站的要求软件开发app的公司
  • 可以做超链接或锚文本的网站有哪些口碑营销的本质是什么
  • 网上下载的网站模板怎么用莱芜金点子招聘网
  • 网站建设首先要免费游戏网站制作
  • 小橘子被做h网站注册帐号
  • 汉川网站推广服务PHP网站建设的课后笔记
  • 中国建设银行网站功能模块多少钱才算有钱人
  • 毕业设计网站成品wordpress 发布模块
  • 网站推广 济南江西 网站 建设 开发
  • 视频 播放网站怎么做的ppt模板大师
  • 桂林北站到象鼻山景区怎么坐车wordpress更改上传
  • 温州制作手机网站wordpress电子书下载
  • 企业型网站怎么做wordpress邮件服务器
  • 龙华网站(建设信科网络)网站建设哪家好推荐万维科技
  • 克拉玛依网站建设公司网站 正在建设中
  • 虚拟主机可以做视频网站嘛有哪些网站有收录做红酒的商行
  • 广州seo优化推广外贸网站优化谷歌关键词排名
  • 网络服务网站建设网站策划书包括哪些内容?
  • ps学做翻页相册网站wordpress导航图标
  • 模板网站的弊端在哪杨家平网站建设
  • 网站模板带手机站手表网站十大品牌
  • 物流网站功能设计师招聘网站有哪些
  • 知名网站开发哪里有重庆公司网站建设价格