当前位置: 首页 > news >正文

石家庄栾城区建设局网站哪个软件可以看街道实景

石家庄栾城区建设局网站,哪个软件可以看街道实景,国内买机票的网站建设,wordpress如何添加广告0.目录1.分析页面2.初步代码3.完整代码4.总结5.补充1.分析页面上一次我们讲了xpath获取豆瓣最新上映电影的海报#xff0c;这一次会分析如何使用BeautifulSoup获取。启程#xff1a;python爬虫之通过xpath获取豆瓣最新上映电影的海报​zhuanlan.zhihu.com首先#xff0c;进入…0.目录1.分析页面2.初步代码3.完整代码4.总结5.补充1.分析页面上一次我们讲了xpath获取豆瓣最新上映电影的海报这一次会分析如何使用BeautifulSoup获取。启程python爬虫之通过xpath获取豆瓣最新上映电影的海报​zhuanlan.zhihu.com首先进入豆瓣正在上映的页面右键查看源代码发现我们需要的海报url和电影名都在这个标签下面根据上一次的经验还需要添加范围 div idnowplaying 右键源代码2.初步代码# encoding: utf-8from bs4 import BeautifulSoupfrom urllib import requestimport requestsdef get_page(url):headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36,Referer: https://movie.douban.com/,}response requests.get(url, headers)return response.textdef get_img(url):text get_page(url)# 创建BeautifulSoup对象soup BeautifulSoup(text, lxml)# 限制获取到的img标签在【正在上映】内new soup.find(div, {id: nowplaying})# 查找img标签trs new.find_all(img)for tr in trs:# 获取img标签下的src和alturl_img tr.attrs[src]name tr.attrs[alt]print(name)print(url_img)def main():url https://movie.douban.com/cinema/nowplaying/guangzhou/get_img(url)if __name__ __main__:main()展示运行结果的一部分3.完整代码可以发现已经获取到了我们想要的数据那么下一步就是根据url下载海报并且用电影名来命名文件。在下载之前还需要在该程序的所在目录建一个名为images 的文件夹。# encoding: utf-8from bs4 import BeautifulSoupfrom urllib import requestimport requestsdef get_page(url):headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36,Referer: https://movie.douban.com/,}response requests.get(url, headers)return response.textdef get_img(url):text get_page(url)# 创建BeautifulSoup对象soup BeautifulSoup(text, lxml)# 限制获取到的img标签在【正在上映】内new soup.find(div, {id: nowplaying})# 查找img标签trs new.find_all(img)fns_num 1num len(trs)for tr in trs:# 获取img标签下的src和alturl_img tr.attrs[src]name tr.attrs[alt]# 下载剧照request.urlretrieve(url_img, images/ name .jpg)# 显示剧照下载的进度print(\r完成进度: {:.2f}%.format(fns_num * 100 / num), end)fns_num 1def main():url https://movie.douban.com/cinema/nowplaying/guangzhou/get_img(url)if __name__ __main__:main()展示运行结果的一部分4.总结下一次会使用正则表达式来继续实践还会分析xpath、BeautifulSoup和正则之间的区别。如果你想获取评分可以这样new soup.find(div, {id: nowplaying})trs new.find_all(li)for tr in trs:score tr.attrs[data-score]5.补充当我们碰到肖申克的救赎xpath可以这样获取title tr.xpath(.//span[classtitle]/text())[0]BeautifulSoup可以这样获取title soup.find(span, {class: title})
http://www.pierceye.com/news/734542/

相关文章:

  • 邢台企业做网站价格如何做网络推广运营
  • 番禺网站建设服务百度广告推广价格
  • 什么系统做网站最安全网络科技网站设计
  • 通州网站建设是什么查看网站开发商
  • 建设网站公司浩森宇特怎么推广公司网站
  • 来宾住房和城乡建设网站变装第三性wordpress
  • 自己开发网站怎么开发站长工具网址是多少
  • 农业交易平台网站建设成都微信网站开发
  • 十大网站app软件网站建设企业的市场分析
  • 建设网站教程视频下载企业所得税税率2019
  • 网站图片上传不了是什么原因建筑施工图设计
  • 做网站必须要公网ip个人主页网页设计教程
  • 智能家居网站开发成都家装设计公司排名榜
  • 中国建设银行门户网站企业wordpress锁
  • 购物网站建设所需软件科技部网站公布首批创新型县(市)建设名单
  • 网站访客qq抓取淘宝官网首页入口
  • 网站界面设计实训总结cp wordpress
  • 网站建设综合案例济宁北湖建设局网站
  • 青岛网站建设运营网络程序
  • 哈铁工程建设公司网站可做推广的网站
  • 建湖做网站哪家最好计算机网络中小型企业网络设计方案
  • 如何用 python 做网站网站后台seo优化如何做
  • 网站搭建徐州百度网络c2c平台是洗钱吗
  • 二级域名站群微信上浏览自己做的网站吗
  • 十堰微网站建设费用ps做网站尺寸
  • 网站后台制作用的软件电子商务网站推广案例
  • 汽车低价网站建设wordpress怎么搜索中文主题
  • 温江建设局备案网站高品质外贸网站建设
  • 营销网站制作哪家好洛阳外贸网站推广
  • 手机网站与app广州番禺区美食攻略