当前位置：首页 > news >正文

org域名网站wordpress 文章编辑插件

news 2025/12/20 21:38:13

org域名网站,wordpress 文章编辑插件,网站建设和网站开发的区别,网站域名解析某品牌数据采集采集需求地址#xff1a;http://www.winshangdata.com/brandList 需求#xff1a;用scrapy框架采集本站数据#xff0c;至少抓取5个分类#xff0c;数据量要求5000以上采集字段#xff1a;标题、创建时间、开店方式、合作期限、面积要求网页分析 …某品牌数据采集采集需求地址http://www.winshangdata.com/brandList 需求用scrapy框架采集本站数据至少抓取5个分类数据量要求5000以上采集字段标题、创建时间、开店方式、合作期限、面积要求网页分析进入网站后页面如下打开f12切换到网络这一栏刷新网页或者点击下一页抓取请求分析返回的json数据发现只能获取到我们需要的标题、面积要求所以我们需要进入网页详情页面进行分析进入详情页面后发现我们剩下所需的参数都是在网页的li标签中所以我们可以通过xpath等方式获取而网页跳转的brandId参数在我们之前获取的json包中可以获取由于题目要求需要抓取5个分类接下来再分析业务类别是怎么实现的点击不同类别的标签分析xhr请求发现分类主要通过ytlb1参数进行实现而翻页则通过pageNum进行实现pageSize参数可以选择一页可以爬取多少元素到此我们网页基本分析完毕爬虫的大致流程为先爬取http://www.winshangdata.com/wsapi/brand/list3_4获取返回包中的brandId,brandName两个参数将获取的brandId参数重新构造urlhttp://www.winshangdata.com/brandDetail?brandId然后通过构造Xpath语句获取li标签中的span标签中的我们需要的数据代码实现全部代码这里就不展示了这里只展示核心代码有需要的可以私信找我。结果展示

查看全文

http://www.pierceye.com/news/495891/