当前位置: 首页 > news >正文

自己的网站怎么做美工吉林省白山市建设厅网站首页

自己的网站怎么做美工,吉林省白山市建设厅网站首页,兴文移动网站建设,wordpress科技网站模板request库对于轻量级用户#xff0c;像我一样只是准备写一个搞笑用的程序#xff0c;requests是很方便的存在。安装通过pip就不说了request的几个主要方法requests.request() 构造一个请求#xff0c;支撑以下各方法的基础方法requests.get() 获取HTML网页的主要方法#x…request库对于轻量级用户像我一样只是准备写一个搞笑用的程序requests是很方便的存在。安装通过pip就不说了request的几个主要方法requests.request() 构造一个请求支撑以下各方法的基础方法requests.get() 获取HTML网页的主要方法对应于HTTP的GETrequests.head() 获取HTML网页头信息的方法对应于HTTP的HEADrequests.post() 向HTML网页提交POST请求的方法对应于HTTP的POSTrequests.put() 向HTML网页提交PUT请求的方法对应于HTTP的PUTrequests.patch() 向HTML网页提交局部修改请求对应于HTTP的PATCHrequests.delete() 向HTML页面提交删除请求对应于HTTP的DELETE这个基本上和http中报文的几种方法是一致的。具体可以康康明解http的第三章。小钱钱够的同学可以支持一下正版。get方法我们主要使用的是get方法(因为只是爬别人)。requests.get(url, paramsNone, **kwargs)中。url(统一资源定位符)指访问的资源的地址就是你在浏览器上面那个栏栏里面输入的http://www.xxxxxx.com。kwargs用来控制访问的参数也是用来控制你网络通信中的参数(可以理解为一个信封的上收信人和邮票这些)。我们使用get方法urlhttps://bing.com/resrequests.get(url)我们去爬去的时候通过url使用get方法是获得一个request对象去访问网址资源(响应库名)。而res是得到一个response对象包含了几个属性status_code HTTP请求的返回状态200表示连接成功404表示失败(详细见明解http第四章)text HTTP响应内容的字符串形式即url对应的页面内容encoding 从HTTP header中猜测的响应内容编码方式apparent_encoding 从内容中分析出的响应内容编码方式(备选编码方式)content HTTP响应内容的二进制形式通常如果我们发现res.txt的显示有些问题我们会使用apparent_encoding去解码结果。因为毕竟有可能有失败所以我们需要使用异常处理来打开。urlhttps://bing.com/try:resrequests.get(url)res.raise_for_status()res.encodingres.apparent_encodingprint(res.text[:1000])except:print(spider failed)几个小实例基本的爬取更改agent的方式有些网站并不想让你爬所以会限制爬虫(因为你太老实了危)像这样就返回503了。这个时候我们就可以动一下小手脚我们把user-agent这个自报家门的东西换点(默认的参数自报是python爬虫)我们改成一个浏览器的名字‘Mozilla/5.0’骗一骗它。这样我们就绕开了这个小反爬。(仅供娱乐玩家使用偶尔这么搞一搞)访问资源的子部分比如我们像用搜索引擎查一查某个东西。哪怎么搞呢我们去必应搜索了一波‘抗疫感想’发现它长这个样子那ok了我们只需要把这串url里面的q后面的换成我们想要的查就好。还记得**args这个参数吗? 我们往里面加点料开一个字典search{q: xxx}到时候它request的时候便会帮我们把参数pxxx搞到url上去。关于什么能爬什么不能爬一般很多网站会把什么能爬什么不能爬写出来。搞一个robots协议公开给大家看。我们只要在一个网站url后面加一个/robots.txt就能查看。User-agent: msnbot-mediaDisallow: /Allow: /th?User-agent: TwitterbotDisallow:User-agent: *Disallow: /account/Disallow: /amp/Allow: /api/maps/取了一小部分这里可以看到bing的/api/maps/是对所有爬虫都开放的(allow了)而对/account/这一部分是不允许别人爬的。而对于Twitterbot不让爬。
http://www.pierceye.com/news/193828/

相关文章:

  • 上海做兼职哪个网站腾讯企业邮箱域名是什么
  • 霸州网站制作棋牌网站建设源码
  • 茶叶网站制作模板网页设计在安阳工资多少
  • 网站建设项目验收方案自己做捕鱼网站能不能挣钱
  • 微信网页网站怎么做我为群众办实事实践活动
  • 建设银行发卡银行网站福州 网站设计
  • 网站备案号码舟山高端网站建设
  • 买奢侈品代工厂做的产品的网站名建立网站 英语怎么说
  • 网站访问者qq计算机等级培训机构
  • 可以让外国人做问卷调查的网站济南优化seo网站建设公司
  • odoo做网站创建企业需要什么条件
  • 山西省旅游网站建设分析wordpress 个人介绍
  • 山东高级网站建设赚钱
  • 做网站大概要多少钱新建网站的外链多久生效
  • 天河区建设网站品牌网站建设小8蝌蚪
  • 深圳市企业网站seo点击软件小程序游戏开发公司
  • 南宁企业网站设计公怎么进wordpress
  • 商务网站建设一万字做视频剪辑接私活的网站
  • 网站开发绪论phpstudy建wordpress
  • 网站建设的基本流程有哪些wordpress产品页布局
  • 写过太原的网站免费漫画大全免费版
  • 毕业设计做系统好还是网站好冠县网站建设公司
  • 网站管理制度建设开发一个网站需要多少时间
  • 高校网站建设说明书微信公众号涨粉 网站
  • 深圳网站建设公司哪里好中国施工企业管理协会官网
  • 网站自动抢注步步高学习机进网站怎么做
  • 带域名的网站打不开深圳网站优化多少钱
  • 中国空间站科幻作文1000字网站建设从化
  • 做网站买一个域名就够了吗cn域名知名网站
  • 社科联网站建设个人网页英文