当前位置: 首页 > news >正文

如何建立新的企业网站类似于建设通的网站

如何建立新的企业网站,类似于建设通的网站,做个简单的公司网站要多少钱,wordpress 行间距很多用Python的人可能都写过网络爬虫#xff0c;自动化获取网络数据确实是一件令人愉悦的事情#xff0c;而Python很好的帮助我们达到这种愉悦。然而#xff0c;爬虫经常要碰到各种登录、验证的阻挠#xff0c;让人灰心丧气(网站#xff1a;天天碰到各种各样的爬虫抓我们网…很多用Python的人可能都写过网络爬虫自动化获取网络数据确实是一件令人愉悦的事情而Python很好的帮助我们达到这种愉悦。然而爬虫经常要碰到各种登录、验证的阻挠让人灰心丧气(网站天天碰到各种各样的爬虫抓我们网站也很让人灰心丧气)。爬虫和反爬虫就是一个猫和老鼠的游戏道高一尺魔高一丈两者反复纠缠。由于http协议的无状态性登录验证都是通过传递cookies来实现的。通过浏览器登录一次登录信息的cookie是就会被浏览器保存下来。下次再打开该网站时浏览器自动带上保存的cookies只有cookies还未过期对于网站来说你就还是登录状态的。browsercookie模块就是这样一个从浏览器提取保存的cookies的工具。它是一个很有用的爬虫工具通过加载你浏览器的cookies到一个cookiejar对象里面让你轻松下载需要登录的网页内容。安装pip install browsercookie在Windows系统中内置的sqlite模块在加载FireFox数据库时会抛出错误。需要更新sqlite的版本pip install pysqlite使用方法下面是从网页提取标题的例子 import re get_title lambda html: re.findall((.*?), html, flagsre.DOTALL)[0].strip()下面是未登录状况下下载得到的标题 import urllib2 url public_html urllib2.urlopen(url).read() get_title(public_html)Git and Mercurial code management for teams接下来使用browsercookie从登录过Bitbucket的FireFox里面获取cookie再下载 import browsercookie cj browsercookie.firefox() opener urllib2.build_opener(urllib2.HTTPCookieProcessor(cj)) login_html opener.open(url).read() get_title(login_html)richardpenman / home — Bitbucket上面是Python2的代码再试试 Python3: import urllib.request public_html urllib.request.urlopen(url).read() opener urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))你可以看到你的用户名出现在title里面了说明browsercookie模块成功从FireFox加载了cookies。下面是使用requests的例子这次我们从Chrome里面加载cookies当然你需要事先用Chrome登录Bitbucket import requests cj browsercookie.chrome() r requests.get(url, cookiescj) get_title(r.content)richardpenman / home — Bitbucket如果你不知道或不关心那个浏览器有你需要的cookies你可以这样操作 cj browsercookie.load() r requests.get(url, cookiescj) get_title(r.content)richardpenman / home — Bitbucket支持目前该模块支持以下平台Chrome: Linux, OSX, WindowsFirefox: Linux, OSX, Windows目前该模块测试过的浏览器版本还不是很多你使用过程中可能会遇到问题可以向作者提交问题https://bitbucket.org/richardpenman/browsercookie/
http://www.pierceye.com/news/360/

相关文章:

  • 凡科建设网站还用买服务器吗跑步机 东莞网站建设
  • 设计之路 网站artisteer 做的网站
  • 网站设计论文框架动画设计专业大学排名国内
  • 什么叫网站策划书找别人做网站怎么防止别人修改
  • 合川建网站有哪些平台可以发布推广信息
  • 服务好的丹阳网站建设机械加工订单
  • 教做网站的学校注册一个小程序多少钱
  • WordPress适合做多大级别的网站360全景网站建设
  • 专做皮具的网站国内培训网站建设
  • wordpress网站代码文件太多长春关键词优化公司
  • 嘉兴企业做网站wordpress the_tag
  • 跨境网站有哪些可以加外链的网站
  • 每月网站开发费用策划书模板范文
  • 成都新线加做网站网站建设主要做什么
  • 提高网站排名上海知名网站建设公司排名
  • 网站的空间需要续费么公司注册网上查名
  • 太原专业网站制作防伪查询网站
  • 青岛做网站辽宁网站建设专业学校
  • 长春网站建设长春顺德搜索seo网络推广
  • 门户网站群建设企业网站建设商城
  • wordpress站内跳转米问外贸论坛
  • 网站设计模板图中山做网站专业的公司
  • iis的网站登录没反应公司局域网
  • 上海企业网站优化公司使用asp.net制作网站的整体过程
  • 个性化网站做dj音叉网站平台
  • 深圳网站建设外包公司排名php做网站的支付功能
  • 文山 网站建设 滇icpwordpress 微信支付
  • 常见的企业网站有哪些舞台灯光网站建设公司
  • 广州软件网站开发简易个人网页模板
  • wordpress首页加图片电脑优化大师