当前位置: 首页 > news >正文

效果图网站都有哪些?宁波做小程序开发公司

效果图网站都有哪些?,宁波做小程序开发公司,企业网站建设费如何列支,制作小网站分析url的网页源代码#xff0c;在源代码里有我们想要的评论数据#xff0c;我们可以用正则(在这里正则还是比较好用的)把我们想要的信息弄下来开启循环#xff0c;批量抓取保存数据至文本和数据库defparse_one_page(html):pattern2 re.compile( m_type:…分析url的网页源代码在源代码里有我们想要的评论数据我们可以用正则(在这里正则还是比较好用的)把我们想要的信息弄下来开启循环批量抓取保存数据至文本和数据库defparse_one_page(html):pattern2 re.compile( m_type:0,(.*?),username, re.S)itemsre.findall(pattern2,html)foritem initems:item { item }itemjson.loads(item)write_to_file(item)print(item)save_to_mongo(item)#皮皮哥告诉了我他的独家正则匹配方法可以匹配出来这样的确获得的item没有编码问题defparse_one_page(html):pattern content:.*?itemsre.findall(pattern,html)foritem initems:item eval(item.split( :, 1)[ 1])write_to_file(item)print(item)save_to_mongo(item)#对一般正则写法获得的item进行的方法这是从皮皮哥那里得知的亲测有效defparse_one_page(html):pattern re.compile( rsion_name.*?content:(.*?),username, re.S)itemsre.findall(pattern,html)#print(items)foritem initems:item item.encode( utf-8).decode( unicode_escape)write_to_file(item)print(item)save_to_mongo(item)三、代码#config.pyMONGO_URL localhostMONGO_DB meituanMONGO_TABLE meituanimportrequestsfromrequests.exceptions importRequestExceptionimportjsonimportrefromday31.config import*importpymongoclientpymongo.MongoClient(MONGO_URL)dbclient[MONGO_DB]base_url http://comment.mobilem.360.cn/comment/getComments?callbackjQuery17209056727722758744_1502991196139baike%E7%BE%8E%E5%9B%A2%E5%A4%96%E5%8D%96Android_com.sankuai.meituan.takeoutnewstartdefthe_url(url):try:response requests.get(url)ifresponse.status_code 200:response.encoding utf-8returnresponse.textreturnNoneexceptRequestException:print( 请求出错)returnNonedefthe_total():htmlthe_url(base_url)pattern1 re.compile( total:(.*?),messages, re.S)Total re.findall(pattern1, html)Totalint( :.join(Total))#print(type(Total))show 总计评论%d条%Totalprint(show)write_to_file(show)returnTotaldefparse_one_page(html):pattern2 re.compile( m_type:0,(.*?),username, re.S)itemsre.findall(pattern2,html)foritem initems:item { item }itemjson.loads(item)write_to_file(item)print(item)save_to_mongo(item)defsave_to_mongo(result):try:ifdb[MONGO_TABLE].insert(result):print( 储存到MongoDB成功,result)exceptException:print( 储存到MongoDB失败,result)defwrite_to_file(content):withopen( meituan_result.text, a,encoding utf-8) asf:f.write(json.dumps(content,ensure_ascii False) n)f.close()defmain():Totalthe_total()Totalint(Total/ 10) 2fori inrange(Total):url base_url str(i* 10)ifthe_url(url)! None:htmlthe_url(url)parse_one_page(html)else:print( 输完啦)ps PS因为有些评论空所以实际评论比抓取的少#这是我瞎猜的write_to_file(ps)print(ps)if__name__ __main__:main()四、最后得到的数据视图和文件五、总结1.程序报错很正常不要一报错就问别人先自己思考、百度2.在数据类型处理方面的知识还要加强3.感谢皮皮哥、感谢姚文峰前辈作者1想得美链接http://www.jianshu.com/p/25c8b4cfda1a作者1想得美链接http://www.jianshu.com/p/25c8b4cfda1a
http://www.pierceye.com/news/427264/

相关文章:

  • 电力建设科学技术进步申报网站教学工作总结
  • 做淘宝客必须建网站吗杭州网站优化效果
  • 网站开发有什么职位用vs做网站教程
  • 行业网站渠道选择和内容运营网站续费问题
  • 什么是seo优化推广阿里云网站建设优化
  • 信息发布型网站建设的特点免费
  • 陕西有限公司网站建设招标公告如何做影视网站的标题
  • wordpress网站百度搜索吗百度关键词推广怎么做
  • 马鞍山市网站建设服务有限公司计算机平面设计主要做什么
  • 手机网站跟pc网站有什么不同怎样创建网站收益
  • 什么系统做购物网站好做面料那几个网站
  • 做网站产品资料表格做鞋设备网站
  • 青海西宁制作网站企业做网站用什么语言编写
  • 网站变成手机网站做简历的网站都有哪些内容
  • 汽车网站建设页面软件公司都是帮别人做网站么
  • 微信的企业网站模板深圳做关键词优化平台
  • 用什么框架做网站快网站建设与维护薪资
  • 深圳公明做网站用织梦做网站都需要用什么
  • 广西城乡建设部网站首页国家住房和城乡建设部中国建造师网站
  • 杭州高端网站设计公司天津做网站那家好
  • 怎么建立网站?长沙做网站价格
  • 新网网站后台登陆程序员为什么35岁就不能干?
  • 百度申诉网站seo项目经理
  • 北京网站排名优化软件花箱 东莞网站建设
  • wordpress 迁站如何来建设网站
  • 营销型企业网站建设哪家好自己个人网站后台怎么做
  • 如何做网站内链优化网店运营的工作内容
  • 邢台网站设计cute wordpress主题破解版
  • 建站网站案例什么在线做动图的网站比较好
  • 云南做网站哪家便宜对象存储链接WordPress