当前位置: 首页 > news >正文

企业的网站用vue做的网站的赚钱方式

企业的网站用vue做的,网站的赚钱方式,网站做301重定向怎么做,免费网站后台管理系统html微博爬取要做到每日百万级的数据量#xff0c;需要解决很多问题。 1.springboot自带Scheduled注解是一个轻量级的quartz#xff0c;可以完成定时任务。只需要在运行方法上加一个Scheduled注解即可。 该注解有许多属性值 initiaDelay 从程序开始延长一定时间后首次执行。 fixe…微博爬取要做到每日百万级的数据量需要解决很多问题。   1.springboot自带Scheduled注解是一个轻量级的quartz可以完成定时任务。只需要在运行方法上加一个Scheduled注解即可。 该注解有许多属性值 initiaDelay 从程序开始延长一定时间后首次执行。 fixedRate  首次后该方法固定执行间隔。 cron 定时表达式。 等等 如果想要并发编程在要执行定时任务的类上加注解EnableAsync在方法上加Async。 接下来要设置线程池的大小。 package com.cnxunao.weibospider.configuration;import org.springframework.context.annotation.Bean; import org.springframework.context.annotation.Configuration; import org.springframework.scheduling.annotation.EnableScheduling; import org.springframework.scheduling.annotation.SchedulingConfigurer; import org.springframework.scheduling.config.ScheduledTaskRegistrar;import java.util.concurrent.Executor; import java.util.concurrent.Executors;Configuration EnableScheduling public class ScheduleConfig implements SchedulingConfigurer {Overridepublic void configureTasks(ScheduledTaskRegistrar taskRegistrar) {taskRegistrar.setScheduler(taskExecutor());}/** 并行执行*/Bean(name TaskPool)public Executor taskExecutor() {return Executors.newScheduledThreadPool(5);}} 最后在启动类上加一个注解     2.微博的反爬机制还是蛮严格的亲自试验让代理服务器每6秒爬取一次是很稳定的不会被封。 也可以建立一个user_agent池用于反爬。都是亲测可用的 //user_Agent池private static String[] userAgents {Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.89 Safari/537.36,Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.163 Safari/535.1,Mozilla/5.0 (Windows NT 6.1; WOW64; rv:6.0) Gecko/20100101 Firefox/6.0,Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50,Opera/9.80 (Windows NT 6.1; U; zh-cn) Presto/2.9.168 Version/11.50,Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Win64; x64; Trident/5.0; .NET CLR 2.0.50727; SLCC2; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; InfoPath.3; .NET4.0C; Tablet PC 2.0; .NET4.0E),Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; WOW64; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; InfoPath.3),Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; GTB7.0),Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1),Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1),Mozilla/5.0 (Windows; U; Windows NT 6.1; ) AppleWebKit/534.12 (KHTML, like Gecko) Maxthon/3.0 Safari/534.12,Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.3 (KHTML, like Gecko) Chrome/6.0.472.33 Safari/534.3 SE 2.X MetaSr 1.0,Mozilla/5.0 (Windows NT 6.1) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/13.0.782.41 Safari/535.1 QQBrowser/6.9.11079.201,Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)}; //随机获取总数为14useragent池中的一个 private String userAgent userAgents[random.nextInt(14)]; 注随机获取1-13的整数 random.nextInt(13)1 。13位容量1位初始值。 还可以采用购买大量微博账号很便宜模拟登陆后获取cookie然后构建cookie池的方法。   3.购买代理ip的话需要调用商家的API来获取代理具体方法商家官网都有开发者文档代码有些简单这里就不发出来了。  如果使用springboot的话自定义配置可以使用Value来进行赋值。  application.properties   java文件  自动填充效果   4.java程序运行时间长后会变慢可以利用一些设计模式来解决性能的问题合理使用虚拟机内存空间即使删除不用的对象。我也是边学边做现在还没有完全解决之后会更新。 5.并发程序有时会造成读写数据的错乱问题需要了解一些并发编程的规范。还有一种办法把需要共享的数据放在redis里来解决这类问题。 6.如果你觉得微博关键字的爬取只能爬取首页太少可以在模拟登录后保存cookie进行爬取可以爬到所有的相关页面。 7.编程中日志是很重要的是反应情况分析问题解决问题的关键一定要在适当的程序位置加一些日志信息。下图是我写日志的一种方法。  转载于:https://www.cnblogs.com/Post-90sDachenchen/p/11104291.html
http://www.pierceye.com/news/401871/

相关文章:

  • 甘肃省嘉峪关建设局网站做游戏交易网站
  • 校园网站做自己的广告惠州网络问政平台官网
  • 网站建设使用的什么和国外做贸易用什么网站
  • 苏州自助建站模板宁波seo快速优化
  • 做网站的可行性分析网络推广渠道公司
  • 企业网站优化兴田德润优惠汕头网络营销推广该怎么做
  • 安徽省住房和建设厅网站企业网站建设硬件
  • 网站怎样运营网站文章收录
  • 怎么制作微网站wordpress 自动安装
  • 建设软件网站七台河新闻直播
  • 深圳 公司网站设计网站建设得花多少钱
  • 社交型网站首页面设计分析宁夏电建网站
  • 网站开发需要掌握的知识中国建设网官方网站
  • 制作网站素材网页设计代码步骤
  • 做微信头图的网站网页编程语言有哪几种
  • 医生工作室网站建设男女激烈做羞羞事网站网站韩剧
  • 网站里面网友点评怎么做网站开发需要资质吗
  • gta 买房网站建设中软件下载免费大全网站
  • 中国移动网站专门拍短视频的公司
  • 网站制作网站建设报价南通优化网站怎么收费
  • 网站的连接二维码怎么做wordpress.org账号
  • 优秀的网站有哪些内容wordpress重新安装删除哪个文件
  • 网站建设与发布需要什么手机端开发app
  • 无锡做网站无锡网站设计2345网址导航手机上网导航下载
  • html中文美食网站营销型网站维护费用
  • 电商网站建设课设用什么软件制作网站
  • 杭州手机网站wordpress随机调用页面
  • html5网站编写长网页网站
  • 订餐网站系统建设方案建一个网上商城需要多少钱
  • 手机网站asp付费抽奖网站怎么做