在那个网站可以搜索做凉菜视频,合肥网站开发,北京别墅设计网站,校园网站建设用什么软件写引言#xff1a;最近闲来无事所以想着学习下python3#xff0c;看了好长时间的文档#xff0c;于是用python3写了一个漫画抓取的程序#xff0c;好了 废话不多说上码#xff01;第一步#xff1a;准备环境 和类库#xff0c;我用的是python3.5 禁用 python2.x 最近闲来无事所以想着学习下python3看了好长时间的文档于是用python3写了一个漫画抓取的程序好了 废话不多说上码第一步准备环境 和类库我用的是python3.5 禁用 python2.x 禁用 python2.x 禁用 python2.x 用到的类库requests lxml bs4 fake_useragent pymysql这里你 pip 安装也好或者用pycharmpycharm 引包位置第二步找漫画网站先说好本教程仅供学习交流禁止用于商务用途和其他用途我选了一家相对还不错的漫画网站各位小伙伴没事可以去看看传送门 https://www.mkzhan.com第三步 开始编程了 准备好小伙伴好了先导包然后那编辑几个需要用到的方法先做一个请求网页的方法在这里headers 需要配置一个user-agent,否则很容易就会被对方服务器发现你是爬虫那然后创建一个图片检测方法毕竟图片损坏了你下载下来也没用先抓详情 来分析下页面结构嗯 这是我找出一些有用的信息 不过今天我们只用到标题 封面 和章节然后哪章节列表举栗子先上码分析下li 特性 class 里都有一个参数 j-chapter-item 那好 find_all 把符合规则的拿出来然后根据标题创建文件夹同时根据封面的页面规则 抓到封面的img 放到之前写好的 get_img 方法里检测下然后open 下载下来刚刚抓好的章节列表遍历下毕竟我们要把每章节的每张有用图片下载下来新建一个章节的抓取方法这里要把章节里的图片抓取出来按照上面分析下html结构根据规则做相应的抓取 并将图片下载到相应的位置结果好了大功告成代码虽然很比较low 但毕竟一个初级学员 大神勿喷相对于想开始尝试做一下python抓取的同学很合适哦不多说上源码 github传送门