公司内部交流 网站模板,企业推广专员招聘,营销型网站建设好不好,公司微网站建设价格该内容出自黑马程序员教程
采集最近一日世界各国疫情数据
步骤#xff1a;
发送请求#xff0c;获取疫情首页从疫情首页中提取最近一日各国疫情字符串从最近一日各国疫情字符串中提取json格式字符串把json格式字符串转换为Python类型把Python类型的数据#xff0c;以json…该内容出自黑马程序员教程
采集最近一日世界各国疫情数据
步骤
发送请求获取疫情首页从疫情首页中提取最近一日各国疫情字符串从最近一日各国疫情字符串中提取json格式字符串把json格式字符串转换为Python类型把Python类型的数据以json格式存入文件中
当然数据来源仍然是丁香园新型冠状病毒肺炎疫情实时动态首页 urlhttps://ncov.dxy.cn/ncovh5/view/pneumonia 很显然idgetListByCountryTypeService2true这里面存有世界各国疫情数据
import requests
import re
import json
from bs4 import BeautifulSoup#1发送请求获取疫情首页
response requests.get(https://ncov.dxy.cn/ncovh5/view/pneumonia)
home_page response.content.decode()#2从疫情首页提取最近一日各国疫情数据
soup BeautifulSoup(home_page,lxml)
script soup.find(idgetListByCountryTypeService2true)
text script.text
#print(text)#3从疫情数据中获取json格式的字符串
json_str re.findall(r\[.\],text)[0]#由于中括号是个特殊的字符需要在前面加个转义符最后的结果会存在列表中故使用[0]来获取完整json格式
#print(json_str)#4把json格式的字符串转换为Python类型
last_day_nature_num json.loads(json_str)
#print(last_day_nature_num)#5以json格式保存最近一日各国疫情数据
with open(E:\Jupyter_workspace\study\python\爬虫\last_day_nature_num.json,w) as fp:json.dump(last_day_nature_num,fp,ensure_asciiFalse)