当前位置：首页 > news >正文

深圳网站设计工资一般多少网站建设各单位强化沟通协作

news 2025/11/13 19:40:15

深圳网站设计工资一般多少,网站建设各单位强化沟通协作,基于html5的网站建设论文,WordPress写小说插件Python网页数据抓取常用的库及方法介绍摘要：以下是Python网络数据抓取常用的6个库的详细介绍，包括它们的概述以及每个库中最常用的10个函数（如果某些库常用函数不足10个，则列出所有常用函数）。每个函数都附带功能描述、用法说明和使用示例。这些库在网络爬虫、数据…Python网页数据抓取常用的库及方法介绍摘要：以下是Python网络数据抓取常用的6个库的详细介绍，包括它们的概述以及每个库中最常用的10个函数（如果某些库常用函数不足10个，则列出所有常用函数）。每个函数都附带功能描述、用法说明和使用示例。这些库在网络爬虫、数据采集和网页解析领域被广泛使用。 1. Requests 概述：Requests 是一个简单而强大的HTTP请求库，用于发送HTTP请求和处理响应，适合网络数据抓取和API交互。1.1 常用函数： requests.get() 功能：发送GET请求获取网页内容或API数据。用法：requests.get(url, params=None, headers=None)，url 是目标地址，params 是查询参数，headers 是请求头。示例： import requests response = requests.get('https://api.github.com') print(response.status_code) # 输出: 200 (请求成功) print(response.json()) # 输出: JSON格式的响应内容requests.post() 功能：发送POST请求，通常用于提交表单数据或API调用。用法：requests.post(url, data=None, json=None, headers=None)，data 是表单数据，json 是JSON数据。示例： import requests payload = {'username': 'test', 'password': 'pass'} response = requests.post('https://httpbin.org/post', data=payload) print(response.json()) # 输出: 服务器返回的表单数据requests.head() 功能：发送HEAD请求，仅获取响应头信息，不返回响应体。用法：requests.head(url, headers=None)，url 是目标地址。示例： import requests response = requests.head('https://www.example.com') print(response.headers) # 输出: 响应头信息requests.put() 功能：发送PUT请求，用于更新资源。用法：requests.put(url, data=None, json=None)，data 是更新数据。示例： import requests payload = {'key': 'value'} response = requests.put('https://httpbin.org/put', json=payload) print(response.json()) # 输出: 服务器返回的更新数据requests.delete() 功能：发送DELETE请求，用于删除资源。用法：requests.delete(url)，url 是目标地址。示例： import requests response = requests.delete('https://httpbin.org/delete') print(response.status_code) # 输出: 200 (删除成功)requests.Session() 功能：创建会话对象，保持连接状态（如cookie）。用法：requests.Session() 示例： import requests session = requests.Session() session.get('https://httpbin.org/cookies/set/sessioncookie/123456789') response = session.get('https://httpbin.org/cookies') print(response.json()) # 输出: 会话中的cookierequests.Response.status_code 功能：获取HTTP响应状态码。用法：response.status_code，response 是请求返回的对象。示例： import requests response = requests.get('https://www.example.com') print(response.status_code) # 输出: 200 (请求成功)requests.Response.text 功能：以字符串形式获取响应内容（适用于文本）。用法：response.text，response 是请求返回的对象。示例： import requests response = requests.get('https://www.example.com') print(response.text[:100]) # 输出: 网页内容的前100个字符requests.Response.json() 功能：将响应内容解析为JSON格式。用法：response.json()，response 是请求返回的对象。示例： import requests response = requests.get('https://api.github.com') data = response.json() print(data) # 输出: JSON解析后的数据requests.Response.headers 功能：获取响应头信息。用法：response.headers，response 是请求返回的对象。示例： import requests response = requests.get('https://www.example.com') print(response.headers) # 输出: 响应头字典2. Beautiful Soup 概述：Beautiful Soup 是一个用于解析HTML和XML文档的库，适合从网页中提取结构化数据。2.1 常用函数： bs4.BeautifulSoup() 功能：创建BeautifulSoup对象，解析HTML或XML内容。用法：bs4.BeautifulSoup(markup, parser)，markup 是HTML/XML字符串，parser 是解析器（如'lxml'）。示例： from bs4 import BeautifulSoup html = "pHello, World!/p" soup = BeautifulSoup(html, 'html.parser') print(soup.p.text) # 输出: Hello, World!BeautifulSoup.find() 功能：查找第一个匹配的标签或元素。用法：soup.find(name, attrs)，name 是标签名，attrs 是属性字典。示例： from bs4 import BeautifulSoup html = "divpFirst/ppSecond/p/div" soup = BeautifulSoup(html, 'html.parser') p_tag = soup.find('p') print(p_tag.text) # 输出: FirstBeautifulSoup.find_all() 功能：查找所有匹配的标签或元素，返回列表。用法：soup.find_all(name, attrs)，name 是标签名，attrs 是属性字典。示例： from bs4 import BeautifulSoup html = "divpFirst/p

查看全文

http://www.pierceye.com/news/324563/