摄像头怎么做直播网站,个人成立公司怎么做企业网站,网站做成微信小程序,看想看的做想做的电影网站好我的数据是先把url链接获取到存入excel中#xff0c;后续对excel做的处理#xff0c;各位也可以直接在程序中做处理#xff0c;下面就是针对excel中的链接做批量处理 excel内容格式如下#xff08;涉及具体数据做了隐藏#xff09;
标题文件链接文件日期网页标题1http://…我的数据是先把url链接获取到存入excel中后续对excel做的处理各位也可以直接在程序中做处理下面就是针对excel中的链接做批量处理 excel内容格式如下涉及具体数据做了隐藏
标题文件链接文件日期网页标题1http://www.aaabbbcc.com.cn2024.2.5 代码逻辑先读取excel文件内容循环转换每一行的链接 具体代码示例 注意pdfkitwkhtmltopdf一般情况下是需要安装的已安装的忽略wkhtmltopdf需要去官网下载安装包手动安装才可以 wkhtmltopdf下载https://wkhtmltopdf.org/downloads.html 安装pdfkitwkhtmltopdf
pip install pdfkit
pip install wkhtmltopdf 官网下载wkhtmltopdf
# 将链接的网页保存为 PDF
import pdfkit
import pandas as pd
#读取excel
dfpd.read_excel(rD:\WeChat\WeChat Files\wxid_ec4y3bp7rexo22\FileStorage\File\2024-02\示例数据.xlsx)
#循环获取每一行数据
for index, row in df.iterrows():url row[文件链接] #获取url#配置wkhtmltopdf环境如果在系统环境变量中已经存在可以忽略为保证代码生效建议配置config pdfkit.configuration(wkhtmltopdfrD:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe)#调用URL并保存pdf这里我把标题设置为pdf的文件名具体设置看个人哈pdfkit.from_url(url, rE:\1-work\模型\爬取数据文档\pdf\{}.pdf.format(row[标题]), configurationconfig)运行完成