当前位置: 首页 > news >正文

关于建网站做淘宝联盟美容院装修

关于建网站做淘宝联盟,美容院装修,wordpress百度网盘插件,开发小程序好的公司python爬虫selenium和ddddocr使用 selenium使用 selenium实际上是web自动化测试工具#xff0c;能够通过代码完全模拟人使用浏览器自动访问目标站点并操作来进行web测试。 通过pythonselenium结合来实现爬虫十分巧妙。 由于是模拟人的点击来操作#xff0c;所以实际上被反…python爬虫selenium和ddddocr使用 selenium使用 selenium实际上是web自动化测试工具能够通过代码完全模拟人使用浏览器自动访问目标站点并操作来进行web测试。 通过pythonselenium结合来实现爬虫十分巧妙。 由于是模拟人的点击来操作所以实际上被反爬的概率将大大降低。 selenium能够执行页面上的js对于js渲染的数据和模拟登陆处理起来非常容易。 1.安装 pip install selenium2.安装模拟驱动webdriver 以谷歌浏览器为例首先查看浏览器的版本号 下载对应版本号的安装包,下好后解压 版本号70-114http://chromedriver.storage.googleapis.com/index.html 版本号118-120https://googlechromelabs.github.io/chrome-for-testing/#stable 3.代码编写 首先引入包 from selenium import webdriver from selenium.webdriver.chrome.service import Service配置浏览器启动地址和webservice地址 options webdriver.ChromeOptions() options.binary_location chrome.exe的地址 driver_location chromedriver.exe的地址打开浏览器并访问网站 browser webdriver.Chrome(serviceService(driver_location), optionsoptions) browser.get(https://www.jd.com/)完整代码 # Author : 陈天在睡觉 # Time : 2023/10/28 23:19 from selenium import webdriver from selenium.webdriver.chrome.service import Serviceoptions webdriver.ChromeOptions() options.binary_location C:\\chrome.exe# 谷歌浏览器地址 driver_location E:\\chromedriver.exe# 谷歌浏览器driver地址 browser webdriver.Chrome(serviceService(driver_location), optionsoptions) browser.get(https://www.jd.com/) # 访问网站这个时候我们发现浏览器打开页面后就会关闭我们只需要加上一行代码即可 options.add_experimental_option(detach,True)完整代码 4.获取元素 我们可以通过drowser的find_element找到对象 from selenium.webdriver.common.by import By browser.find_element(By.ID,title)#通过id来查找id为title的元素老版本的selenium查找方法为 from selenium.webdriver.common.by import By browser.find_element_by_id(title)找到元素可以使用click()模拟点击send_keys()模拟输入 from selenium.webdriver.common.by import By username browser.find_element(By.ID,username) submit browser.find_element(By.ID,submit) username.send_keys(admin) submit.click()ddddocr使用 ddddocrDeep Double-Digital Digits OCR是一个基于深度学习的数字识别库专门用于识别双重数字双位数字的任务。它是一个开源项目提供了训练和预测的功能可用于识别图片中的双位数字并输出其具体的数值。 深度学习ddddocr利用深度学习技术特别是卷积神经网络和循环神经网络对双重数字进行准确的识别。开源项目ddddocr是一个开源项目允许用户免费使用、修改和分发代码。这使得更多的开发者可以参与其中贡献自己的想法和改进。高准确率通过深度学习的方法ddddocr在双重数字识别任务上能够取得较高的准确率有效克服了传统方法在此任务上的困难。灵活性ddddocr提供了训练和预测的功能用户可以根据自己的需求自定义模型并进行训练以适应不同的双重数字识别任务。 ddddocr的目标是提供一个简单而有效的工具帮助开发者和研究者在双重数字识别任务上取得更好的结果。通过使用该库用户可以轻松地集成双重数字识别功能到自己的应用程序或项目中实现更准确和可靠的数字识别功能。 1.安装 需要注意的是python版本过高是安装不了的我使用的是python3.9 pip install ddddocr2.修改配置 我们直接使用ddddocr会出现以下错误 原因是在pillow的10.0.0版本中ANTIALIAS方法被删除了使用新的方法即可 旧方法Image.ANTIALIAS 新方法Image.LANCZOS 解决办法 方案一修改ddddocr的_init_.py文件将其中的ANTIALIAS替换为新方法 image image.resize((int(image.size[0] * (64 / image.size[1])), 64), Image.ANTIALIAS).convert(L)image image.resize((int(image.size[0] * (64 / image.size[1])), 64), Image.LANCZOS).convert(L)方案二降级Pillow的版本比如使用9.5.0版本 先卸载再重新安装 pip uninstall -y Pillowpip install Pillow9.5.0这里我采用的是方法一直接点击红框框里的文件 3.编写代码 直接上代码 # Author : 陈天在睡觉 # Time : 2023/10/29 21:50 import ddddocrocr ddddocr.DdddOcr() with open(img.png, rb) as f:image f.read() res ocr.classification(image)print(识别出的验证码为 res)测试的图片 测试结果 如果不想看到广告可以添加show_ad False # Author : 陈天在睡觉 # Time : 2023/10/29 21:50 import ddddocrocr ddddocr.DdddOcr(show_ad False) with open(img.png, rb) as f:image f.read() res ocr.classification(image)print(识别出的验证码为 res)
http://www.pierceye.com/news/290322/

相关文章:

  • 检察机关门户网站建设工作自查报告网站建设服务领域
  • 网站排名seo软件泉州高端模板建站
  • 昆山网站建设苦瓜网站建设费用会计分录
  • 免费pc网站建设网页设计与制作自学
  • 酒店 网站构建东莞常平碧桂园铂悦府
  • 子域名做微信开放平台网站应用公司做网站需要网站维护人员吗
  • 百度游戏排行榜风云榜青岛seo关键词优化排名
  • html写手机网站备案网站负责人
  • 做网站价位西安工程建设信息中心
  • 国外购物网站建设盐城做网站的哪家公司好
  • wordpress仿站软件遵化市城乡建设规划局网站
  • 湖北大网站建设贵州住房建设厅官网查询
  • 买个网站域名要多少钱一年网站建设热门吗
  • 高埗网站建设软件开发工程师就是程序员吗
  • 青岛正一品网站建设seo搜索优化排名
  • 响应式网站制设计wordpress游戏充值
  • 怎么看网站服务器地址网络设计一个月多少钱
  • 网站友情链接模块创作网站
  • 廉江手机网站建设公司商品展示介绍网站源码
  • 网站备案更换主体ui设计素材
  • 湖南住房和建设厅网站免费的网站建设开发
  • 苏州园区建设网站首页娱乐新闻做的好的网站
  • 江苏省建设集团有限公司网站做网站的软件dw下载
  • 做网站需要学些什么软件杭州学校网站建设
  • 建设银行网上银行网站可以开通网银wordpress 种子插件
  • 一般网站图标是用什么做的网件路由器无线中继
  • 手机 网站 开发淘宝店铺网站策划书
  • 网站建设规划方案书滨州网站建设 中企动力
  • 网站建设品牌推荐做网站必须要公网ip
  • 做网站卖东西赚钱wordpress微信网站