当前位置: 首页 > news >正文

高品质网站开发阿里网站建设工具

高品质网站开发,阿里网站建设工具,wordpress好看博客主题,windows装wordpress一、前言介绍 在深度学习领域中#xff0c;标注是一项非常重要的工作#xff0c;因为许多深度学习模型都依赖于有标注的数据进行训练。然而#xff0c;标注数据是一个费时费力的工作#xff0c;因此人们希望有一种方式来对标注过程进行自动化。这就是“半自动标注”的来源…一、前言介绍 在深度学习领域中标注是一项非常重要的工作因为许多深度学习模型都依赖于有标注的数据进行训练。然而标注数据是一个费时费力的工作因此人们希望有一种方式来对标注过程进行自动化。这就是“半自动标注”的来源。半自动标注是一种折中的方式它结合了人类的判断能力和计算机的自动化能力。 在一个半自动标注的系统中步骤如下 1、初始的标注工作通常由人类来做 2、这些被标注的数据被用来训练一个深度学习模型使模型能做出预测并自动标注新的数据。 3、但模型预测出的标注可能会有误所以仍然需要人类进行审核和校正。 二、功能实现 1.数据集拆分 考虑到初始标注的数据集能有效兼顾需要对全部数据集随机拆分这样有助于有助于确保初始的标注数据集能代表整体数据集的特性。 例如如果有1万个数据样本可以使用的一种策略是使用10-20%的数据作为初始标注数据也就是1000-2000个样本。这样可以得到一个相当大的初始标注数据集可以提供足够的信息来训练模型。 import os import shutil import random# 指定源文件夹路径 source_folder your_source_folder # 替换为你的源文件夹路径# 指定目标文件夹路径 dest_folders [your_dest_folder1, your_dest_folder2, your_dest_folder3, your_dest_folder4, your_dest_folder5] # 替换为你的目标文件夹路径列表# 如果目标文件夹不存在创建它们 for folder in dest_folders:if not os.path.exists(folder):os.makedirs(folder)# 获取源文件夹中的所有jpg文件 jpg_files [f for f in os.listdir(source_folder) if f.endswith(.jpg)]# 随机打乱jpg文件列表 random.shuffle(jpg_files)# 均分文件到五个文件夹 split_files [jpg_files[i::5] for i in range(5)]# 将文件复制到对应的目标文件夹 for i in range(5):for file in split_files[i]:shutil.copy2(os.path.join(source_folder, file), dest_folders[i])2.标注初始数据集 从第一部分拆分的五个子数据集中选择第一个进行数据集标注。 标注软件labelImg labelImg 图像文件路径 标注的类别txt文件路径label的文件夹要放classes.txt(存放标注的类别) 3.yolov8训练预测并自动标注新的数据 强调点 要去掉无标签值的image[初始数据集中要删除无label的image免得影响模型的效果(也会将无标签的图片作为训练图片)] 3.1 标注文件的整理 对第二部分标注的初始数据集txt文件和image文件是放在一起删除内容为空的txt文件。再删除无txt文件的image文件 import os# 指定目录 directory /path/to/directorytxt_files [f for f in os.listdir(directory) if f.endswith(.txt)] jpg_files [f for f in os.listdir(directory) if f.endswith(.jpg)]# 检查文本文件如果文件为空就删除 for filename in txt_files:filepath os.path.join(directory, filename)# 判断文件是否为空if os.path.getsize(filepath) 0:os.remove(filepath)print(f{filename} is empty and has been removed.)txt_files.remove(filename) # 从文本文件列表中移除已删除的文件# 基于存在的文本文件如果对应的jpg文件存在但txt文件不存在则删除jpg文件 for filename in jpg_files:txt_filename filename.replace(.jpg, .txt)if txt_filename not in txt_files: # 在此判断txt文件是否存在jpg_filepath os.path.join(directory, filename)os.remove(jpg_filepath)print(f{filename} has been removed because its corresponding txt file does not exist.)3.2 将原图和标签按照yolo的数据集路径格式进行存放 dataset├─ images│ ├─ test # 存放测试集数据可无│ ├─ train # 存放训练集数据│ └─ val # 存放验证集数据└─ labels├─ test # 存放测试集标签可无├─ train # 存放训练集标签├─ val # 存放验证集标签3.3 训练与预测的代码 from ultralytics import YOLO # 目标检测 # # 加载模型 model YOLO(yolov8n.pt) # 加载预训练权重 # model YOLO(ultralytics/cfg/models/v8/yolov8n.yaml) # 配置文件# 模型训练 model.train(datayolov8n/data_detect.yaml, epochs100,imgsz 640,batch64) # 训练模型# 预测标签 source是待标注的数据集文件夹 Model.predict(source/home/sta/datasets/images1,save_txtTrue)3.校正预测的label 用labelImg标注软件,微调第二个数据集的label 4.依次处理第二、第三、第四和第五数据集 完成第二个子数据集将第一个和第二个合在一起再重新训练一个新的模型预测第三个子数据集依次处理
http://www.pierceye.com/news/494403/

相关文章:

  • 企业网站建设应避免数据孤岛深圳东莞网站建设
  • pk10网站怎么做郑州seo费用
  • 菏泽市建设局网站电话网站建设服务咨询
  • 购物网站模版广州外贸网络推广
  • 高碑店网站网站建设手机软件开发的模式
  • 公司网站开发国内外现状网络营销外包团队哪些好
  • 淘客网站怎么建立如何用api做网站
  • 合肥网站建设ahyedawordpress主题安全
  • 网站建设实训室介绍东莞seo广告宣传
  • 公职人员可以做公益网站吗aws网站建设
  • 什么叫高端网站定制广州建筑公司
  • 全新网站如何做百度竞价网站制作现状解决方案
  • 阿里云esc建设网站近三天时政热点
  • 怎样做公司网站介绍仿站网站源码下载
  • 电子商务网站规划与建设摘要软件app定制开发
  • 天水做网站的公司kj6699的seo综合查询
  • 找工程项目信息网站早那么做商城网站
  • 做网站优化销售管理系统排名
  • wordpress导入网站模板wordpress部分图片
  • 无锡做网站365caiyi秘密直播
  • 无锡企业网站制作报价公司做网站需要哪些手续
  • 最好的营销型网站保险购买平台有哪些
  • 网站建设实训的目的网站开发的框架协议
  • 本地郑州网站建设搭建一个网站
  • 如何做网站竞品分析哪个网站可以接任务做兼职
  • 佛山网站关键词网站建设需求分析文档
  • 网站收录地址旅游网站建设的相关报价
  • seo月薪seo优化方法网站快速排名推广渠道
  • 企业网站设计理念如何seo网站
  • 河南移动商城网站建设怎么创建平台卖自己的产品