当前位置: 首页 > news >正文

网站技术策划人员要求wordpress模板添加主题

网站技术策划人员要求,wordpress模板添加主题,广州网站导航,济南网站设计哪家好1. 概念 1.1 什么是Determined#xff1f; Determined AI 是一个全功能的深度学习平台#xff0c;兼容 PyTorch 和 TensorFlow。它主要负责以下几个方面#xff1a; 分布式训练#xff1a;Determined AI 可以将训练工作负载分布在多个 GPU#xff08;可能在多台计算机上…1. 概念 1.1 什么是Determined Determined AI 是一个全功能的深度学习平台兼容 PyTorch 和 TensorFlow。它主要负责以下几个方面 分布式训练Determined AI 可以将训练工作负载分布在多个 GPU可能在多台计算机上上而无需更改代码。无论是在一台计算机上利用2个 GPU 还是在多台计算机上利用16个 GPU都只需更改配置即可。超参数调优Determined AI 提供了自动超参数搜索功能可以帮助你找到最优的模型参数。资源管理Determined AI 可以有效地管理和调度计算资源以降低云 GPU 的成本。实验跟踪Determined AI 可以跟踪和记录实验的过程方便你分析结果和复现实验。 Determined AI 的主要组件之一是命令行接口CLI它提供了一种高效的方式来管理和控制系统的各个方面。例如你可以使用 CLI 来创建、列出和管理实验以及访问重要的实验指标和日志。CLI 还可以帮助你管理作业队列监控正在进行的任务的进度甚至根据需要优先处理或取消作业。 此外Determined AI 还支持自由形式的任务如命令和 Shell。命令和 Shell 使开发人员可以在不必编写符合试验 API 的代码的情况下使用 Determined 集群和其 GPU。 1.2 Determined集群中的Master和Agent分别表示什么意思 在 Determined 集群中Master 和 Agent 有特定的角色和功能。 MasterMaster 是 Determined 集群的核心它负责管理和调度所有的任务。Master 接收来自用户通过网页、CLI 等方式的请求并将这些请求发送到 Agent 进行处理。Master 的行为可以通过设置配置变量来控制这可以通过使用配置文件、环境变量或命令行选项来完成。AgentAgent 是执行任务的节点它们在 Master 的调度下运行任务。每个 Agent 都有一个唯一的 ID默认为当前机器的主机名并且在一个集群中必须是唯一的。Agent 节点通常是配备 GPU 的服务器用于运行计算密集型的深度学习任务。 总的来说Master 负责管理和调度任务而 Agent 负责执行这些任务。 2. 部署与配置 2.1 在本地部署 在部署 Master 与 Agent 节点的服务器上需要先安装好 Docker安装教程Ubuntu 系统下Install Docker Engine on Ubuntu。 安装 nvidia-container-toolkitMaster 和存储节点不需要 GPU也无需安装 Nvidia 相关的内容否则部署使用 GPU 的集群会出现报错 Internal Server Error (could not select device driver nvidia with capabilities: [[gpu utility]]) distribution$(. /etc/os-release;echo $ID$VERSION_ID)curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.listsudo apt-get updatesudo apt-get install -y --no-install-recommends nvidia-container-toolkitsudo service docker restart安装 Determined 库并在本地启动集群对于本地开发或小型集群例如 GPU 工作站您可能希望同时安装 Master 和 Agent 位于同一节点上因此可以使用 cluster-up pip install determined # 可能会有某些包之间存在版本冲突需要解决# If your machine has GPUs: det deploy local cluster-up# If your machine does not have GPUs: det deploy local cluster-up --no-gpu如果 det 命令识别不到可能是没有配置环境变量 sudo vim /etc/environment 在 PATHxxx 后面添加 :/home/用户名/.local/bin 即: xxx:/home/用户名/.local/binsource /etc/environment # 应用更新要停止 Determined 集群请在当前运行 Determined 集群的计算机上运行 det deploy local cluster-down在许多情况下Determined 集群将由多个节点组成。在这种情况下您将需要分别启动 Master 和 Agents。启动和停止独立 Master det deploy local master-up # 启动 det deploy local master-down # 停止若要在计算机上部署独立的 Agent请运行以下命令之一master_hostname 为 Master 的主机名 # If the machine has GPUs: det deploy local agent-up master_hostname# If the machine doesnt have GPUs: det deploy local agent-up --no-gpu master_hostname# Stop Agent det deploy local agent-down与用户相关的指令 det user list # 列出所有的用户包括他们的用户名、管理员状态、活动状态等 det user get username # 显示某用户的详细信息包括他们是否已经登录访问 http://localhost:8080/用户名为 determined密码留空即可登录。 2.2 配置参考 查看当前 Master 配置信息 det master config我们可以自定义 Master 的配置在需要部署 Master 的服务器上创建 Master 配置文件 master-config.yaml具体配置教程见Master Configuration Reference参考内容如下 __internal:audit_logging_enabled: falseexternal_sessions:jwt_key: login_uri: logout_uri: proxied_servers: null cache:cache_dir: /var/cache/determined checkpoint_storage:host_path: /home/ubuntu/.local/share/determinedpropagation: nullsave_experiment_best: 0save_trial_best: 1save_trial_latest: 1storage_path: nulltype: shared_fs cluster_name: config_file: db:host: determined-dbmigrations: file:///usr/share/determined/master/static/migrationsname: determinedpassword: ********port: 5432ssl_mode: disablessl_root_cert: user: postgres enable_cors: false feature_switches: [] integrations:pachyderm:address: launch_error: true log:color: truelevel: info logging:type: default notebook_timeout: null observability:enable_prometheus: false port: 8080 reserved_ports: null resource_manager:client_ca: default_aux_resource_pool: default # 默认辅助资源池default_compute_resource_pool: defaut # 默认计算资源池no_default_resource_pools: falserequire_authentication: falsescheduler:allow_heterogeneous_fits: falsefitting_policy: besttype: fair_sharetype: agent resource_pools: # 设置资源池 - agent_reattach_enabled: falseagent_reconnect_wait: 25sdescription: kubernetes_namespace: max_aux_containers_per_agent: 100pool_name: defaultprovider: nulltask_container_defaults: null - agent_reattach_enabled: falseagent_reconnect_wait: 25sdescription: kubernetes_namespace: max_aux_containers_per_agent: 100pool_name: RTX3090provider: nulltask_container_defaults: null root: /usr/share/determined/master security:authz:_strict_ntsc_enabled: falsefallback: basicrbac_ui_enabled: nullstrict_job_queue_control: falsetype: basicworkspace_creator_assign_role:enabled: truerole_id: 2default_task:gid: 0group: rootid: 0uid: 0user: rootuser_id: 0ssh:rsa_key_size: 1024tls:cert: key: task_container_defaults:add_capabilities: nullbind_mounts: nullcpu_pod_spec: nulldevices: nulldrop_capabilities: nullgpu_pod_spec: nullkubernetes: nulllog_policies: nullnetwork_mode: bridgepbs: {}shm_size_bytes: 4294967296slurm: {}work_dir: null telemetry:cluster_id: enabled: trueotel_enabled: falseotel_endpoint: localhost:4317segment_master_key: ********segment_webui_key: ******** tensorboard_timeout: 300 webhooks:base_url: signing_key: fc9942f4d575然后即可使用配置文件启动集群 det deploy local cluster-up --master-config-path ./master-config.yaml在需要部署 Agent 的服务器上创建 Agent 配置文件 agent-config.yaml具体配置教程见Agent Configuration Reference参考内容如下 # 必填用于确定 Master 节点的主机名或 IP 地址 master_host: ip_of_your_master_node # Master 节点的端口。 master_port: 8080# 此 Agent 的 ID默认为当前计算机的主机名ID 在集群中必须是唯一的 agent_id: RTX3090_0 # 指定分配到哪个资源池 resource_pool: RTX3090# Agent 容器的 HTTP/HTTPS 代理地址 http_proxy: ip_of_proxy https_proxy: ip_of_proxy这里主要配置3个内容 Master 节点主机名和端口号用于识别 Master 节点。agent_id 和 resource_pool分别对应本机 ID 和资源池根据显卡型号命名即可注意资源池需要已在 Master 配置文件中定义过。科学上网代理。 完成后所有 Agent 节点使用如下命令启动最后的 0.29.0 为 Determined AI 的版本号根据自己安装的版本修改即可 docker run --gpus all -v /var/run/docker.sock:/var/run/docker.sock -v $PWD/agent-config.yaml:/etc/determined/agent.yaml determinedai/determined-agent:0.29.02.3 命令行、Notebook、Shell的使用方法 Determined 主要有两种使用方式Web 和 CLI。其中 Web 可以直接通过 Master节点IP:8080 进行访问 但是不推荐使用 Web 方式因为网页端创建任务无法自定义存储路径和加载的 Docker 镜像灵活度十分受限。因此接下来详细介绍 CLI 的用法。 首先在终端机安装好 Determined然后在环境变量中配置 Master 节点 IP vim ~/.bashrc# 添加以下内容保存并退出 export DET_MASTERMaster节点的IPsource ~/.bashrc接下来可以使用 Determined CLI 创建任务首先在终端机需要登录在 Admin 用户用户名为 admin密码留空中可以管理其他用户假设已经给终端机创建好账号即可登录 det user login然后写一个开启任务的 Yaml 配置文件这里给出一个参考 description: test_task resources:resource_pool: RTX3090slots: 1 # 将物理机上host_path路径下的文件挂载到用户当前使用的容器的container_path路径下 bind_mounts:- host_path: /home/ubuntu/container_path: /run/determined/workdir/asanosaki/ environment: # Docker容器的环境配置包括使用的镜像和环境变量image: determinedai/environments:cuda-11.8-pytorch-2.0-gpu-0.29.1environment_variables:- http_proxyip_of_proxy- https_proxyip_of_proxyDetermined 官方给出了很多个版本的 CUDA 和框架的组合可以自行选择所需要的镜像Determined AI Docker 镜像列表Docker Hub DeterminedAI。 完成后可以选择开启 Jupyter Notebook 或者终端这取决于使用者的习惯 # Notebook det notebook start --config-file config.yaml# CMD det cmd run --config-file config.yaml# Shell det shell start --config-file config.yaml对应的停止任务指令如下 # Notebook det notebook kill ID# CMD det cmd kill ID# Shell det shell kill ID任务的 ID 可通过 det task list 查看所有任务信息获得写前8位即可。 2.4 创建实验 先下载官方的项目示例代码mnist_pytorch.tgz。 将其解压到当前目录 tar zxvf mnist_pytorch.tgz -C ./ cd mnist_pytorch可以看到该目录下有单卡运行实验以及多卡并行运行实验的实验配置文件 const.yaml 和 distributed.yaml此处给出 distributed.yaml 配置参考内容如下 name: mnist_pytorch_distributed hyperparameters:learning_rate: 1.0n_filters1: 32n_filters2: 64dropout1: 0.25dropout2: 0.5 searcher:name: singlemetric: validation_lossmax_length:epochs: 1smaller_is_better: true entrypoint: python3 -m determined.launch.torch_distributed python3 train.py description: test_task resources:resource_pool: RTX3090slots_per_trial: 2 bind_mounts:- host_path: /home/ubuntu/container_path: /run/determined/workdir/asanosaki/ environment:image: determinedai/environments:cuda-11.8-pytorch-2.0-gpu-0.29.1environment_variables:- http_proxyip_of_proxy- https_proxyip_of_proxy接下来即可通过配置文件创建任务最后一个 . 表示上传当前目录中的所有文件作为模型的上下文目录。Determined 将模型上下文目录内容复制到试验容器工作目录 det experiment create distributed.yaml .2.5 通过VSCode SSH连接 首先确保 VSCode 已经安装 Remote - SSH 扩展当用户开启了 Shell 后可以在终端机上执行以下命令获取 Shell 的 SSH 登录命令 det shell show_ssh_command SHELL UUID复制 SSH 命令在 VS Code 的 Remote Explorer 页面下即可添加连接。
http://www.pierceye.com/news/464979/

相关文章:

  • 建立网站花钱吗wordpress表结构写入不全
  • 绿色家园网站怎么做导出wordpress文章
  • 合肥有什么好的网站建设公司网站建设的售后服务流程
  • 做网站烧钱吗济南免费建站
  • ps个人主页网页设计模板汕头关键词优化服务
  • 网站建设功能图网站开发新技术探索
  • 做自行车网站应该注意什么个人介绍网页设计模板
  • 邢台网站建设免费做网站排名上海开发app
  • 沈阳网站建设设计企业网站设计与管理系统
  • 婚纱照网站制作梁山网站建设价格
  • 做现货去哪些网站营销好呢网站 服务报价
  • 网站建设渠道做网站前端和平面配合
  • 北京交友最好的网站建设wordpress 移动支付宝
  • 2015百度推广网站遭到攻击非遗网页设计作品欣赏
  • 网站空间需要多大网站推荐几个免费的
  • 做一个网站花多少钱建行系统
  • 滁州市住房城乡建设部网站wordpress title背景
  • 餐饮手机微网站怎么做wordpress 多语言建站
  • 企业信息系统案例东昌府聊城网站优化
  • 做美食直播哪个网站好php网站开发数据列表排重
  • 网站建设 职责网站分站加盟
  • 单页网站产品手机网站免费生成
  • 无锡电子商务网站建设公司德国网站的后缀名
  • 服务器做视频网站赣州企业做网站
  • 如何看出网站用dede做的网站百度快照
  • 做网站很难吗五种新型营销方式
  • 个人网站搭建模拟感想江西企业网站建设哪家好
  • 长春企业网站建设网站制作公司相关工作
  • 免费课程网站有哪些兼职网站项目建设报告
  • 建立网站免费dedecms网站地图制作