深圳做微信网站制作,大专计算机网络技术就业方向,广东做网站公司有哪些,网站做全好吗GPU 硬件与 CUDA 程序开发工具 参考书籍#xff1a;CUDA 编程 樊哲勇 代码地址#xff1a;https://github.com/QINZHAOYU/CudaSteps
GPU 硬件
在由 CPU 和 GPU 构成的异构计算平台中#xff0c;通常将起控制作用的 CPU 称为 主机#xff08;host#xff09;#xff0c;…GPU 硬件与 CUDA 程序开发工具 参考书籍CUDA 编程 樊哲勇 代码地址https://github.com/QINZHAOYU/CudaSteps
GPU 硬件
在由 CPU 和 GPU 构成的异构计算平台中通常将起控制作用的 CPU 称为 主机host 将起加速作用的 GPU 称为 设备device。
主机和设备都有自己的 DRAM之间一般由 PCIe 总线连接。 RAM随机存取内存主要分为两种类型 SRAM静态随机存取内存DRAM动态随机存取内存。 GPU 计算能力不等价于计算性能
表征计算性能的一个重要参数是 浮点数运算峰值FLOPS。 浮点数运算峰值有单精度和双精度之分。
对于 Tesla 系列的 GPU双精度下 FLOPS 一般是单精度下的 1/2;对于 GeForce 系列的 GPU双精度下 FLOPS 一般是单精度下的 1/32。
影响计算性能的另一个参数是 GPU 内存带宽显存。 CUDA 程序开发工具
CUDAOpenCL更为通用的各种异构平台编写并行程序的框架AMD 的 GPU 程序开发工具OpenACC由多公司共同开发的异构并行编程标准。
CUDA 提供两层 API即 CUDA 驱动API 和 CUDA 运行时API。 CUDA 开发环境中程序应用程序是以主机CPU为出发点的应用程序可以调用 CUDA 运行时 API、 CUDA 驱动 API 和一些已有的 CUDA 库。 CUDA 开发环境搭建
linux 操作系统linux下cuda环境搭建
windows10 操作系统windows10下cuda环境搭建 nvidia-smi 检查与设置设备 nvidia-smi
Sun Apr 7 17:42:26 2024
-----------------------------------------------------------------------------
| NVIDIA-SMI 440.33.01 Driver Version: 440.33.01 CUDA Version: 10.2 |
|---------------------------------------------------------------------------
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
||
| 0 GeForce RTX 2060 Off | 00000000:01:00.0 On | N/A |
| 34% 37C P8 19W / 170W | 2127MiB / 5912MiB | 2% Default |
--------------------------------------------------------------------------------------------------------------------------------------------------------
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
||
| 0 1595 G /usr/lib/xorg/Xorg 645MiB |
| 0 5462 G /usr/bin/gnome-shell 372MiB |
| 0 6451 G ...AAAAAAAAAAAACAAAAAAAAAA --shared-files 599MiB |
| 0 11002 G python 504MiB |
-----------------------------------------------------------------------------CUDA Version 10.2GPU NameGeForce RTX 2060设备号为 0如果系统中有多个 GPU 且只要使用其中某个特定的 GPU 可以通过设置环境变量 CUDA_VISIBLE_DEVICES 的值从而可以在运行 CUDA 程序前选定 GPU;TCC/WDDMWDDMwindows display driver model其它包括 TCCTesla compute cluster 可以通过命令行 nvidia-smi -g GPU_ID -dm 0设置为 WDDM 模式1 为 TCC 模式Compute mode, Default此时同一个 GPU 中允许存在多个进程其他模式包括 E.Process 指的是独占进程模式但不适用 WDDM 模式下的 GPU 可以通过命令行 nvidia-smi -i GPU_ID -c 0设置为 Default 模式1 为 E.Process 模式;Perfp8GPU 性能状态最大p0~最小p12
更多关于 nvidia-smi 的资料nvidia-smi