成都哪里做网站好,手机网站建设价格,深圳高端保姆公司,求佛山公共频道电视直播网址TensorRT及CUDA自学笔记003 NVCC及其命令行参数
各位大佬#xff0c;这是我的自学笔记#xff0c;如有错误请指正#xff0c;也欢迎在评论区学习交流#xff0c;谢谢#xff01;
NVCC是一种编译器#xff0c;基于一些命令行参数可以将使用PTX或C语言编写的代码编译成可…TensorRT及CUDA自学笔记003 NVCC及其命令行参数
各位大佬这是我的自学笔记如有错误请指正也欢迎在评论区学习交流谢谢
NVCC是一种编译器基于一些命令行参数可以将使用PTX或C语言编写的代码编译成可执行文件。
NVCC工作流程 NVCC分离源文件中与GPU相关的内核代码将其编译为cubin或PTX中间文件并保存在fatbinary中。如果源文件使用C语言编写就编译为cubin如果源文件使用PTX语言编写就将其编译为PTX中间文件。NVCC分离源文件中与主机相关的代码使用当前系统中的编译器如g进行编译并将fatbinary嵌入其中。进行链接链接CUDA运行库和用户使用的库最后产生可执行文件。
NVCC输入文件解释 NVCC命令行 详见链接
常用的NVCC命令行参数
短名参数长名参数含义-i–include-path用来设置头文件路径-o–output-file指定输出文件-l–library指定库路径-g–debug指定debug模式-arch–gpu-architecture指定虚拟机架构配置PTX兼容性-ptx设置输出ptx文件路径-code–gpu-code设置二进制兼容性