当前位置：首页 > news >正文

手机网站建设西安网站代理正规备案

news 2025/12/20 10:27:19

手机网站建设西安,网站代理正规备案,房地产项目网站,物联网流量卡什么样的代码是高度优化的#xff1f; 我们先出去数据结构和算法本身的使用。C 的高效代码通常是利用了各种编译器优化和语言特性来最大程度地提高执行效率和资源利用率的代码。我们需要编写编译器友好的代码来让编译器优化或者说编写出不用编译器高度优化优化也能达到同样效果…什么样的代码是高度优化的我们先出去数据结构和算法本身的使用。C 的高效代码通常是利用了各种编译器优化和语言特性来最大程度地提高执行效率和资源利用率的代码。我们需要编写编译器友好的代码来让编译器优化或者说编写出不用编译器高度优化优化也能达到同样效果的代码。pipeline cache 是性能优化一个很重要的点我们需要编写编译器友好优化型的代码更有利于提高效率但其实使用矢量化计算的代码编写难度是很高的更像是在写汇编如果不是做hpc的我们可以尽量让编译器来优化就足够了。还有就是用CUDA这种GPU编程可以很好加速并行计算现在还没学性能优化就不得不提一下测试框架 Google benchmark gtest doctest intel的vtune Linux perf工具还有内存泄漏的工具 valgrind 当然他也有不仅限于内存泄漏检查的功能编译器一般都会进行经典的常量折叠但一般不是万能的如果你的代码过于复杂就不会优化。经典的不变量提出循环体优化xmm系列寄存器浮点数优化的矢量寄存器simd 向量优化 avx see 指令集这个得看兼容性开启O3的时候会有simd优化 memset底层就是simd可以使用 GCC -marchnative -O3 让编译器自动检测当前硬件支持的指令集在进行指针操作的时候可以显示表明两个指针不会有重合使用__restrict关键字方便编译器优化使用voilatile 可以告诉处理器取内容的时候必须是在内存里而不是在寄存器里的可以使用openmp 他会强制进行并行计算基于 fork 和join 的并行计算框架非常灵活对代码的入侵性小。没有数据依赖的一些操作可以用openmp 实现并行。编译器集成了openmp 可以使用-fopenmp只需要下载一些头文件。constexpr可以进行编译器求值但constexpr不能保证一定在编译器求值可以了解一下c20 consteval内联优化其实inline 这个关键词没什么用在内联方面而是放在在头文件里可以在两个模块里存在然后再一个地方初始化。可以理解为共具有 extern 和static的好处内联的化如果编译期找不到他的实现体编译器是做不了内联的如果想要内联就尽量放在同一个文件里可以使用无锁数据结构一般是用原子变量内存序来做的开销比使用mutex低因为mutex 底层就是cas 之类的硬件原语实现的有if分支的循环体是很难simd矢量化的如果是跳跃访问的化矢量化也是很困难的甚至无法simdif 还可能会影响分支预测从而影响pipeline的工作影响效率有 unlikely 这样的提示编译器的字节对齐更有利于优化结构体的SOA 和AOS SOA不符合面向对象编程 (OOP) 的习惯但常常有利于性能。又称之为面向数据编程 (DOP) 更容易simd矢量化浮点优化的CPU周期是很长的编译器不优化是因为可能÷0编译器很葱末但是乘法很快我们可以变成乘法计算但是可能精度损失我们可以 -ffast-math让编译器大胆优化除法。std的math是带重载的如果用c语言的可能会有意想不到的BUG。除了经典的 map reduce 可以进行并行计算分治一类的操作没有数据依赖我们也可以轻松进行并行经典的就是快速排序大数据的时候我们进行并行当数据量小的时候进行并行可能会有OS的开销我们可以串行计算想要一个很好的并行结果就必须要保证尽量不让cpu空转 cpu可以流水行cache line也可以进行预取可以更好的达到mem-bound写入内存的粒度很小可能会造成不必要的读取 intel _mm_stream_si32指令可以绕开缓存得凑够一个cache line的时候再择机写回内存这样可以充分利用硬件的特性提高写入的效率和性能。当然只适用于纯写入如果还要读的话反而还要同步等待stream执行完成。在进行IO密集型的任务时候协程才是更好的方案一维数组比二维数组更高效多线程的伪共享如果两个核心访问到了的同一缓存行cpu为了安全起见只允许一个核心写入统一地址的缓存行从而导致读写这个变量的速度受限于三级缓存的速度而不是一级缓存的速度要想消除错误共享很简单只需要把每个核心写入的地址尽可能分散开了就行了。jemalloc tcmalloc 这些对多线程内存分配优化的库因为他们都会有线程局部缓存通过Hook技术替换noexcept 会让函数不抛出异常在减少二进制的同时并且可以让编译器更可能的优化尽量避免拷贝就像Spdlog 里采用的都是视图我们只需要拿到弱引用集date () size()尽量使用移动操作 std::move() 对简单数据类型没有用注意c返回值优化不要返回std::move(tmp) 妨碍优化alloctor 这样的内存池化技术来管理内存在网上看到了循环迭代器优于指针其实开了编译优化以后大家生成的汇编代码都是一样的尽量使用位运算一般而言位运算都是高效的模板元编程可以将数据尽量放到编译期计算可以进行类型检查避免了运行时的重复计算提高了运行时效率。

查看全文

http://www.pierceye.com/news/116139/