四川省住房和城乡建设厅官方网站,网站建设图标图片,wordpress页面diy,建设安全带官方网站戳蓝字“CSDN云计算”关注我们哦#xff01;技术头条#xff1a;干货、简洁、多维全面。更多云计算精华知识尽在眼前#xff0c;get要点、solve难题#xff0c;统统不在话下#xff01;作者#xff1a;Pasca来源#xff1a;蛋蛋团#xff08;ID#xff1a;dandan_tuan… 戳蓝字“CSDN云计算”关注我们哦技术头条干货、简洁、多维全面。更多云计算精华知识尽在眼前get要点、solve难题统统不在话下作者Pasca来源蛋蛋团IDdandan_tuan本文旨在梳理和科普让读者了解异构计算的基本概念和其中不同异构计算方案的侧重点更多资讯请关注蛋蛋团IDdandan_tuan。大纲一、传统计算的困境二、异构计算的崛起三、”厨房论“异构计算四、总结一、传统计算的困境广为流传的摩尔定律英特尔Intel创始人之一戈登·摩尔提出表明每24个月会将芯片的性能提高一倍。后来另外一个英特尔首席执行官大卫·豪斯David House提出预计18个月会将芯片的性能提高一倍。尽管到目前为止芯片的发展经历一次次的性能提升。但随着互联网的爆炸式发展和信息化的普及。以及近几年兴起的诸如机器学习、深度学习、人工智能、工业仿真等对计算性能的需求极高的领域崛起后已经远远超过了传统CPU处理器的除计算性能瓶颈出现了诸多如并行度不高、带宽不够、时延高等限制。来源网络CPU和GPU的发展趋势对比如上图GPU的发展比CPU更为迅猛每一代制程缩减直接带来更多的核心数同时GPU 每年有大约40% 的性能提升。传统CPU芯片计算可以叫同构计算也可以叫通用计算设计之初更多的是注重控制。而GPU设计作为协处理器只为处理CPU难以负载的大量并行计算。而CPU占据70%的部分晶体管是用来构建Cache还有一部分控制单元负责逻辑算数的部分并不多。GPU整个就是一个庞大的计算阵列适合做大量密集型计算类型就好游戏爱好者如果想要体验画质更高的游戏画面就必须买更好GPU的显卡。总结一下CPU负责逻辑性强的事物处理和串行计算GPU则专注于执行高度线程化的并行处理任务大规模计算任务。来源网络CPU和GPU架构比较通俗一点CPU好比于笔你可以拿他画你任何想画的东西。而GPU好比于打印机打印肯定更快但是需要CPU的协同。二、异构计算的崛起在普通服务器领域亦如此针对机器学习、深度学习、人工智能、工业仿真等领域异构计算平台已经成为新宠而在异构计算江湖中也是群雄鼎力存在着三大不同的流派。CPUGPU流派、CPUFPGA流派以及CPUASIC流派。首先我们来讲个小故事通俗易懂的了解这些流派。三、”厨房论“异构计算上文也说了同构计算或者说通用计算性能的发展已经远远跟不上应用的需求如近几年的国内的天河2A和神威超算都属于异构超算接下来几年研发的超算也都属于异构超算可见异构超算已经成为中美两国超算领域的趋势。这里我们引用网上的一个经典“厨房论”异构计算。在饭店的厨房通常会有一个大厨CPU它会做各种菜兼容性极好但是如果做菜之前的大量重复动作洗菜、切菜导致它一天做菜的份数明显减少。并且由于最近人工智能时代到来客人点菜要求越来越高花样菜式大厨开始不堪负重。本来顾客大多要的「炒白菜」现在一个个都想吃「开水白菜」。一道是家常菜一道是国宴菜。然而后者复杂程度大量数据复杂处理远远不是前者所能比较。于是大厨想着一大菜我一个做着麻烦但是我可以请个帮手协处理器。比如在切菜方面这个帮手可以同时处理很多菜品并行计算而且很熟练速度很快低延时。于是一个负责切菜一个负责做菜分工明确。当然大厨挑选这个帮手也是精挑细选主要体现在以下方面多样的菜品处理能力如洗菜切菜一体化算法性能——协处理器需要能全面支持需要用到的场景关键算法。支持同时、快速加工(数据并行和低延时处理能力)——协处理器需要有大量并行通道且每个通道支持低延时的数据处理。便于大厨操作和菜品存取接口性能——和主处理器很方便的数据交互学习能力强新菜式也能学会配置灵活——协处理器可以针对计算需求升级迭代一天别吃太多功耗低——协处理器更低的功耗意味着更低的运行成本更小的空间占用和更简单的热处理方案。GPU手脚麻利但是比较笨的帮厨CPU和GPU都属于通用处理器但是和CPU一样都有一个很大的缺点CPU和GPU的代码都存在Memory这个“菜谱”中需要经过取指令译码然后才能执行指令。在这个流程中取指令译码会开销额外的时间降低了数据处理速度。如果说CPU大厨形容为“头脑发达控制电路多四肢简单计算电路少那么GPU帮厨正好相反。在GPU中硬件资源被大量用作逻辑运算单元ALU小部分用作控制电路。这为大规模的数据并行处理提供了基础。于是当这个帮厨GPU被使唤去切菜洗菜时手脚非常麻利完成的又快又好。但是如果你让这个帮厨GPU去做“土豆切丝洋葱切片南瓜雕花……”可能就没有那么利索了。这是因为复杂的控制流程会产生大量的分支如编程语言中的case和if else而GPU中一个控制单元要负责好几个计算单元。所以如果要最大程度地使用GPU势必要求控制分支越少越好。FPGA: 功能多变的万能料理机在厨房中有一种厨具我相信有很多人都会喜欢大厨也喜欢那就是料理机。有了料理机大厨终于有可以节省了大量的时间来包饺子了使用料理机处理肉馅即可。同时当有需要制作果汁、豆浆时也可以使用料理机作为一款多功能料理机可以满足大厨的多种需求。FPGA作为一种高性能、低功耗的可编程芯片中文名叫做”现场可编程门级列阵“。最耀眼的词语可编程。这也意味着今天可以切土豆丝明天切土豆片都行。FPGA使用预建的逻辑块和可重新编程布线资源可以让用户无需使用电路实验板或者烙铁通过特定的软件开发计算任务编译后就能自定义配置芯片硬件功能。只需要OpenCL和HLSHigh Level Synthesis技术直接把C、C代码编译成Verilog即可。在处理海量数据的时候FPGA 相比于CPU 和GPU优势在于FPGA计算效率比CGPU更高FPGA更接近IO。正因此FPGA目前已经占据在了异构计算的主流地位。ASIC最强订制料理机ASIC的中文全称是“特殊订制集成电路”。关键词特殊订制。它是订制的也意味着不需要去纠结CPU和GPU怎样分配控制资源和计算资源的问题了想怎么分配就怎么分配。编程语言越接近底层硬件运行速度越快。ASIC的设计是直接用软件思维搭建硬件电路所有的设计是直接建筑在物理硬件门电路上的。所以ASIC不需要取指令和译码每个时间单位都能专注于数据处理或者传输大大提高了效能。直接设计的硬件结构也让数据处理管线真正实现每一级的处理结果能直接用于下一级的输入无缝连接。在一定规则下比如一定芯片面积和布线规则下并行通道可以最大化叠加。在功耗方面因为硬件利用的最大化是所有协处理器里最小的。如果将协处理器按照性能排行ASIC FPAG GPU。然而由于ASIC定制化导致价格十分高昂定制的过程漫长并且功能定制化很难再去更改。就好比于大厨今天想做土豆丝明天土豆片。不好意思再去定制一台。AI算法尚处于蓬勃发展、快速迭代的今天ASIC存在开发周期较长、需要底层硬件编程、灵活性较低等劣势因此发展速度不及GPU和FPGA。四、总结以目标的发展趋势来看三者用一句话来概括如下GPU先发制人的“十项全能”选手云端终端均拔头筹。FPGA“变形金刚”算法未定型前的阶段性最佳选择。ASIC“专精职业选手”专一决定效率AI芯片未来最佳选择。七牛云、阿里云异构实例一览FPGA目前由于其优点越发得到AI厂商青睐有望在这几年承担更多的角色。在云端主要作为GPU计算性能不足的有效补充存在同时CPU会“变小”从14nm甚至是5nm但是依旧作为控制中心存在必不可少。未来芯片的发展前景取决于生态有望统一在主流的几个软件框架下形成云端CPUGPUFPGA可选的多芯片协同场景。福利扫描添加小编微信备注“姓名公司职位”加入【云计算学习交流群】和志同道合的朋友们共同打卡学习推荐阅读Elastic Jeff Yoshimura开源正在开启新一轮的创新 | 人物志深入浅出Docker 镜像 | 技术头条19岁当老板, 20岁ICO失败, 21岁将项目挂到了eBay, 为何初创公司如此艰难?码二代的出路是什么机器学习萌新必备的三种优化算法 | 选型指南小程序的侵权“生死局”996 程序员ICU 你真的去不起真香朕在看了