在线商城网站怎么做,建筑行业大数据综合查询平台官网,贵州建设厅考试网站准考证下载,三维家装设计软件寒武纪芯片产品中心智能处理器IP智能处理器IP MLU智能芯片 软件开发环境 Cambricon-1A 高性能硬件架构及软件支持兼容Caffe、Tensorflow、MXnet等主流AI开发平台#xff0c;已多次成功流片 国际上首个成功商用的深度学习处理器IP产品#xff0c;可广泛应用于计算机视觉、… 寒武纪芯片 产品中心智能处理器IP 智能处理器IP MLU智能芯片 软件开发环境 Cambricon-1A 高性能硬件架构及软件支持兼容Caffe、Tensorflow、MXnet等主流AI开发平台已多次成功流片 国际上首个成功商用的深度学习处理器IP产品可广泛应用于计算机视觉、语音识别、自然语言处理等智能处理关键领域。 Cambricon-1H8 低功耗版面向视觉应用 针对视觉领域设计的深度学习处理器IP产品。与寒武纪1A相比在同样的处理能力下具有更低的功耗和面积可广泛应用于安防监控、智能驾驶、无人机等领域。 Cambricon-1H16 更高性能版完备的通用性 1A的升级版本能效比得到数倍提升拥有更广泛的通用性可广泛应用于计算机视觉、语音识别、自然语言处理等智能处理关键领域。 产品中心软件开发环境 智能处理器IP MLU智能芯片 软件开发环境 Cambricon NeuWare SDK ▼ CN-Lib高性能计算库 CN-Gen模型重训练和转换工具 CN-CC通用编译器 CN-Prof性能监控及调优工具 CN-GDB调试工具支持主流编程框架 ▼ TensorFlow Caffe MXNet难点 作者祖亚洲链接https://www.zhihu.com/question/41469046/answer/124179575 这个工作继续下去有潜力把一整套系统做出来 chip tape-out, compiler/language support, multi-chip interconnect, 等等但是继续下去有很多 design consideration 需要讨论: 1. Accelerator 和 CPU 的通信怎么做像 nvidia 对他的GPU有一整套通信机制只是没有开源。这些CPU和accelerator的通信模型是很烦的需要的支持团队也不小。他怎么从 CPU instruct accelerator 去load数据怎么保持数据一致性这些design很费脑子退一步说这一整套 API 的实现可不简单。 2. 这个编译器还有programming model怎么做是准备在C/C里面加特定的pragma/library还是让python自动compile某一部分代码到这个ISA然后下面的runtime自己manage CPU-accelerator 通信。 3. 现在工业界搞的NN都巨大无比你单个加速器就算是power8那么大的全是SIMD lanes也不够。这个加速器怎么支持distributed计算怎么和tensorflow/CNTK的framework融合。