英特尔发布Movidius Myriad X VPU:提出神经计算引擎
昨天,英特尔子公司 Movidius 发布了 Movidius Myriad X 视觉处理单元(VPU),它是一种低功耗片上系统(SoC),用于无人机、智能相机、VR/AR 头盔等设备的深度学习及其他人工智能视觉应用加速。这款设备是继上个月英特尔基于 Myriad 2 处理器的 Movidius Neural Compute Stick 之后发布的又一新产品。Movidius 表示,Myriad X 将会在同样功耗条件下提供 Myriad 2 十倍的深度神经网络(DNN)性能。
Myriad X 的强大之处在于 Movidius 引入了被称之为神经计算引擎(Neural Compute Engine)的新结构,这是一种片上 DNN 加速器。Movidius 称,在该组件的帮助下,Myriad X 可以在 Myriad X 理论计算能力 4+ TOPS 的基础上达到超过每秒万亿次(TOPS)的 DNN 峰值吞吐量。
此外,Myriad X 还有四个 C 编程 128 位 VLIW 向量处理器,来自 Myriad 2 的可配置 MIPI 通道,以及扩展的 2.5 MB 片上存储器,更多固定功能的图像/视觉加速器。像 Myriad 2 中的一样,Myriad X 的向量单元是针对计算机视觉工作负载优化的专门 SHAVE 处理器。Myriad X 同样也支持最新的 LPDDR4。在随附的发布视频中,Movidius 通过核心图展示了 Myriad X 功能。
Myriad X 的另一个新功能是 4K 硬件编码,支持 30 Hz (H.264/H.265) 和 60 Hz (M/JPEG) 的 4K 硬件编码。在接口方面,Myriad X 支持 USB 3.1 和 PCIe 3.0,两者对于 Myriad VPU 系列都是新功能。所有这一切都在 Myriad 2 一样的〜2W 的包络功率内完成,更准确地说是 1W。
显而易见,Myriad X 很多相同的 Myriad 2 功率的额外性能似乎来自其新的 16 FFC TSMC 进程节点。在从 28nm 平面工艺缩小到 16nm FinFET 的情况下,Movidius 能够将功率节省投入到上升时钟(upped clock)以及更多的 SHAVE 处理器、加速器、接口和内存中,所有这些都具有相似的封装尺寸。虽然英特尔确实有自己的晶圆厂,Movidius 表示在英特尔 2016 年的收购之前,Myriad X 已在良好研发之中,并且 16nm FFC 是选择的节点。16nm FFC 迭代发生于在 28nm HPM 和 HPC 成为 Myriad 2 的典型体现之后。
尽管具体细节尚未披露,但是随 Myriad X VPU 发布的 SDK 包括一个神经网络编译器和「用插件方式开发应用管道的专门化 FLIC 框架」。在任何情况下,Myriad X 和 Myriad 2 一样,可以通过 Myriad Development Kit (MDK) 进行编程,Myriad 2 不会被 Myriad X 取代。去年一月,Myriad 2 的价格已降低至不到 10 美元;但是 Myriad X 使用了更高成本的 FinFET 流程和额外的硬件特征,其性能更高,价格也很可能更高。