阿里云发布云上首个轻量级GPU实例 想解决单颗GPU计算能力问题
在2019 英伟达GTC大会上,阿里云发布首个公共云上的轻量级GPU异构计算产品——VGN5i实例。据悉,该实例打破了传统直通模式的局限,可以提供比单颗物理GPU更细粒度的服务,从而让客户以更低成本、更高弹性开展业务。
据云栖社区博客介绍,轻量级GPU云服务器是一种新的GPU云服务器规格族,是通过公共云的GPU虚拟化技术将分片虚拟化后的GPU资源以虚拟GPU的形式安装在GPU云服务器实例中。
与常规GPU云服务器的区别在于,轻量级GPU云服务器提供更细力度的GPU计算资源,比如拥有更少的CUDA计算核心,更小的显存。这样做的优势是在业务应用中,业务可以根据资源所需更加灵活的配置GPU计算资源。
目前,用户在使用常规GPU云服务器会有很多痛点,比如GPU的计算颗粒过大:单颗物理GPU的计算能力越做越强大,但是许多应用需要更小颗粒的GPU计算资源;常规GPU资源不利于业务自动伸缩和常规GPU计算实例无法在线迁移等。
据了解,该产品基于NVIDIA Tesla P4 GPU,支持多种规格,企业可以按需选择实例规格或者在云市场选择NVIDIA Quadro虚拟工作站,适用于云游戏、AR/VR以及图形处理等随需应变的GPU计算场景。
VGN5i由阿里云与NVIDIA合作研发,集成了阿里云智能资源调度技术,用户可以按需选择适量的计算资源;同时,还采用了安全隔离技术,实现不同用户之间的强隔离,有效防止信息泄漏;除此之外,QoS控制技术保障了每个用户的GPU资源不被其他租户抢占。
当然,VGN5i最大的技术亮点在于:支持用户在公共云上创建更小颗粒的虚拟GPU的云服务器实例。并且,具备可靠性、经济性和易用性的三大特点。
“随着轻量级GPU异构计算产品的推出,阿里云实现了GPU的异构计算场景全覆盖,可以为用户提供从从轻量到高性能计算的服务。” 阿里云智能异构计算产品专家张新涛表示。
此外,阿里云还将在5月发布基于NVIDIA T4的GPU异构计算产品VGN6i实例,NVIDIA T4采用最新的Turing架构,在虚拟化环境中更为灵活,可加速深度学习和推理工作流程的Tensor Core,以及可加速光线追踪和批量渲染的RT Core。
相关阅读:
2019年云计算市场趋势特点
AIOps进行时 数据中心运维也要智能化
IDC时评:边缘计算之于物联网安全意义几何?