阿里云异构计算平台全新升级,为人工智能提供全球加速能力
| 2017-09-13 08:00 评论: 1 分享: 1
计算正推动着人工智能产业更大规模的爆发。9 月 12 日,阿里云宣布推出全新一代异构加速平台,为人工智能产业提供多场景化的全球加速能力。这是阿里云异构计算家族首次亮相,涵盖 GPU、FPGA 在内等 6 款异构实例,可满足从图形渲染到高性能计算及人工智能等复杂应用的计算需求。特别是在人工智能领域,可将深度学习成本缩减一半,大幅降低人工智能计算门槛;而基于阿里云异构平台的全新高性能计算实例 E-HPC,可一键部署获得媲美大型超算集群环境的“云上超算中心”。
这是继企业级 ECS 家族全线升级后,阿里云再次在企业级市场推出专业服务,将异构计算的使能领域从人工智能扩大到更广的计算需求领域。新品具备更强的并行能力和多场景支持,不仅全力支撑人工智能计算力升级需求,也为图形计算、生命科学、材料力学、分子动力学等科研计算领域提供普惠计算能力。
“人工智能浪潮催生的计算迭代需求远超摩尔定律,阿里云希望为人工智能产业提供最强的计算能力,我们开放了视频识别、语音识别、图像识别等人工智能服务及 ET 工业大脑、医疗大脑场景解决方案,今天我们推出的异构计算加速平台,将进一步完善人工智能产业生态,满足更多客户的核心业务需求。”阿里云异构计算负责人张献涛表示。
为深度学习而生,GPU 实例 GN5i 降低人工智能成本 50%
阿里云此次推出适用于深度学习在线推理的 GPU 实例 GN5i,采用了英伟达 Pascal 架构 P4 图形处理器,提供最大 45 Tops INT8 整型计算能力和 11 TFlops FP32 单精度浮点计算能力。可根据深度学习计算力的要求,进行 GPU 实例的 “Scale-out” 水平扩容或 “Scale-up” 垂直变配,分钟级即可完成实例的创建。
阿里云还将推出搭载英伟达 V100 的高性能 GPU 实例,大幅提升深度学习的处理效率。
据阿里云高级技术专家龙欣介绍,在面向 AI 深度学习在线推理场景时,GN5i 实例依托专有推理型 GPU 和阿里云高性能 SSD 云存储和 OSS 存储服务,在满足数据处理 IO 的基础上,时延最低可达微秒级;另外,GN5i 可一键部署 TensorFlow、Caffe 等主流深度学习框架,提供智能调度、自动运维、实时扩容等服务,有效降低人工智能在线服务成本 50% 以上。
全新 FPGA 实例 F2,加快人工智能产业落地
作为异构计算近些年来的新宠,功耗低、实时性强的 FPGA 普遍被业界看好,提供云上基于 FPGA 的高效灵活场景化并行计算能力,已成为公共云的基础服务。阿里云 2017 年初推出了基于英特尔 Arria 10 芯片的 FPGA 计算实例,已帮助大量用户通过自定义加速算法,实现云上 FPGA 加速业务的一键部署、快速研发和弹性伸缩,有效提升了人工智能及深度学习的效率,为企业节省成本。
此次发布的 F2 实例基于赛灵思 Xilinx KU115 器件,提供 145 万逻辑门电路,单实例的单精度浮点计算性能可达 1.5 TFlops。随着集成英特尔(F1)和赛灵思(F2)芯片的 FPGA 计算实例相继面世,阿里云率先完成对主流 FPGA 方案的全覆盖,成为全球 FPGA 领域产品线最全、场景最多的公共云服务商。再加上阿里云业已推出的 FPGA 镜像市场,可帮助用户完成更多定制化 FPGA 加速方案,提高特定业务和算法的效率。
相比 GPU 和 CPU,FPGA 更适合非标数据位宽的人工智能、金融分析、基因匹配、物联网数据库等领域。龙欣介绍,阿里云针对非标准位宽场景做了大幅优化,以物联网时序数据库为例,F2 的处理效率可比 CPU 高 30 倍,为用户大幅降低硬件加速时间和成本。“阿里云希望提供一个弹性、完善的 FPGA 开发环境,帮助用户缩短开发周期,并以最低的成本、最大的灵活度在云端快速搭建完整的硬件加速服务。“龙欣表示。
国内首家公共云 HPCaaS 产品 E-HPC,超算界的“青藏高原”
针对对高性能计算有强烈需求的高校科研机构和企业用户,阿里云异构计算家族则推出了弹性高性能计算产品 E-HPC,这也是中国首个公共云上的 HPC as a Service 产品。E-HPC 基于阿里云异构计算平台在高性能虚拟化、并行计算、低延迟网络和HPC软件栈等方面的特性,帮助生命科学,气象预报,石油勘探,工业设计和航空航天等领域的客户,快速获得高性能计算集群计算能力、调度能力和软件能力,按需组建自己的“云上超算中心”,并可实现一键部署和弹性伸缩。
“如果把传统超算中心比作‘珠穆朗玛峰’,那么阿里云的 E-HPC 则是将高性能计算做更普惠的覆盖,成为高性能计算的‘青藏高原’。” 阿里云资深专家何万青表示。
阿里巴巴集团内部很多业务通过异构计算取得非常好的计算加速效果,比如拍立淘、以图搜图、商品分类等,这些解决方案正通过阿里云对外输出;再加上阿里云基础设施在 25G 网络、第三代分布式存储、遍布全球的 13 个区域的数据中心及高可用骨干网等方面的不断创新,可为人工智能提供高性能、弹性伸缩和业务永续的加速引擎。
除了产品层面,阿里云还提供了全方位的人工智能产业服务,包括智能语音交互、图像/视频识别、交通预测、情感分析等技术服务,这些技术正通过阿里云 ET 为客户服务。过去一年,阿里云推出 ET 城市大脑、ET 工业大脑、ET 医疗大脑等行业垂直的人工智能系统,将人工智能技术落地到产业中去。
在 10 月 11 日举行的 2017 杭州云栖大会上,阿里云还将推出更多个性化的人工智能产品及服务,期间将有 20 余场人工智能相关的峰会和分论坛,涉及基础设施、AI 基础技术、AI 产品以及 AI 行业解决方案等领域。阿里巴巴及合作伙伴将分享 AI 在数据中心、电子商务、工业制造、城市管理、艺术设计等行业的前沿经验,并展示最新技术。