GTC China 2018: AMAX 重磅推出“类脑智能计算一体机”联合解决方案
发布时间: 2018年11月22日  阅读次数:654

GTC CHINA 2018 于11月20日~22日在苏州举行,有破纪录的5,000多名与会者参加。AMAX 作为NVIDIA重要的合作伙伴参加了本次盛会,并在大会上正式发布“类脑智能计算一体机”整体解决方案。

NVIDIA黄仁勋发表GTC CHINA 2018主题演讲

GTC是AI和深度学习领域的科技盛会。NVIDIA创始人兼首席执行官黄仁勋发表了GTC CHINA 2018主题演讲,重点仍然集中在人工智能领域,包括:新的Turing 通过光线追踪和Al重塑图形学;新的HGX-2加速了HPC;新的T4加速了超大规模数据中心;RAPIDS加速了机器学习和数据分析;世界上第一台用于自主机器的Al计算机AGX Xavier,现已全面投入生产。其中,T4已经在30天前开始投入生产,并且已有一批包括AMAX在内的中国合作伙伴。百度、阿里巴巴、腾讯等众多中国大型企业及创新企业的开发者也在此展示了其技术成果及创新性突破,探讨具有挑战性的AI难题,了解如何驾驭AI的力量,塑造全新的AI时代。

AMAX 廖先生在介绍“类脑智能计算一体机”

AMAX在GTC大会上正式发布“类脑智能计算一体机”整体解决方案。解决方案一经亮相,便吸引了全场的注意。这款整体解决方案是AMAX联合Mellanox、中科类脑和StorSwift共同研究推出的。机柜中计算、存储、网络等多种设备经过集群管理软件统一调度,实现硬件资源池化,为多用户最大化资源利用率的同时,节省了能耗和总体使用成本。

类脑智能计算一体机,顾名思义,就是将原有机架和机器分离的架构进行融合,打包成为一个完整的可交付产品。类脑智能计算一体机”将电源、散热、交换等重要的IT模块集成在一个机柜中,形成一个整体。根据用户的特定应用需求,调整不同节点的配置,灵活满足不同的应用对硬件资源的要求。

产品具有显著的优势:

-支持多种模式:支持Spark分布式计算集群,支持TensorFlow、Caffe、MxNet、CNTK等主流深度学习框架,支持SKLearn、XGBoost等传统机器学习方法,提供统一的模型算法配置方案;

-丰富的训练模型,多领域应用:训练模型包括CNN、RNN、LSTM、DBN等,开放接口具备插件式集成算法服务能力,支持图像识别、语音识别、自然语言理解等多个领域的应用验证;

-算法评估:算法能力测试评估环境,并提供相应的性能基线,实现最合适的计算配置;

-一站式模型训练测试服务: 通过平台可视化的操作界面,可以完成模型训练任务的创建、运行、结果比对,无需关注繁琐的运行环境;

-教学培训与实验:平台提供人工智能人才学习素材和友好的调试环境,方便初学者和学生群体入门训练,可以实现课程实验和教学评估;

-数据智能处理:可提供数据采集、清洗、规范化处理和智能标注等功能。

该平台还可提供算法集自动筛选和在线教学。其中,算法集与数据集相互联动,用户可以通过运行相同的数据集,直观比较不同算法的效率。在线教学的难度提供多种选择,与学生能力相匹配,适合不同程度的学生实践。985大学的专家教师团队在线授课,提供教学课件,并提供在线答疑,提升教学质量。

类脑平台应用图

产品可广泛适用于以下场景:

-图像:医学影像、交通图像、遥感图像、人脸图像等;

-视频:安防监控、航运、陆运交通、自动驾驶等;

-语音:中文普通话、各地方言、多国语种、领域智能语音等;

-文本:社交网络、多语种、细粒度标注、领域知识库等;

-脑图谱:100+小鼠脑图谱、灵长类脑图谱;

-地质:矿产、地层、应力等;

-生物基因:2000+套生物基因组。

硬件方面,整体解决方案采用AMAX 高性能服务器、Mellanox交换机STORSWIFT分布式存储系统。

AMAX 高性能服务器采用创新工业设计,在视觉和性能上带来极致体验。大容量数据存储能力、强大计算能力和出色扩展性,可轻松运行数据密集型应用程序。

管理节点高可用性,当一台管理节点宕机时,自动切换,保证机柜整体稳定运行,高效调整系统以获取最优性能,帮助进行功能规划,预测故障,出现故障时执行根源分析。

GPU计算节点:最多支持30片Tesla V100 GPU;最高可达153,600 CUDA;最高可达19,200 Tensor核数;混合精度最高可达3.60 PFLOPS;单精度最高可达450 TFLOPS;双精度最高可达225 TFLOPS;核心频率可达4110 MHz;显存带宽可达900GB/秒。

CPU计算节点:最多支持336核心,672线程;最多支持288个DIMM4内存插槽;最高支持36 TB DDR4 ECC内存;支持高达9.6 GT/s英特尔快速通道互联。

42U“类脑智能计算一体机”示意图

为了保证存储资源的高效分配和使用,以及业务的连续性,解决方案采用Mellanox交换机作为集群的互连设备。Mellanox Infiniband具有低延时高吞吐量的强大性能,可以极大的提升数据中心效率,在应用和系统之间快速的传递速率,提升系统可用性。

STORSWIFT分布式存储系统完全满足高性能数据库的要求,不仅具有超高的IOPS,同时也具有超低延迟。简单灵活便于部署,可靠安全性能卓越。采用全对称架构,多重数据保护机制,从多个维度保障数据可靠性,在节点间/节点内,磁盘间/磁盘内提供多维度冗余保护,使数据更加可靠,并自主研发出并发文件流加速算法,极大的提升大规模数据读写性能。

软件方面,解决方案采用了AMAX自主研发的AI MAX深度学习平台和中科类脑智能开放平台。

AI MAX深度学习平台平台上,客户可以在这个平台上通过用户界面提交任务,并拥有独立的存储空间。AI MAX是一款Kubernetes+Docker+GPU架构,定位于机器学习的上层应用,帮助用户快速开始深度学习任务的深度学习管理平台。此外,AI MAX可提供多个Restful API,方便客户二次开发。

中科类脑智能开放平台依托开源分布式计算框架和深度学习框架,支持训练、推理,支持CNN、RNN等各种类型的网络模型,支持XGBoost等传统机器学习模型,同时利用容器技术对计算资源进行虚拟化。以智能调度的方式对外提供计算服务,以开源分布式计算、深度学习技术、多领域应用支持、自动调度能力,打造类脑智能计算中心,综合计算、数据、技术等面向人工智能应用的开源创新平台。提供海量标注数据+先进人工智能算法+高效智能计算系统+人工智能交流等对接服务。

“类脑智能计算一体机”具有高密度、高能效、整体化设计三大优势。同时类脑智能开放平台广泛支持以深度学习为代表的各种机器学习算法的调试、训练与业务支撑,旨在提升科研支撑力度,提高AI顶尖人才培养水平,赋能产业转型升级,降低人工智能创新门槛。AI Max不仅提供丰富的机器学习镜像,而且在设计中整合了计算、存储和网络资源,能够动态调配计算资源池,在一个界面上,用户可以实现存储的管理分配,并对CPU、内存、GPU等资源进行管理,支持灵活高效地节点拓展,增加资源来满足业务的增长。“类脑智能计算一体机”是未来中小型数据中心主流服务器形态的演变趋势,搭配可视化管理软件,可以轻松实现简易化智能管理,在数据中心服务器容量不断提升的现状下,减轻客户运维成本。

关于AMAX

AMAX 于1979 年创立于美国硅谷,是高性能计算、数据中心以及定制化服务器解决方案值得信赖的领先企业及业界标杆,于2015年完成美国、中国、欧洲的全球布局。

AMAX中国成立于 2000 年,已逐步完成以苏州为核心,辐射北上广深、覆盖二、三线城市的发展布局,并持续向内地进军。进入中国市场十多年,AMAX中国深耕教育科研行业,大力发展企业客户,形成以高性能计算为核心、企业级综合IT及服务器应用系统孵化为扩展的完整解决方案体系。

AMAX与知名软硬件提供商均建立战略合作伙伴关系,是英伟达NPN Elite精英合作伙伴,英特尔Cluster Ready项目成员和超融合产品优秀供应商,Linux操作系统巨头SUSE和Ubuntu全球战略合作伙伴。