您的位置  > 互联网

曙光副总裁任京旸:对服务专业化的探索与具体实践

高性能计算在这个节点上也面临着新的发展和突破。 一方面是算力的优化升级,另一方面会更加注重与应用的融合。

作为一家以高性能计算起家的公司,中科曙光始终将探索先进计算技术作为公司的重要组成部分。 近日,“第十三届全国高性能计算学术年会”在安徽召开。 会议期间,中科曙光与中国科学技术大学举行了“高性能计算在线服务平台(安徽分公司)”授牌仪式。

曙光公司副总裁任景阳表示,“随着先进计算时代的到来,这是服务专业化的一次探索和具体实践。” 高性能在线服务平台是互联网+与现代科技服务业有机融合的创新型新服务。 模型。

如何帮助企业解决疑难问题?

目前HPC发展的集群规模和计算类型越来越丰富,交互方式也发生了变化。 专业的超级计算中心逐渐兴起,提供大规模集群共享服务的运维和维护。 为此,曙光自2015年以来就已经做出了一些尝试,从硬件、软件和服务入手,为终端用户提供便捷的服务。

据产品总监兼首席运维架构师安雷介绍,中科曙光于2014年加入中科院先进计算创新与产业联盟,作为理事长单位,中科曙光近水楼台先得月,会利用过去的经验、应用甚至管理方法来取得长期效果。 结合起来,我们可以完善先进的计算服务,为用户提供面向应用的计算框架设计。

2016年,中科曙光开始与科大网络中心合作,为科大各科院科研组提供运维服务。 目的是解决用户的日常管理问题和使用问题,更好地利用闲置资源。 同时针对不同应用的不同特点进行深度优化。

在大数据领域,曙光为专业用户提供生产数据相关服务。 例如,一些生物基因的测序数据量很大,测试时间很长。 因此,有必要考虑将其变成一种通用的共享服务,将数据回收或者提供给有需要的人。

最重要的方面是,经批准的运维平台与科大网络中心建立了联合运维的初步实验场。 曙光建设了专门用于HPC安全分析的云数据中心。 通过其分析,为用户提供硬件系统运维、超算系统巡检、应用软件调优、作业报告分析四大功能。 ,以达到“线上线下同时开发、远程与本地并存”的多维度运维服务标准。

自2015年11月初次试运行以来,已经历了22个月的开发周期,为超过80个用户提供高性能计算运维解决方案,监管超过10000个节点,监控所有连接到集群的每个节点涵盖180多项监测指标。 为约750万个岗位提供支撑服务,其中超过40%提供针对应用特性的优化,涉及CAD、气象、海洋、物理、生物、高分子、深度学习等领域。

在整合和连接这些应用上下游的过程中,中科曙光实现了应用+数据的整体优化和评估,并对整个计算模型进行了深入的优化和评估。 此外,曙光还根据用户行为提供更高级别的维护和优化解决方案。 因人而异,根据用户的使用习惯,提供一套适合用户体验的灵活运维方案。

中国科学技术大学计算机科学与技术学院教授李静表示,中国科学技术大学也做出了相应的努力。 一方面是虚拟化,将云计算与高性能计算融合在一起。 另一方面,科大讯飞也在尝试利用用户作业数据以及平台运行和生产数据来优化用户应用、预测作业执行时间、优化调度算法、提高资源利用率。 然后通过综合监测和数据收集对它们进行分析。

科大与曙光的合作,解决了科大人力和经验不足的问题,减轻了运维压力,提高了运维水平; 利用监测和收集产生的数据提高了效率,这也意味着成本的降低; 科大讯飞也可以帮助更好地选择相应的架构。 对于安徽省来说,将促进产学研一体化快速有效轮动发展,进一步提升中部地区科技服务水平。

曙光如何提高HPC利用率和可用性?

重点是系统交付给用户后,在使用阶段如何保证系统的高效率。 那么,中科曙光是如何提高高性能计算机的效率的呢? 中科曙光HPC产品事业部总经理李斌认为,整个系统的利用率和可用性应该贯穿高性能计算机的整个生命周期。 分为几个阶段:

首先,在规划阶段,应根据用户的应用特点制定合理的方案。 当然,还需要考虑数据安全和冗余配置。

其次,高性能计算机出厂前必须进行质量控制,以避免一些潜在的问题。 整个系统必须进行压力测试和稳定性测试,以便系统能够以简化的状态交付给用户。

三是对系统进行深度优化,然后进行试运行,优化调度策略,保证系统的良好状态。

第四,平台能够非常及时地解决用户在使用过程中出现的各种问题,定期对用户系统进行健康检查,分析平台积累的数据,为系统提供一定的优化指导。

曙光在先进计算领域的战略规划是什么?

在HPC CHINA 2017大会上,曙光不仅介绍了在全产业链等先进计算领域的一些拓展,还详细阐述了一些具体的战略计划。

任景阳表示,中科曙光不仅支持单一的高性能计算,现在还支持多种计算形式。 此外,曙光不仅支持硬件,还开始支持软件和计算服务,逐步走向全产业链。

中科曙光高性能计算在线服务平台目前专注于计算服务,通过专业的运维平台、定制化的托管服务以及专家的深入支持,可以为用户提供HPC应用服务市场,最终形成交易以此为基础的生态系统。 平台。 也会从Easy的角色变成Easy的角色。 中科曙光也希望借助这个平台,更好地加速未来丰富多彩的计算服务时代的到来。

先进计算是中国变道超车的机会。 这也是中科曙光抢占先进计算、赢得计算技术战略制高点的绝佳机遇。 安徽分院的落成,不仅为安徽省打造综合性科学中心,为其优势产业和领域的全球竞争力提供支撑,而且曙光打造的先进计算“招牌”或将引领我国先进计算能力走向世界。