文|《中国科学报》记者 赵广立
今年4月,科技部宣布启动国家超算互联网部署工作,十余个国家超级计算中心悉数“入列”,部署在各大高校院所、城市的超算系统也参与其中。自此之后,“超算互联网”成为计算圈关注的焦点。
为什么要建设超算互联网?超算互联网要建成什么样?围绕这些问题,中国工程院院士李国杰在相关工作会上发表了一些观点与看法。
(资料图片仅供参考)
“中国超算已进入世界第一方阵,国产超级计算机多次登顶HPC TOP500排行榜,多次获得戈登·贝尔奖,超算的实际应用也取得不错的成绩。但总体来讲,我们的超算研发设计和生产组装能力较强,但应用能力偏弱。特别是在工业应用方面,与国外相比还有相当大的差距。智能超算的整体性能更差,与国外有五年以上的差距。”李国杰提出:“我们必须抓住这次机遇,尽快补齐超算应用短板。”
李国杰说,人工智能技术的突破对算力提出了迫切的需求,如何挖掘我国超算的潜力,已经成为亟待解决的问题。
他解释道,所谓智能超算,不仅需要单精度和半精度运算,机器学习的预训练也需要64位的双精度计算,因此擅长64位运算的超级计算机和擅长半精度和8位整数计算的智能加速系统应当连成一个整体,不能分别构成相互脱钩的超算互联网和智算互联网。超算应用能力不强,也无法催动人工智能算法的潜力。
目前,在科技部部署下,我国拥有天津、广州、长沙、深圳、济南、无锡、郑州、昆山、成都、西安、太原超算等十余个国家级超算中心,在深圳、北京、横琴、武汉等地已建有高算力的智算中心。那么,超算互联网要建成一个什么样的平台?
李国杰表示,虽然现在国内有一些围绕超算中心建设的联盟组织,但目前各大超算中心“基本上还是一个个的孤岛”,需要尽快连接成一个高效的超算互联网,让各地超算发挥更大作用。
不过他提醒,超算互联网平台的建设目标并不是要把全国的超级计算机聚集起来做成一个超大型的计算机——事实上,多数的应用并不需要调动各地的超算一起来做:“做这件事的重要目标,是要把中国超算的生态做好。”
“超算互联网的理想状态,是像淘宝、京东一样的平台,让各行各业的超算应用APP像雨后春笋一样冒出来,都放在超算互联网平台上,用户可以予取予求。”李国杰说:“届时,需要算力的单位或团体,特别是工业、企业单位,可以像淘宝下单购物一样十分方便、高效地使用超算平台。”
不过,他谈到,建立超算生态是一项重大挑战,需要全国有关的科研人员一起攻关。
李国杰强调,算力不仅是指硬件的计算能力,还包括存力、网络、各类应用软件等等。目前,我国许多超算应用软件还依赖进口,很容易被“卡脖子”。他建议,应该发动各个高校、研究院所成千上万的大学生、研究生以及企业的研发人员,一起研发超算应用软件,“打赢一场中国超算应用软件的人民战争”。
他也坦言,建设超算互联网,把强大的计算能力变成服务能力并非易事,需要做很多工作。
“目前来看,从一个账号连入网络端口就能共享超算,是一项十分复杂的任务。”李国杰说,首先要制定资源接入、共享的专业标准,把超算中心、云计算企业、科研机构等不同来源的算力、数据、软件,汇聚到一个统一的平台上。
“这将是一个公益性很强的平台,需要一支一心为公的团队来运营,必须得到国家有关部门的大力支持,通过平台联合全国各地的力量,真正得到同行信任。”李国杰说。
放眼全球,超算互联网平台建设都是一个新鲜事物,没有经验可供借鉴。
“中国要敢于吃第一只螃蟹。”李国杰说,做好了超算互联网平台,就能为我国算力“新基建”打下一个可持续发展的基础。超算互联网平台可以实现国家超级计算中心之间每秒千亿字节的高速网络互联互通,聚合每秒几百亿亿次的运算能力,将为实现我国的高质量发展和科技自立自强作出历史性的贡献。