(资料图片)
5月29日,以“ChatGPT下算力的机遇与挑战”为主题的2023中国算力发展研讨会在中科院计算所召开。中国科学院院士陈润生、钱德沛,中国工程院院士郑纬民、廖湘科,北京应用物理与计算数学研究所研究员袁国兴,中国信通院院长、党委副书记余晓晖,国家信息中心信息化和产业发展部主任单志广,中科院计算所研究员张云泉,清华大学教授陈文光,中科院计算机网络信息中心研究员陆忠华,国家高性能计算机工程技术研究中心副主任曹振南等专家学者参会,从技术、生态等多维度展开深度交流研讨,厘清算力产业的发展风向,并就当下人工智能基础设施及算力服务建设等课题给出应对之策。
算力基础建设的关键在于“通专”结合
今年以来,ChatGPT概念持续走红,进一步加速AI技术与千行百业的融合进程。愈发多元、复杂的应用场景涌现,对计算能力提出了前所未有的需求。与此同时,人工智能算力基础设施作为算力供给的重要引擎,也在建设布局等方面迎来“大考”。
目前,全国有超过30个城市正在建设或提出建设智算中心,基本都是采用“政府主导、企业承建、联合运营“的模式。即由地方财政统一出资,建成后为各行各业提供公共算力服务。在此模式下,智算中心定位于公共服务设施,首先要满足广泛的应用场景,具备普适性,实现通用。其次,也要能支持部分对于计算精度、效率要求高的个性化应用场景,具备高效性,实现专用。
与会专家一致认为,“通专”结合将成为人工智能算力基础设施的建设关键,并基于此给出两条核心建设路径。一是,算力的融合。人工智能算力基础设施应具备全精度算力,成为一个算力“通才”。让用户可以根据 AI for Science、AI for industries等实际应用场景调配算力资源,包括通用算力、专用算力,乃至高性能的算力,来支持自身业务的发展。二是,生态的融合。“通专”结合的人工智能算力基础设施是一套综合性方案,更考验底层架构的开放性。既需要不同技术路线的百花齐放,也需要殊途同归的适配兼容,以便形成包罗万象的整体架构。在降低应用迁移门槛的同时,也带动产业生态的发展。
算力网络不止于连接资源,更在于连接生态
此外,在ChatGPT的爆火下,行业与区域算力分布不均问题日益凸显,算力网络的发展也成为当下备受瞩目的话题。
与会专家认为,其依托计算和网络两大IT与CT基础设施,让用户便捷化地使用到算力资源。对于算力网络建设而言,将遍布全国的各类型计算中心统一管理调度,实现对算力、存储、网络以及数据等分布资源的整合,只是初级阶段。更重要的建设环节,在于整个产业生态的深层连接,即连接人、连接应用和服务。
超算互联网作为算力网络的重要形态,从实践层面诠释了算力网络的建设本质。首先是狭义的互联,即在物理层面,连接不同体系架构的算力中心,构建可以统一使用、对外服务的基础设施,实现资源的调度、共享。其次是广义的互联,即在生态层面,以互联网的思维运营超算中心,基于计算、软件、应用解决方案等资源进行深度整合,建立一个以应用服务为主导的创新型平台,并通过市场化的运营和服务体系,紧密链接上下游,使供需方快速对接,快速找到各自需要的资源。
通过物理及生态层面的双重互联,算力网络可进一步使能算力服务,合理配置、融合、释放算力,降低应用门槛。让算力资源从高不可攀的技术变成普适普惠的服务,支撑国家重大的科研项目、社会民生以及千行百业的发展。(战钊)