人工智能(AI)大模型的发展日新月异。视频生成大模型Sora的热度尚未褪去,号称超越GPT-4的Claude 3系列大模型就在本周推出。这一飞速发展、竞争激烈的领域成为今年两会不少 代表委员的关注点,其中,全国政协委员、长期从事超级计算机研发与建设工作的中国科学院计算技术研究所研究员张云泉将提案聚焦在如何解决大模型算力瓶颈问题上。 张云泉在接受《环球时报》记者专访时表示,当前国内面临大模型训练用国产高端AI芯片供应不足等问题,应该由国家主导、整合优质科研和产业资源,尽快训练出我国的“主权级”大模型。
在其提交的提案中,张云泉将大模型描述为“实现新质智能生产力的重要手段”。他提到,人工智能带来的效果在现代就像是核武器一样,如果前十年的人工智能技术就像是原子弹为各 行各业赋能;大模型技术就像是氢弹,将会深刻改变世界思考问题的方式;而芯片就像是导弹,有了导弹才能让原子弹氢弹能投射,发挥实战效果。包括Meta公司、软银集团、研发GPT的 OpenAI等公司都在大模型领域持续发力,其中一些公司计划自研AI芯片。而在美国封锁之下,能够用于大模型训练的国产智能算力芯片的创新和供应显著落后,国产多模态大模型的训练 受美国制裁的影响,制约着这种“核武器”在中国的各行各业发挥作用。
自Chat-GPT掀起本轮大模型热潮以来,国内一批科技和互联网企业以及科研机构均相继推出自研大模型,一时间呈现“百模大战”的局面。但不能忽视的是,用以训练大模型的GPU等AI芯 片仍然由美国芯片制造商英伟达等国外厂商占据主导,而此类芯片已经遭到美国政府的出口限制,就像我们有核武器但没有导弹技术,发挥不了核武器的实战效果。
张云泉说,国内领先的AI芯片厂商因半导体工艺受限或进入美国实体清单的原因,难以使用最新工艺量产所设计的国产芯片,导致大模型训练用国产高端AI芯片供应不足,生态建设严重落 后,我们有算法,有数据但是没有合适的算力支撑,大模型这样的“氢弹”也不能真正发挥出作用。他还认为,当前国产AI芯片公司缺乏顶层设计,各自为战,无法形成合力,延误了能够 替代英伟达高端训练GPU的国产AI芯片的尽快推出。此外,大模型落地所需要的配套软件、服务生态及市场也缺乏投资、引导与建设。
解决上述问题的紧迫性在于,大模型已经成为各国科技竞争的新高地,是普遍认为的下一代人工智能方向。近日,当前大模型训练用GPU的主要供应商英伟达提出“主权AI”的概念,并将 其定义为“一个国家利用自己的基础设施、数据、劳动力和商业网络生产AI的能力”。英伟达官网发布的一篇文章认为,“主权 AI ”涵盖物理和数据基础设施,后者包括主权基础模型, 由当地团队开发,并在当地数据集上进行训练,以促进对特定语言、文化和习俗的包容性。就像一个国家文化的国防,用自己的数据和算法在数字化时代保卫自己的思想,习俗和文化。
受“主权AI”概念启发,张云泉提出要重视“主权级大模型”的开发。他向《环球时报》记者解释称,“主权级大模型”是一个动态概念,它应该是某一时期内最高水平的大模型。这一 大模型算力要求最高、智能水平最高,是一个国家AI水平的最高点、基础大模型的基础,也可以被形容为“根模型”。
张云泉认为,“主权级大模型”将深刻影响一个国家的科技竞争力,涉及军事、经济、政治等多方面能力。“没有‘主权级大模型’,就像是国家没有了国防重器,国家就会被打压,国家 安全也会受到威胁”,张云泉强调,因此必须尽快研制处于国际领先水平的“主权级大模型”,以维护未来的国家安全。
在国产AI芯片研发制造仍需时日的情况下,作为超算领域的“老兵”,张云泉建议利用我国在超算研发建设中的丰富积累,设立能够支持“主权级”多模态大模型训练的专用超算攻关专项, 快速缓解国产“主权基础大模型”训练的算力瓶颈,尽快让大模型这样的“氢弹”成为保卫我们的武器。
张云泉告诉《环球时报》记者,目前大模型使用的GPU最早就是来自超算界。但它在超算上的使用效率不高,却在深度学习和大模型找到了最佳应用点。此外,大模型训练用到的很多技术 ,例如大规模并行技术、高速网络技术、可靠性技术、绿色功耗技术、液冷技术等,中国超算科研人员都已有很成熟的积累,并且有较高水平。过去的15年,我国超算的研制水平已经达到 世界领先水平,形成了神威、天河和曙光三大世界级超算研制团队,夺得了11次世界冠军和两次超算应用最高奖戈登贝尔奖。我们国家支撑大模型的“导弹”技术和人才积累相当丰富。 “通过该专项计划的支持,可以充分利用超算领域多年积累的人才和技术优势,快速形成突破,尽快缩小我国在‘主权基础大模型’训练领域与美国的差距,为研制更先进适用的大模型专 用训练芯片和系统赢得时间。
在解决AI芯片“卡脖子”的基础性问题上,张云泉则建议,集中全国AI芯片研制力量,组建由业内权威专家和各主要AI芯片厂家参加的智能算力发展专项组,通过多轮竞争,确定最优的 训练芯片研发技术路线和国家标准,择优集中投入资金和优秀人才资源,整合芯片产能,尽快研制出能够满足国产主权基础大模型训练的十万卡、百万卡甚至千万卡并行算力需求的AI芯片 和系统。
“我之所以认为必须要由国家‘出手’,‘集中力量办大事’,是因为国内一些企业往往倾向于使用国外的开源大模型,还经常出现低水平的重复与‘内卷’,延误了‘主权级大模型’的 研发”,张云泉认为,无论是专用超算攻关专项还是AI芯片攻关专项,都需要国家出面协调资源,统一协调国内优质科研产业资源,以取得快速突破,如同“两弹一星”工程,在智能领域 的“核武器”时代占领先机。“留给我们的时间窗口并不长,不能错失良机。”