对话浪潮信息董事长彭震:发展AI不能仅靠芯片 系统创新更重要
“人工智能可能是我们这一辈子面临的最大的产业机遇。”浪潮信息董事长彭震在近日举办的浪潮信息生态伙伴大会上表示。
在其看来,人工智能对整个社会生产力带来了根本性改变。“人工智能改变了生产力三要素,使得劳动者不仅仅是人,而是变成了‘人+人工智能’;生产资料从传统意义上的有形要素变成无形,也就是数据;劳动工具则从过去人的肢体延伸,成为大脑的延伸,也会产生智慧。”
图片来源于网络,如有侵权,请联系删除
根据权威机构的预测,AI在2023年到2030年间累计对GDP产生的影响将是蒸汽机在1830年至1910年间对整个经济影响的4.5倍。
“今天我们感觉AI没有那么大的颠覆性,是因为人工智能还在快速向人类学习。当某一天人工智能的智慧超越了人类,我们就会发现AI将以迅雷不及掩耳之势改变世界,而且这种改变是不可逆的。”彭震表示。
谈及如何发展人工智能,彭震在接受21世纪经济报道记者采访时称,人工智能由算力、算法和数据三要素构成,是系统发展的结果。所以,人工智能的突破要从这三个方向一起来发力,而不是只揪住某一方面。
彭震。资料图
不要只盯着芯片
如今,千亿参数成为大模型智能涌现的临界点,随着参数规模越大,涌现的能力就越大。但同时,参数规模越大,也意味着计算复杂度越高,因此需要的算力规模也变得越来越大。
过去几年,整个算力市场发生了巨大的变化,尤其是以英伟达为代表的算力芯片公司,成为社会关注的焦点。
但彭震向记者表示,人工智能的算力设计起点已经到了万卡级别,这个时候单卡的性能虽然重要,但已不具有决定性,因为人工智能是一个庞大的系统。
可以佐证的数据是,如果从2017年Transformer模型诞生算起,按照摩尔定律(每18个月芯片性能翻一番)推算,芯片性能只提升了8倍,但同样的时间里,人工智能计算的性能提升了超过1000倍。
彭震以浪潮信息的源2.0大模型为例称,“我们在某个芯片上面跑得很糟糕,但在把数据并行、流水线并行等重新优化后,效率直接提升33%。而如果要把一个芯片性能提升33%,至少要制程迭代一次才行。”
这足以说明,算力的驱动不仅仅源于芯片,而是整个系统的全面提升。比如在算法层面,大模型的精度从过去的FP32开始,逐步发展到今年的FP8,未来会走向FP4,这种训练算法的创新,使算法对算力需求不断变小,进而大幅提升了算力效率。
另外在计算架构层面,从简单的CUDA核心到Transformer引擎,张量计算变成多维矩阵计算,整个计算体系针对矩阵计算进行了优化,让整体性能提升了1000倍。
彭震表示,随着模型参数量越来越大,大规模人工智能计算可能需要十几万卡,那个时候,单颗芯片的性能在其中扮演的角色越来越不重要,集群的效率则变得越来越重要。
而集群的效率,受互联、散热、整体优化效率等影响。比如传统的计算机体系限制了异构加速器的扩展性,所以需要发展基于新一代开放总线技术的融合架构体系结构;集群节点间的并行产生大量的通信需求,对网络性能要求很高,这则需要发展超级AI以太网。
以系统为核心
除了算力,数据在人工智能发展中扮演的角色也越来越重要。甚至有人发明了一个词汇,叫“数据霸权”,是指谁掌握了数据,就掌握了人工智能智慧涌现的话语权。
但是现在,人类所产生的已知数据对大模型来讲是远远不够的。对此,彭震向记者表示,未来通过AI技术合成数据会成为一个主要趋势。
“AI合成数据更多是基于现实,通过算法很严谨产生的数据。比如算法工程师把二维图片做成三维,然后从不同角度去产生新的图片,这样就生成了大量合成数据。”彭震说道。
有预测数据显示,到2030年,人工智能使用的合成数据将超过真实数据。届时,数据的使用成本也将大幅降低,比如目前,人工标注一张图片需要6美元,而使用合成数据只用6美分。
正因如此,彭震提出,要发展人工智能,应该以系统为核心,在算力、算法、数据三个方面协同发展。
他还特别提到算法的重要性,“算法是智慧涌现的关键,所以算法的领先是具有决定性的。今天大模型的Transformer架构、Diffusion架构,都是颠覆性的,所以在算法层面要不断投入,激发创新力量。”
对于目前很多人工智能生态倾向于闭源,彭震认为,这种封闭不利于产业创新,开源开放才是产业生存之道。
在互联网时代,IT技术的快速发展,开源开放起到了巨大的作用。在人工智能领域,开源也同样起到了积极促进作用,比如很多人工智能芯片都是采用OAM结构,Meta发布的LLaMA2开源平台也被众多大模型所引用。
彭震表示,开源开放使人工智能领域迸发出大量创新企业。从历史来看,很多技术、文明诞生的初期,都是百舸争流、百家争鸣,这些企业在竞争中不断完善自己,也推动整个产业进步,最终通过市场之手自然淘汰,让用户选择最后留下的技术和企业。