11月29日,在2023AI计算大会上,国际数据公司IDC与浪潮信息(000977)发布的《2023-2024年中国AI计算力发展评估报告》显示,2022年我国智能算力规模达260EFLOPS(每秒百亿亿次浮点运算次数),预计到2027年我国智能算力规模有望突破1117EFLOPS,中国智能算力规模年复合增长率将高达33.9%。
大模型是AI发展的必然趋势。作为大模型的核心“底座”,大模型的迅猛发展牵引着全球算力需求的快速上涨。从感知智能到生成式智能,人工智能越来越依赖“强算法、高算力、大数据”的支持。
ChatGPT发布以来,AI大模型竞赛如火如荼,国内外科技巨头纷纷布局。在证券交易市场,“算力”概念也成为资金热捧对象。
日前,全球知名咨询公司麦肯锡(McKinsey & Company)公开表示,相信投资行家们正准备在未来十年大举投资,推动中国企业的AI发展,每年的款项数额不仅将达到数万亿美元,还将成为中国经济稳步的增长的战略驱动力。
麦肯锡的多名高管纷纷认为,AI和数字化将是中国企业能够脱颖而出的领域,生成式人工智能每年可以在中国进一步释放价值2万亿美元的经济效益。
这份报告称,到2030年,中国一半以上的工作将实现自动化,到2050年,自动化率将升至90%。“生成式人工智能的影响力大多数表现在四个领域:研发、软件工程与信息技术、客户业务,以及营销与销售。”
而在11月29日,在2023AI计算大会(AICC)上,《北京市AI行业大模型创新应用白皮书(2023年)》(以下简称《白皮书》)正式对外发布。
《白皮书》表示,大模型的技术迅速迭代,打破了原有AI技术发展的上限,呈现出数据巨量化、模型通用化、应用模式中心化等特点。从全世界看,世界各地均在积极推动大模型研发和应用,其中美国和中国发布的通用大模型总数已占全球发布量的80%,成为大模型技术领域的引领者。
大模型和生成式人工智能的发展显著拉动智能算力市场增长,智能算力规模增速快于通用算力,预计2022年至2027年中国智能算力规模年均复合增长率达33.9%,同期通用算力规模年均复合增长率为16.6%。
浪潮信息高级副总裁、AI和HPC产品线总经理刘军表示,生成式AI和大模型将引发计算范式之变、产业动量之变、算力服务格局之变。未来几年,构建和调优生成式人工智能基础模型以满足应用需求,将为整个基础设施市场带来发展机遇。
大会现场发布的《2023-2024中国AI计算力发展评估报告》显示,中国智能算力规模增速快于同期通用算力规模增速。IDC多个方面数据显示,预计到2027年通用算力规模将达到117.3EFLOPS,智能算力规模将达到1117.4EFLOPS;2022年至2027年,预计中国智能算力规模年均复合增长率达33.9%,同期通用算力规模年均复合增长率为16.6%。
在AI大模型浪潮的带动下,人工智能芯片、服务器、数据中心市场规模将明显提升。IDC预计,2023年中国人工智能芯片出货量将达到133.5万片,同比增长22.5%。
人工智能服务器方面,IDC预计,全球AI硬件市场(服务器)规模将从2022年的195亿美元增长到2026年的347亿美元,年均复合增长率为17.3%。其中,用于运行生成式人工智能的服务器市场规模占比将从2023年的11.9%增长至2026年的31.7%。
中国AI服务器市场规模增速高于全球中等水准。IDC预计,2023年中国人工智能服务器市场规模将达到91亿美元,同比增长82.5%,2027年将达到134亿美元,年均复合增长率为21.8%。
在适度超前建设新型基础设施的政策引领下,人工智能算力基础设施投资规模加大。互联网公司、电信运营商,以及各级政府均积极投入到智算中心建设之中。据不完全统计,截至2023年8月,全国已有超过30个城市建设智算中心。
服务器作为数据处理和存储的核心部件,其性能直接决定了整个信息系统的运行效率。
随着Al大模型应用的加速落地和智算中心建设的加速,国内外厂商对算力的需求不断的提高,Al服务器的需求量也大幅增加。
根据北京研精毕智信息的最新数据,2022年全球Al服务器行业市场出货量达到了85万台。
根据TrendForce的预估,2023年全球Al服务器出货量将接近120万台;到2025年,这一数字将增长至近190万台,2022-2025年的复合年增长率(CAGR)为41.2%。
浪潮信息是国内服务器有突出贡献的公司。据Gartner、IDC数据,浪潮信息2022年人工智能服务器市占率连续3年全球第一,连续6年市占率中国第一,为全球AI服务器龙头。
在AI服务器方面,浪潮信息早有布局,目前,浪潮信息在售的AI服务器产品10余款,在研6款,分为人工智能训练服务器、人工智能推理服务器、元宇宙服务器等类型,主要使用在场景包括自然语言处理、计算机视觉、大型推荐系统等。根据IDC的报告,2021全年,浪潮信息AI服务器在中国市场的占有率已达52.4%。
2023年,浪潮信息今年发布了新新一代G7算力平台,涵盖面向人工智能等应用场景的16款产品。最新一代融合架构的AI训练服务器NF5688G7较上代平台大模型实测性能提升近7倍,同时联合英特尔发布面向生成式AI领域的新一代AI服务器NF5698G7。浪潮信息人士亦曾回应:“总体看,公司AI服务器的整体业务占比在上升。”
但在形式如下大好的情况下,浪潮信息却并未一口气乘风而上,相反,其股价在证券交易市场产生了巨动,造成这样的一种情况最主要的原因是,浪潮信息的服务器的核心元器件GPU命脉,却卡在上游提供商英伟达手中。
AI芯片作为算力系统的核心,其发展问题不容忽视。国内AI芯片行业目前在训练性能方面与英伟达仍存在差距。日前,美国商务部工业和安全局(BIS)发布了针对芯片的出口禁令新规,更加严格的限制了中国购买重要的高端芯片,引发了中国AI市场的巨震。
作为算力的硬件基石,在技术架构层面,AI芯片可大致分为 GPU(图形处理器)、FPGA(现场可编程门阵列)、ASIC(专用集成电路)和类脑芯片,同时CPU也可用以执行通用AI计算。
在应用层面,AI芯片又可以划分为云端、边缘端和终端三个类型,不同场景对芯片的算力和功耗的要求不同,单一芯片难以满足实际应用的需求。
在云端层面,由于大多数AI训练和推理工作负载都在此进行,需要运算巨量、复杂的数据信息,因此对于 AI 芯片的性能和算力要求最高;边缘端是指处理云端和终端之间的传输网络,承担着汇集、分析处理和通信传输数据的功能,某些特定的程度上分担云端的压力,减少相关成本、提升效率。
终端AI芯片由于直面下游产品,大多以实际的需求为导向,主要使用在于消费电子、智能驾驶、智能家居和智慧安防等领域,终端产品类型和出货量的增加,也相应刺激了对芯片的需求。
在AI领域,相比CPU,GPU更适合对密集数据来进行并行处理,尤其是AI训练等需要大规模并发计算场景。说到GPU,就很难绕开英伟达。虽然目前中国已拥有了一批从事GPU芯片研发和生产的企业,但距离英伟达仍有着较大差距。
北京智源AI研究院副院长、总工程师林咏华表示,当前中国AI芯片的大模型集群训练性能,只有个别接近英伟达A100/A800,大多数不到50%。此外是生态差距巨大,我国AI芯片公司有40余家,但中国AI芯片整体的市场占有率加起来不超过10%,各家AI芯片软件各异、生态十分零碎割裂。
英伟达的GPU芯片供应紧缺,在短期内对于国内如火如荼的AI发展,打击无疑的巨大的。
但长远来看,这反而刺激了国产AI芯片的加速发展。AI芯片不仅存在广泛的市场需求,也决定了中国AI产业的发展,近年来,国家层面格外的重视AI芯片产业高质量发展,自2016年以来陆续发布一系列产业支持政策,从而为AI芯片业建立了优良的政策环境,促进行业繁荣发展。在政策和需求的双重促进下,中国AI芯片厂商奋起直追。华为海思、地平线、寒武纪、海光信息、昆仑芯、比特大陆、复旦微电等厂商在多个领域取得突破进展。
目前,在AI芯片方面的国产替代正在加速,大量企业表示出议员采用国产AI芯片,共同建立国产AI芯片生态,摆脱对NVIDIA的依赖,形成中国AI芯片的生态。
国产AI芯片在压力之中力争突围,服务器厂商也在积极探索新的更全面的AI全栈能力,以树立新的产业链地位。
以服务器龙头浪潮信息为例,该公司近些年持续不断的发展以大算力和大模型为核心的智算技术体系,打造了算力、算法、数据全栈的解决方案能力。
在算力方面,公司通过场景优化设计,形成了一系列丰富的产品线,涵盖了计算型、存储型、多节点、关键应用、整机柜等各类服务器,支持全场景高效计算;算法层面,公司推出巨量模型业务,积极探索通用智能技术前沿;在数据存储领域,浪潮信息准确识别行业痛点、积极布局,经过持续攻关,在融合存储架构、系统性能设计、数据全生命周期管理算法等方面不断突破,打造出生成式AI存储解决方案。
11月27日,浪潮信息(000977)发布“源2.0”基础大模型,并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。
当前,大模型技术正在推动生成式AI产业迅猛发展,而基础大模型的关键能力则是大模型在行业和应用落地能力表现的核心支撑,但基础大模型的发展也面临着在算法、数据和算力等方面的诸多挑战。源2.0基础大模型则针对性地提出了新的改进方法并获得了能力的提升。
算法方面,源2.0提出并采用了一种新型的注意力算法结构:局部注意力过滤增强机制(LFA:Localized Filtering-based Attention)。LFA通过先学习相邻词之间的关联性,然后再计算全局关联性的方法,能够更好地学习到自然语言的局部和全局的语言特征,对于自然语言的关联语义理解更准确、更人性,提升了模型的自然语言表达能力,进而提升了模型精度。
数据方面,源2.0利用中英文书籍、百科、论文等高质量中英文资料,降低了互联网语料内容占比,结合高效的数据清洗流程,为大模型训练提供了高质量的专业数据集和逻辑推理数据集。为了获取中文数学数据,浪潮信息清洗了从2018年至今约12PB的互联网数据,但仅获取到了约10GB的数学数据,投入巨大,收益较小。为了更高效地获得相对匮乏的高质量中文数学及代码数据集,源2.0采用了基于大模型的数据生产及过滤方法,在保证数据的多样性的同时也在每一个类别上提升数据质量,获取了一批高质量的数学与代码预训练数据。
浪潮信息高级副总裁、AI和HPC产品线总经理刘军认为,在数据方面,浪潮采用的数据来源、数据增强以及合成方法数据质量方面的工作,减少了互联网的公开数据集,增加了百科、书籍、期刊等相对来说还是比较高质量的数据,同时引入了代码数据和数学数据,从而增强了模型的数理逻辑能力。
算力方面,源2.0采用了非均匀流水并行的方法,综合运用“流水线并行+优化器参数并行+数据并行”的策略,让模型在流水并行各阶段的显存占用量分布更均衡,防止显存瓶颈导致的训练效率降低的问题,该方法明显降低了大模型对芯片间P2P带宽的需求,为硬件差异较大训练环境提供了一种高性能的训练方法。
刘军认为,在生成式AI的带动下,AI计算力的技术和应用趋势发生了较大的变化。在三个方面产生了巨大的格局之变,即计算范式之变,产业动量之变以及算力服务之变。
源2.0作为千亿级基础大模型,在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试,测试结果为,源2.0在多项模型评测中,展示出了较为先进的能力表现。
除了持续强化在算力、算法、调度系统等层面的业务布局外,浪潮信息也在积极抢滩持续践行“液冷”。
液冷是在解决服务器高密度散热的背景下推出的技术,随着各地大型数据中心的建设,液冷服务器代替风冷服务器慢慢的变成了大趋势。
在液冷标准化方面,通过与液冷产业链上下游的紧密合作,浪潮信息积极牵头液冷专利与标准建设,截至目前,浪潮信息拥有300多项液冷技术领域核心专利,已参与制定与发布10余项冷板式液冷、浸没式液冷相关设计技术标准,并牵头制定《模块化数据中心通用规范》国家标准,牵头立项国内首批冷板式液冷核心部件团体标准,对液冷产业的快速发展及液冷技术的大规模普及建设具备极其重大的指导意义。
此外,由浪潮信息牵头的国内首批冷板式液冷数据中心核心部件标准已通过项目评审和论证,在开放计算标准工作委员会(OCTC)获批立项,涵盖冷板、连接系统、冷量分配单元、监控系统等部件,其中冷板部件标准已于今年正式对外发布。可以说,四个重量级冷板式液冷数据中心核心器件技术规范的立项有利于部件厂商更快的掌握液冷核心部件设计、加工与生产环节,促进良性竞争与液冷部件产业的健康发展。
为进一步推进液冷标准化、产业化,近年来,浪潮信息投资建设了天池液冷基地,通过整合研发、生产、测试、品控、交付等在内的全链条能力,年产能超10万台,一跃成为目前产能亚洲最大的液冷基地。在此基础上,依托天池液冷基地,浪潮信息在技术创新、品控管理和整体解决方案方面也取得了很多的突破,这为大规模推动液冷的“普惠”夯实了基础。
在技术创新方面,浪潮信息首创了能够彻底杜绝漏液隐患的液环式真空CDU,这是一种液冷系统二次侧均为负压的动力单元,由于管路内均为负压,因此彻底避免了漏液问题发生。同时,这项技术创新突破了液冷循环系统一定要采用高压水泵,才能实现液体循环流动的“定律”,实现了仅依靠真空泵通过不同传感器控制多腔室功能切换,就可以实现流体的循环流动,在技术极简化的同时,也实现了可靠性的大幅度的提高,将有力的推动冷板式液冷技术的普及。
在产品层面,发布全栈液冷产品,实现通用服务器、高密度服务器、整机柜服务器、AI 服务器四大系列全线产品均支持冷板式液冷,并持续进行全液冷机柜、机柜式冷量分配单元等创新,数据中心产品体系逐渐完备;在系统方案层面,提供液冷数据中心全生命周期整体解决方案,具有从室外一次侧冷源到室内二次侧CDU、液冷连接系统、液冷服务器等全线布局,为用户全方位打造绿色节能数据中心交钥匙工程。
站在数字化的经济的风口上,随着算力需求的一直增长,AI服务器市场空间仍然十分巨大。浪潮信息是全球服务器龙头厂商,同样也是 AI 服务器龙头厂商,无疑是当先受益的群体,虽然从目前来看,服务器核心元器件的供应商较为集中短期内会造成一定的影响,但随着国产AI芯片厂商的不断突围,这样的一个问题,将迎刃而解。相信,这一天并不久远。
同时,浪潮信息围绕算力、运力、存力所做的软硬件一体积极突破,公司在数据中心核心装备、整体解决方案以及 AI 计算全栈能力均处于领头羊,也有望突破服务器厂商在产业链中位置,打造新的发展局面。