前不久,国务院发布《关于深入实施“人工智能+”行动的意见》(以下简称《意见》)从重点行动领域、基础要素支撑、组织实施等方面,针对实施“人工智能+”行动进行了全面部署。《意见》的出台预示着接下来AI将成为接下来各行业重点发展的数字技术之一。
从市场角度出发,截至2025年6月底,我国已发布1509个大模型,占全球已发布3755个大模型首位。但相比以大模型为代表的AI技术的繁荣,AI算力确面临诸多瓶颈,比如,高端算力供给不足、国产加速卡性能差距大、算力成本高、自主软硬件生态不成熟等严峻问题。
中小企业遇见“算力高墙”
全球科技浪潮里,AI产业正以惊人的速度裂变生长,从技术突破到广泛落地,逐渐形成了规模庞大、场景丰富的产业生态。
然而,在“百模大战”的喧嚣与科技巨头算力竞赛的阴影下,是一个被日益高耸的“算力高墙”围困的群体——AI产业中的中小企业。它们犹如产业生态中的“毛细血管”,尽管体量不大,却承载着最具活力和多样性的创新基因。
与此同时,各行业的发展除了离不开头部企业的引领之外,中小企业在行业中托起基层市场的力量不可忽视。工业和信息化部数据显示,我国中小企业贡献50%以上税收、60%以上GDP、70%以上技术创新成果。
相较于组织结构复杂、决策链较长的大型企业,中小企业机制灵活、反应迅速,能够将资源集中投入特定细分领域,实现快速技术突破与产品迭代,进而获得更强的创新能力。
而这些最具创新活力的主体,却最易受到外部环境的冲击。当前不断攀升的算力成本,成为了悬在AI中小企业头顶的“达摩克利斯之剑”。
以中小型AI企业为例,目前困扰这些企业最大的一个难题就是——硬件采购成本,2023年9月,香港科技大学(广州)公开定向采购公告显示,一套搭载H800 GPU的英伟达DGX SuperPOD配套软硬件及服务项目,中标金额为2.592亿元人民币。
退而求其次的 “租赁模式” 同样困境重重。由于无法自建算力集群,多数AI中小企业只能依赖第三方GPU租赁服务,但这不仅要承受每卡每月数万元的高昂费用,还面临资源调度不稳定、利用效率低等问题。
硬件采购之外,更严峻的是,算力竞争已演变为资本主导的 “游戏”。斯坦福大学《2024年人工智能指数报告》指出,仅GPT-4的训练成本就达到7800万美元。这意味着,即便中小企业在算法设计上具备优势,也可能因无法承担高昂的算力成本,被挡在技术竞争的起跑线之外。
曾有某中小型行业模型企业相关负责人告诉笔者,公司近60%的研发资金用于算力租赁,“每一次算法迭代都是‘烧钱试错’,一旦研发周期超出预期,资金链断裂的风险就会急剧上升。”该名负责人指出。
这种 “算力依赖型” 的生存模式,让中小企业陷入 “创新投入越高,生存压力越大” 的恶性循环。
与此同时,中科曙光高级副总裁李斌表示,当前,封闭式的模型训练和部署,都已经从原先的单芯片算力需求,转变为紧耦合的算力集群系统,且系统复杂度越来越高,“另一方面,从产业链角度出发,底层算力芯片到上层行业应用之间的链条很长,在进行跨层软硬件协同优化方面,也有着不小的挑战。”李斌指出。
无独有偶,中科曙光总裁助理、智能计算产品事业部总经理杜夏威也指出,随着大模型技术的发展,企业对于算力的需求也在发生着变化。首当其冲的就是,以MoE为代表的模型技术应用快速成熟,传统以单机、单卡的算力需求,转向了多卡协同的集群化需求。
在此基础上,软硬耦合也催生了应用层面的深度整合,“如今,奶茶视频APP再谈论大模型私有化,以及行业模型之时,不再仅限于大模型的简单应用,而是更多的开始向模型算法、算力私有化,以及数据私有化下沉,”杜夏威进一步指出,“归根结底,所有问题都表明了一个诉求——如何构建一个契合企业自身行业诉求,与行业需求深度定制的大模型,以及算力设备支撑。”
打造AI算力版“安卓”
面对如此复杂的挑战,李斌认为,“国内的智算产业,就像智能手机圈一样,不仅需要苹果这类大企业,还需要安卓式的生态创新模式。”
不过李斌表示,当前国内AI算力产业的“安卓”生态仍处于“准备阶段”,他指出,过去通算时代,整个IT产业分工明确,相对而言,技术架构演变比较慢,“那个阶段,做芯片、做系统、做中间件、做软件,都可以在自己的框架里,各自优化,最后放在一起就可以了。”李斌进一步指出,“那时候,对跨界、跨层协同需求并不强烈。”
当进入智算时代,这一切发生了改变,李斌将改变总结为三点:第一是系统复杂度提升;第二是产业链边长;第三是技术融合变多,“这种时候就需要类似安卓的模式,需要企业报团取暖,而不是各自为战。”李斌强调。
在前不久结束的2025世界智能产业博览会上,中科曙光协同AI芯片、AI整机、大模型等20多家产业链上下游企业,共同发布国内首个AI计算开放架构。谈及发布AI计算开放架构的原因之时,李斌表示,奶茶视频APP希望打造一个类似“安卓”的生态,借由此,促进跨层软硬件协同,并让产业链上下游协同更加顺滑。
据悉,该架构是面向大规模智能计算场景,以GPU为核心进行高效紧耦合系统设计的协同创新体系,旨在从“算、存、网、电、冷、管、软”单点突破走向集群创新。此外,该开放架构支持多品牌加速卡并兼容主流AI软件生态,既避免用户被单一技术AI路线绑定,也显著降低了硬件采购与AI软件开发适配成本。
基于AI计算开放架构设计,在本届智博会上中科曙光还发布了曙光AI超集群系统,对此,杜夏威介绍道,曙光AI超集群系统拥有“超高性能、超高效率、超高可靠、全面开放”四大特征,可为万亿参数大模型训练推理、行业大模型微调、高通量推理、多模态大模型开发、AI4S等场景打造更大更高效算力底座。
面相未来,只有当算力资源真正实现 “普惠化”,当产业生态形成 “开放包容、安全可信、充满活力” 的格局,中国AI产业才能突破 “算力高墙” 的禁锢,让中小企业的创新活力充分释放。这不仅是把握新一轮科技革命主动权的关键,更是为实现高水平科技自立自强、推动高质量发展注入的强劲动力。
(本文首发于钛媒体APP,作者|张申宇,编辑丨盖虹达)