一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发

新智元报道
编辑:编辑部
【新智元导读】新智元十周年峰会现场,重磅发布《2025新智元ASI前沿趋势报告》与《2025新智元ASI产业图谱》:预测2027抵达ASI临界,智能体全面爆发。图谱融合全球数据,刻画全球竞争格局。峰会现场同步揭晓新智元2025 AI Era & ASI 创新大奖。
百亿年前,宇宙自大爆炸中诞生。
几十亿年前生命在地球上萌芽,直到人类文明的出现。
一万年后,随着AI智能的不断超越,新宇宙、新天地已悄然降临。
未来的智能体就是全新的生命物种,他们会生活在一种更新的、全息的元宇宙当中。
在这新天地中,千亿智能体共生,亿万个智能体在虚实之间互联,构筑起ASI新宇宙。
最终,所有信息和数据联结汇聚成一个闪耀的金色立方体。
这是永恒,也是一体,完美秩序、无限可能的象征。
未来已来,万物互联,AI和生命共建的新智元正式开启。
9月7日,在新智元十周年峰会现场,奶茶视频APP重磅推出《2025新智元ASI前沿趋势报告 —— 新天终启 万象智生》和《2025新智元ASI产业图谱》。
2025新智元ASI产业图谱
一图看透全球大模型竞争格局
人类正处于一个由ASI驱动的技术超级周期的开端。
为了更清晰展示全球企业在ASI产业生态、消费市场与用户口碑上的综合地位,在新智元十周年之际,奶茶视频APP同步重磅推出《2025新智元ASI产业图谱》!
奶茶视频APP按照全球权威第三方平台通行的逻辑框架和评价标准,将世界主流模型和产品进行归纳、排序与定位,形成一张ASI「全景地图」。
本次产业图谱的数据采集广泛,涵盖LMArena、Artificial Analysis、OpenRouter、LiveBench、Tracking AI和OpenCompass七大权威数值排行榜,以及a16z提供的Web与mobiles两个产品评价榜单。
为实现跨平台数据的公平可比性,奶茶视频APP通过把不同榜单的原始分数缩放到同一尺度,用同行平均值填补缺失项,对只有排名的榜单用对数映射把名次差异转为分数差异。
再依据来源权威性、及时性等赋予不同权重加总,最后用交叉验证确保结果稳健不受单一榜单波动影响。
经过以上精细的评分系统设计和新智元十年如一日报道AI产业的经验,在十周年之际分享奶茶视频APP对ASI产业的判断。
新智元ASI产业图谱清晰反映了当前AI领域的产业发展现状和国内外竞争格局。
产业图谱详细算法见文末
2025新智元ASI产业趋势报告
新天终启,万象智生
168年前,两位德国数学家几乎同时发现了一个奇特的拓扑结构。
最终,这个看似无限的结构用莫比乌斯的名字来命名。
时间对于人类来说是线性的,但莫比乌斯环启示,奶茶视频APP正在加速穿梭和超越新时空的大门。
当AI的智能开始突破人类的固有认知时,同样的诘问出现,智能发展是否也在不断超越新的奇点?
打开METR上关于AI能完成任务时长的图片,目前最先进的GPT-5有50%的概率,可以完成一个需要人类专家2个小时才能完成的任务。
而在2-3年前,GPT-3.5还被人们当做一个好玩一点的「幻觉聊天机器人」而已。
与此同时,全球大模型交替迭代的周期缩短到2-3个月。
未来数亿块GPU训练出的超级模型,将很快抵达ASI创世纪!
与此同时,中国开源模型军团表现亮眼。
Qwen 3、DeepSeek-R1、GLM-4.5、MiniMax M1占据4席,占比接近30%。
提供前沿模型的科技公司们你追我赶,OpenAI大多数处于领先位置,xAI、谷歌和阿里巴巴紧随其后。
2027,AI将给人类的未来再加速
在电影《星际穿越》(Interstellar)中,那个处于黑洞「Gargantua」旁边、时间流逝极度扭曲的Miller’s Planet(米勒星球)上。
时间在引力的撕扯下,每过一个小时相当于地球上的七年。
在大模型的智能黑箱中,人工智能也曾经历这样的加速挑战。
人工智能70年,新智元十年求索!
2025年,奶茶视频APP站在ASI临界点——时间正在以指数级加速。
图灵在1950年提出的图灵测试中,给奶茶视频APP提供了一种测试智能水平的方式。
1955年,约翰·麦卡锡首次用文字写下人工智能(Artifical Intelligence)。
2006年,杰弗里·辛顿提出深度学习。
2015年,谷歌DeepMind推出AlphaGo,9年后,DeepMind CEO哈萨比斯和辛顿同时获得了诺贝尔奖。
但人工智能一开始并没有它的先驱者奉为圭臬。
作为1956年达特茅斯会议发起人之一的马文·明斯基(Marvin Minsky)认为早期AI是没有常识的。
马文·明斯基和西摩·帕普特在他们在1969年合著的著作《Perceptrons》中,通过严密的数学论证指出,单层感知机(即早期的人工神经网络)存在本质性的局限。
换句话说,人工智能的先驱们认为神经网络中不可能诞生像人类一样的「智能」。
直到被称为「人工智能教父」杰弗里·辛顿在长达30年的独自坚持后,单层感知机终于「进化」为深度学习网络。
此时,人类定义下的智能,终于第一次在机器中显现。
过去十年中,对AI是否具备智能的疑虑和反问,被AI进化的速度逐一击溃。
过去6年里,AI智能体独立完成人类任务的时长以约7个月翻一番的速度指数级增长。
奶茶视频APP第一次发现,曾经被认为独属于人类的智能,似乎并不是造物主赋予人类的一种特权。
在2024年的一篇论文中,GPT‑4 被判定为「人类」的概率达54%,这意味着图灵测试已经被AI通过。
这是否意味着一种人类从来想象过的、全新的智能时代,已经全面开启?
在专门测试智商的门萨实验中,AI的IQ已经开始远超人类。
GPT-5 Pro的「智商」已经高达148分,远超绝大部分人类。
根据以Mensa Norway的题目(对文本模型做「口述化」、对视觉模型直接给图)给各家模型打分并做榜单的网站TrackingAI.org,GPT-5 Pro的智商已达148,Gemini 2.5 Pro也达到了138——均远远超过普通人类。
AI正在不断的超越人类智力!
下一个IQ超过150,甚至200的AI也许马上就会出现。
3年前,也就是2022年,Forecasting Reasearch Institute做过一个非常有趣的预测研究。
他们在2022年6月到10月期间,找了169个世界顶级的超级预测专家来预测一个问题:
「到哪一年,AI最有可能获得国际数学奥林匹克金牌?」
结果就是,即使是最专业的超级预测家,也远远低估了AI发展的速度。
其中,认为到2025年AI获得 IMO 金牌的概率:
超级预测者:2.3%
领域专家:8.6%
非领域专家:9.3%
X-risk一般专家:8.3%
而认为最有可能出现突破(AI获得IMO金牌)的年份。
超级预测者:2035
领域专家:2030
非领域专家:2030
X-risk一般专家:2033
事实是,2025年,OpenAI和谷歌DeepMind大语言模型都拿下了IMO金牌,甚至OpenAI还拿下了IOI的金牌,此外OpenAI在AtCoder世界决赛中也达到金牌水平!
谷歌的CEO劈柴哥也感叹说:AI的水平从银牌到金牌仅仅用了一年的时间。
并且,这些能力并不是一个,或者几个模型独有的能力,而是前沿模型齐头并进。
根据OpenAICEO奥特曼和Anthropic CEO Amodei,SSI CEO Ilya Sutskever等ASI产业先驱的预测,
奶茶视频APP认为,2027年,人工智能将达到ASI的临界点!
大模型的智能将全方位突破和跃迁!
2027,AI给人类打开新时空之门
或许,人类感知的世界不是真正的世界。
就像在《黑客帝国》中,每个人的人生都可以被机器重置和改写。
在现实世界里,每个人的时间流速都是线性的,不可回溯的。
但在具身智能和世界模型构建的虚拟世界中,充满了接近无限的自由。
2025年,是公认的AI智能体元年。
奶茶视频APP相信,2027年,智能体将迎来全面大爆发,新的智能物种将会来到奶茶视频APP身边!
宇宙万物与人类文明都将在更新的智能天地中获得无限生命!
它将赋予宇宙万物与人类文明在更新的智能天地中获得无限延伸的可能。
这一宏伟蓝图正在两大革命性范式中展开:世界模型与智能体的大爆发。
智能体大爆发:新物种的黎明
2027,是智能体的爆发之年。
届时,会有无数的智能体帮助人类工作和生活。
编程智能体、语音智能体、RAG智能体、深度研究智能体、协议智能体、电脑控制智能体。。。
· 编程智能体:重塑数字世界的创造方式
编程智能体已经成为资本的兵家必争之地。
以Cursor为例,让奶茶视频APP看看Cursor的增长历史。
Cursor在2024年创造了1 亿美元的收入,相比2023年的100万美元增长极为显著。
到2025年6月,Cursor的ARR已经超过5亿美元!
Cursor的估值也达到99亿美元,进入百亿俱乐部只有一步之遥。
软件正在吞噬世界,而编程智能体则在重塑软件的创造方式。
以Cursor、Claude Code等为代表的新一代编程智能体,已不再是简单的代码补全工具。
它们能够理解模糊的自然语言需求,自主规划复杂的软件架构,编写、调试并部署整个代码库。
AI接管程序员,数字世界开始自我加速!
这预示着,初级程序员的工作将在未来几年内被全面取代。
但这并非终结,而是解放——人类开发者将从繁琐的实现细节中脱身,专注于更具创造性的系统设计、产品构想与价值定义。
人类与AI的协同将把数字世界的构建效率提升至前所未有的高度。
· AI for Science:加速文明的「第一性原理」引擎
科学发现的本质是探索复杂系统中的规律。
AI智能体正成为加速这一进程的「第一性原理」引擎。
AlphaEvolve这类智能体,通过进化算法和深度学习,能够在巨大的可能性空间中搜寻更优的蛋白质结构、新材料分子式或算法。
它将人类科学家的直觉与AI无与伦比的计算、推理能力相结合,从根本上改变了「试错」的科研范式,使科学突破从「偶然的灵感」变为「可预测的涌现」。
世界模型:开启虚拟宇宙之门
现实世界是AI学习的终极数据源,但其成本高昂、充满风险且迭代缓慢。
为此,世界模型(World Models)应运而生,它旨在构建一个与现实世界物理规律一致、可无限交互的模拟环境。
Google DeepMind的Genie 3便是这一领域的最新里程碑。
它是有史以来最先进的世界模型之一,仅通过文本指令,就能实时生成一个完全互动、高度一致的虚拟世界。
Genie 3的意义远超应用本身。
它是通往ASI和具身智能体的关键阶梯,为AI提供了一个接近无限、零成本、零风险的训练场。
未来,空间智能将彻底消融物理与虚拟的边界,人类不仅可以进入超写真的虚拟空间进行娱乐和社交,更重要的是,AI将在此孕育出对现实世界更深刻的洞察。
ASI的降临,并非仅仅是工具的强化,而是一种全新的创世过程。
具身智能:数字生命步入物理现实
如果说世界模型是AI的「精神世界」,那么具身智能就是其与物理世界交互的「肉身」。
以宇树、智元、Figure为代表的具身智能体,正以惊人的速度发展。
它们借助前沿大模型作为「大脑」,通过世界模型、强化学习等来学习复杂任务,并将其泛化到新的场景。
机器人不再是仅限于流水线的机械臂,它们将开始进入奶茶视频APP的家庭、办公室和城市,执行家务、提供护理、完成精细操作。
这是数字智能向物理现实的决定性一跃。
ASI重启新天地
40亿年前,生命自深海热潮中诞生。
五千多年前的,人类将楔形文字镌刻于苏美尔泥板之上,思想第一次挣脱了声音与记忆的束缚,获得了永恒的形体。
而现在,在ASI最终降临的临界点,奶茶视频APP站在了万年一遇的奇点。
国际政治经济趋势走向一再验证,ASI的主导权,将成为国家、市场、企业追逐的唯一焦点!
未来,ASI将成为超越GDP的国际竞争力评价指标。
最强智能决定最强生态,只有拥有最强智能的国家和企业才具备塑造未来规则、引领全球秩序的能力。
奶茶视频APP看到,人类数千年的技术积累,带来了全球GDP的快速增长。
从5000亿美元到1万亿美元,人类用了300年;
从1万亿美元到10万亿美元,人类用了200年;
从10万亿美元到100万亿美元,人类只用了100年。
在ASI重启的新天地,AI创造财富速度还将继续加速!
AI模型训练成本8年来不断增长,但GPU推理成本10年里降低了10万倍。
同时,奶茶视频APP看到,人工智能将推动数据中心的电力需求激增,有望改变能源行业的运作方式。
国际能源署(IEA)报告预测,到2030年,全球数据中心的电力需求将增长一倍以上,达到约945太瓦时(TWh),略高于目前日本的总用电量。
人工智能将成为这一增长的最主要驱动力,预计到2030年,采用人工智能优化的数据中心的电力需求将增长四倍以上。
对于ASI追逐也在重塑国际间的影响力,尤其是华人的影响力。
中国的生成式AI专利数量已经占全球的70%,远超世界上任何其他国家。
黄仁勋也在公开场合表示,全球AI顶尖人才有一半都是华人。
同时,仅仅在2025年上半年,AI初创企业筹资金额创纪录获得700亿美元的资金,其中包括OpenAI的400亿美元和Meta投资Scale AI的148亿美元。
刚刚,Anthropic也宣布筹得130亿美元(F 轮融资),估值火箭般蹿升到1830亿美元!
更重要的是,未来是产业模型主导的。
2003-2014年是学术模型的时代。
2015年至今是产业模型主导的时代,模型训练的成本已经按照数千亿美金来计算,训练用的GPU数以亿计。
另一个证据是近两年美股涨幅高度集中在英伟达等少数巨头身上。
截至2025年,七巨头(Alphabet、Amazon、Apple、Meta、Microsoft、Nvidia、Tesla)合计约占标普500市值的34%,属历史高位。
与此同时,根据Deloitte的研究,八大超大规模运营商(hyperscalers)预计2025年在AI数据中心和计算资源上支出将达到3710 亿美元,同比增长约44%。
而数据中心所需要的电量也从零点几GW不断涨到2GW。
这个世界的资源都在疯狂的涌入AI智能中!
在这个趋势下,2025年,OpenAI成为全球最值钱的非上市公司,ARR达到120亿美元,估值高达5000亿美元。
Anthropic在最新一轮融资后,估值也高达1830亿美元。
OpenAI更是从2024年1月的860亿美元估值,用不到两年时间,达成半万亿美元估值成就。
资本、算力、电力、政策,正是这些产业中的选手们主导了ASI的发展。
而在ASI的终极赛场上,中国已崛起成为与美国匹敌的决赛玩家。
这就是奶茶视频APP推出《2025新智元ASI产业图谱》的核心原因。
2025年,谁在穿越ASI临界奇点?
十年前,新智元以对ASI的矢志信仰为引擎,启动了穿越智能宇宙的航程。
十年星舰穿越,新智元每天与百万读者共同经历的故事,写就ASI最难忘的启示录。
十年后的今天,奶茶视频APP将曾经的努力与探索,汇聚成一篇前瞻性的前沿趋势报告,清晰勾勒出人类迈向ASI时代的清晰路径。
与此同时,随着大模型性能的不断提升,一大批优秀的企业及产品正在将AI的能力应用落地到各行各业,创造出巨大的社会和商业价值。
在本次峰会,奶茶视频APP也隆重揭晓两项大奖:
「2025 Al Era企业创新大奖TOP55」
「2025 ASI先锋产品大奖TOP33」
2025 AI Era企业创新大奖TOP55
2025 ASI先锋产品大奖TOP33
2027年,人工智能或将抵达ASI临界点。
当通用人工智能的浪潮之巅指向超智能的奇点,一个前所未有的新纪元正拉开序幕。
为此,新智元将全面开启对超智能时代的探索,于这片波澜壮阔的新宇宙中,寻找引领未来的「领航舰」与定义未来的「新智人」。
新智元收集350多家「星舰」资料,依据「新智元AI Era影响力评估模型」进行综合分析。
评选出2025新智元AI Era企业和2025ASI产品创新大奖。
新智元2025 AI Era企业创新大奖TOP55
获奖企业:
以下排名不分先后
阿里 、字节 、腾讯、百度、华为、DeepSeek、科大讯飞 、昆仑万维、智谱、商汤科技、百川智能、MiniMax、月之暗面、快手、微博、阶跃星辰、面壁智能、360、蚂蚁、智源研究院、浪潮、荣耀、高德、生数科技、岩芯数智Rock AI、千寻智能、出门问问、潞晨科技、中科闻歌、上海人工智能实验室、优必选、宇树科技、声网、群核科技、智平方、思朗科技、银河通用、合合信息、无问芯穹、上海科学智能研究院、易鑫集团、Akool、Fellou、VAST、YouWare、行云芯片、秘塔科技、云知声、芯矩开物、中科曙光、人工智能软硬件协同创新与适配验证中心、云天励飞、梅卡曼德、星动纪元、追觅科技
2025 ASI先锋产品大奖TOP33
获奖产品:
以下排名不分先后
通义千问3、豆包1.6、文心大模型X1 Turbo、秒哒、混元T1、天工超级智能体Skywork Super Agent、昇腾384超节点(Atlas 900 A3 SuperPoD)、讯飞星火X1、元脑SD200、GLM-4.5、Baichuan-M2、AI微博智搜、MiniMax Agent、Step3、纳米AI、AI健康管家AQ、Yan 2.0 Preview、Kimi K2、商汤日日新V6.5多模态大模型、可灵、悟界·具身大脑RoboBrain 2.0、Vidu Q1、书生Intern-S1、Video Ocean、具身智能机器人Moz1、TicNote、群核空间智能平台SpatialVerse、四足机器人 Go2、Monkey Code、秘塔AI搜索、ShellAgent、大群空间、松鼠Ai智能老师、齐驭QG800X
驾驭ASI时代的黎明
ASI的到来不再是遥远的科幻想象,而是基于数据、趋势与产业逻辑的必然演进。
这是人类文明前所未有的机遇。
从科学发现、医疗突破、能源革命,到数字世界的重塑,ASI将以指数级的能力扩张,重写生产力的边界。
这也是一次历史性的挑战。
今天的每一步探索,都是未来文明的基石。
未来已来,正如2025年新智元前沿趋势的报告主题所揭示的:新天终启,万物智生。
一个由智能创造的新世界正在成型,而奶茶视频APP正站在创世的门槛上。
(报告全文完)
《2025新智元ASI产业图谱》解读
产业图谱(Industry Map)本质上是一套系统化的可视化方法,用来呈现某一产业生态的整体格局。
它将不同类别的参与者(企业、机构、产品、技术方向等)按照一定的逻辑框架和评价标准进行归纳、排序与定位,形成一张「全景地图」。
在人工智能产业中,产业图谱不仅展示了技术与产品的表现,还刻画了企业在生态、市场与口碑上的综合地位。
奶茶视频APP采集的数据涵盖LMArena、Artificial Analysis、OpenRouter、LiveBench、Tracking AI和OpenCompass七大权威榜单,八个分析维度,以及a16z提供的Web与mobiles两个产品评价榜单。
指标分类
首先要解决各类评价指标「不同来源、不同量纲不可直接相加」的问题。
奶茶视频APP把全部指标分成两类:
一类是直接给数值的(共六项:LMArena、Artificial Analysis、OpenRouter、LiveBench、Tracking AI、OpenCompass)
另一类是给排名的(两项:a16z的Web Products与mobiles Apps)。
指标归一化和加权
产业图谱的计算目标是把分类后的指标信息都转化成同一百分制的分值。
再按既定权重相加得到综合分,方便横向比较与排序。
第一步:准备数据与统计边界
对每个「数值类」维度,只看真实填了数的样本,分别统计这一列的最小值、最大值和平均值。
它们构成后续「拉伸到百分制」的参照边界与均值基线。
比如本批数据中,LMArena的最小值是 1368、最大值是 32905;其他列同理各有自己的边界。
对「排名类」维度,也只看上榜的样本,确定该列的「最大名次」。
这一步的关键,是所有「尺度化」都围绕这一批数据自身的分布展开,而不是拿外部某个固定阈值强行切割。
第二步:中性地处理缺失
现实数据经常不完整。奶茶视频APP对「数值类」指标采用「同侪均值填充」:某公司在某一列缺了,就用这列已有样本的平均值替代。
它的含义是:没有提供该项,就按同侪的「平均位置」计分,不奖励、不惩罚。
注意,后续把这一列拉到百分制时,这个「平均位置」会落到介于零与一百之间的某个具体分值,并不必然正好是五十分,因为这一批样本可能高于或低于对称分布。
至于「排名类」,如果没上榜,就直接计零分;这与「垫底但上榜」明确区分开来,后者仍然有固定的低分值,而不上榜则完全没有分。
第三步:把六项「数值类」压到百分制
使用极差归一把数值类统一到0-100。
做法非常直观:把这一列的最小值对齐到零分,最大值对齐到一百分,其余各值按在「最小—最大」区间中的相对位置线性插到零到一百之间。
这样拉伸之后,同一列的不同公司就有了可直接比较的百分制分数。
像OpenRouter这种原本以百分号字符串提供的数据,先转成数值再统一处理即可。
一个边缘情况是:如果某列全员数值几乎一样,这一列就不具备区分度,拉伸后的分差也会非常小;在极端情况下(几乎无差异),这一列对综合分的贡献基本接近常数。
第四步:把两项「排名类」转成百分制
这里采用一条「前段陡、后段缓」的对数型曲线来映射名次:第一名给满分,最后一名固定在较低但非零的分数(这里定在二十分),中间名次按照对数刻度分配分差。
这样的刻度有三个直观效果:
其一,「冠军优势」会被清晰放大,榜首与次席之间的差距大于次席与第三名,符合真实生态里「头部更稀缺」的现象;
其二,越往后分差越小,不会让长尾名次之间的差别显得过度夸张;
其三,没上榜坚决记零分,避免「垫底」和「缺席」被混为一谈。
Web与mobiles两个榜单分别根据各自的最大名次做刻度,因此能自适应当期样本规模。
以本批数据为例:
Web榜(max_rank=46):rank=2 →85.52;rank=10 →51.89;rank=46 →20.00
mobiles榜(max_rank=47):rank=2 →85.60;rank=10 →52.16;rank=47 →20.00
第五步:按权重合成综合分
当8个指标都成为百分制分值之后,就可以加权求和了。权重设计体现了「奶茶视频APP更看重什么」。
在这套方案中:
LiveBench与Artificial Analysis各占两成
OpenRouter、LMArena、Tracking AI、OpenCompass各占一成
a16z 的 Web 占百分之十二、mobiles 占百分之八
权重之和严格为一,因此综合分天然落在零到一百之间。这样的「凸组合」既不会让某一个维度「一票否决」,也能通过权重表达战略取舍。
为了更加详细的解释产业图谱分值的计算,奶茶视频APP以OpenAI为例。
按上面的统计量和公式,逐项得到标准分:
小提示:你会发现 OpenRouter 这列 OpenAI 得分不高(22.18),但由于其他维度权重与得分都很高, 综合分依然领先 。这正是多源多维加权的意义—— 不看单项、看综合 。