千亿估值扎堆，国产大模型正在备战“资本高考”

文 | 影子备忘录文 | 影子备忘录 5月7日，月之暗面完成约20亿美元融资，投后估值突破200亿美元

文 | 影子备忘录

5月7日，月之暗面完成约20亿美元融资，投后估值突破200亿美元。仅隔一天，DeepSeek被爆出正在推进首轮外部股权融资，目标规模最高达500亿元人民币，估值直指3500亿元。

与之同期发酵的，还有阶跃星辰近25亿美元的融资传闻。不到48小时，超百亿美元的资金信号密集释放，中国大模型赛道迎来了它的“资本高考”时刻。

这不是一次简单的融资竞赛。放在更长的时间坐标里观察，这场密集的资本动作背后，藏着中国大模型企业从“拼参数”到“拼估值”、从“技术理想”到“战略资产”的逻辑跃迁。

百亿美元涌入，中国大模型开启“千亿估值竞赛”

这场“高考”的规模，远比你想象的更庞大。

根据公开信息梳理，过去半年里，中国大模型创业公司的估值曲线几乎呈现“陡峭上扬”的姿态。

月之暗面2025年底完成C轮融资后估值为43亿美元，到2026年5月最新一轮融资后，估值突破200亿美元，不到半年翻了近5倍。

而其累计融资总额已突破376亿元人民币，成为国内大模型创业公司中融资最多的企业。

相比之下，MiniMax累计融资约为150亿元人民币，智谱约为130亿元人民币，Kimi一家的累计融资额已经超过了另外两家上市前后的总和。

更令人瞩目的是DeepSeek。这家长期保持“不融资、不商业化”姿态的模型公司，终于向外部资本敞开大门。

若500亿元融资计划落地，不仅将创下中国AI企业史上最大单笔融资纪录，其整体估值更有望突破3500亿元。而早在4月初，其估值仅约100亿美元，短短一个月内估值上涨5倍。

DeepSeek的这次融资传闻之所以引发震动，核心原因不仅是金额本身——潜在领投方包括国家集成电路产业投资基金（大基金），这意味着大模型可能被放到与芯片制造相近的战略位置上。

一级市场的天价估值，很快传导至二级市场。5月13日，港股大模型概念集体爆发：智谱收盘大涨36.9%，市值首次突破5000亿港元；MiniMax大涨18.46%，市值达到2566亿港元。

这两家公司今年1月才登陆港股，不到五个月，智谱股价翻了近10倍。

一个耐人寻味的对比：智谱2025年全年营收不足8亿元，而同期的行业老牌企业科大讯飞年营收达271亿元、净利润8.39亿元，当日总市值约1187亿元。

尚处于亏损阶段的智谱，市值已经是盈利稳健的科大讯飞近四倍。资本市场的定价逻辑，显然已经走出了传统企业估值的坐标系。

不过，资金的流向并不均匀。据烯牛数据统计，2025年模型层公司全年只完成了22轮融资，总金额94.16亿元。

2026年仅Kimi一家半年就揽走近400亿元。这说明行业的融资逻辑已经从“广撒网”转向了“集中下注”——头部玩家拿走了绝大部分弹药，留给后来者的窗口正在急剧收窄。

从“低成本出圈”到“多模态反超”

资本之所以敢于给“天价”，根本原因在于国产大模型在过去一年中交出了一份可圈可点的“技术成绩单”。

先看成本侧的突破。DeepSeek以“便宜得令人发指”的API定价打开了局面——V4预览版上线次日便宣布价格下调75%，V4-Flash低至0.0029美元/百万Token，标志着大模型正式迈入百万Token普惠智能时代。

据LiveCodeBench基准测评显示，DeepSeek等国产模型在编程性能上已接近GPT-5等国际顶尖模型水平，而评估成本不到国际模型的2%。

这种“极低成本、高水平性能”的组合，打破了长期以来“高端AI依赖海外技术”的固有认知，也让国产大模型在全球开发者社区中迅速打开市场。

再看模型能力天花板。月之暗面发布的万亿参数思考模型Kimi K2 Thinking，训练成本仅约460万美元——刷新了DeepSeek-V3约560万美元的训练成本纪录。

该模型在推理、编程等多个能力上超过或接近GPT-5和Claude Sonnet 4.5，在多项基准测试中达到SOTA水平，在Artificial Analysis智能指数评测中得分跃居全球第二。

这种“极低预算训出顶尖模型”的能力，本身就是一个极具传播力的技术叙事。

多模态赛道同样亮眼。智谱在5月发布的GLM-5.1在Coding Agent基准评测中拿下开源模型全球第一，代表国产大模型在实际编程场景下的SOTA级别能力。

开源证券的研报指出，全球多模态AI加速进击，国产模型在视频、音频生成领域实现局部反超，商业化进程显著提速。

从整体技术跃迁来看，行业测算显示，我国AI核心产业规模已突破1.2万亿元，多模态理解精度提升50%、推理能力效率提高3倍、AI Agent商业化落地速度超预期。

技术的“小步快跑”正在转化为估值的安全垫。当模型在编程、推理、多模态等维度上可规模化地转化为生产力，资本市场愿意给出的估值溢价也就有了底气。

两条路线，两种“活法”

当我们把目光从宏观叙事拉回微观层面，会发现这一轮融资热潮中最有意思的不是“谁拿了多少钱”，而是“资本为什么愿意给出这个价”。

DeepSeek和月之暗面在短短48小时内接连爆出的融资消息，恰恰揭示了两种截然不同的估值锚点。

月之暗面走的是典型的高融资、快速商业化、全球扩张路线。这种模式的底层逻辑很清晰：用大量资本换取市场扩张和收入增长，用收入增速反推估值。

事实上，Kimi的估值支撑的确来自可落地的收入预期——受益于模型能力迭代，月之暗面ARR在4月已超2亿美元，付费订阅与API收入加速增长。

更值得注意的是，月之暗面的海外收入在Kimi K2.5大模型上线后已全面反超国内，全球化不再是PPT上的蓝图，而是实打实的收入来源。

DeepSeek则走了一条截然不同的路。它将自己定位为大模型基础设施层：开源意味着放弃模型层面的直接变现，极致低价意味着用规模换取生态绑定。

资本市场对这种模式的定价逻辑，对标的是操作系统或云平台——开源模型免费铺开，API低价走量，最终依靠开发者的工具链依赖和企业级服务的增值空间来构建长期护城河。

但这条路并非没有代价：开源意味着技术壁垒的持续消解，竞争对手可以基于开源模型进行蒸馏、微调甚至直接商用，DeepSeek要维持生态主导地位，就必须在模型迭代速度上始终保持领先，而每一次迭代背后都是巨额算力投入。

这两条路径的博弈，本质上是估值叙事从“技术理想”向“战略资产定价”的切换。

在投资人的叙事框架里，DeepSeek被视作“自主可控的AI基础设施”，承载的是国产替代的战略价值；月之暗面被视作“全球化商业变现的尖兵”，承载的是收入和市场份额的增长预期。

两笔融资折射出的深层信号是：中国大模型的估值逻辑，已经开始分层——既有押注生态的“操作系统梦”，也有押注收入的“企业软件梦”。

资本市场愿意同时为这两种叙事买单，本身就说明这个赛道正处于“故事可讲、钱可烧、想象空间仍大”的黄金窗口期。

资本结构本身也在重塑这些公司的走向。从这一轮融资的出资方来看，三类资本交叉火力的格局已经清晰：

以国资为代表的“压舱型”资本，更侧重安全可控与长期战略定位，对短期回报容忍度高；以美团龙珠、华勤、中兴等为代表的产业资本，追求的是技术与自身业务的深度协同落地；以腾讯、阿里为代表的互联网战投，则着眼于生态补位与算力绑定。

这种多层次的资本构成，让大模型企业的“底仓”更为扎实，但也意味着不同资方对回报周期和战略方向各有诉求，如何平衡各方利益将成为创始团队的新课题。

从“烧钱换技术”到“技术换收入”的关键一跃

技术再强，估值再高，最终都要回答一个朴素的商业问题：钱从哪儿来？

从最新财报数据看，头部国产大模型已经走出了“纯烧钱”的阶段，开始交出可量化的成绩单。2025年，智谱全年实现营收7.24亿元，同比增长132%，成为国内收入规模最大的大模型公司。

更为关键的是，其MaaS API平台ARR达到17亿元，同比提升60倍，毛利率提升近5倍至18.9%。这意味着，模型即服务（MaaS）的商业模式在中国跑通了——API调用正在从“烧钱获客”变成“造血增长”的正向飞轮。

商业模式上，两条路径已经清晰浮现：一类是像智谱这样深耕国内企业服务，本地化部署和垂直行业解决方案成为营收主力；另一类是像MiniMax这样走全球化路线，凭借成本优势抢占国际市场，2025年该公司73%的收入来自海外。

MiniMax M2.5模型发布时的价格仅为Claude Opus、Gemini 3 Pro等主流模型的1/10至1/20，这种极具杀伤力的定价策略，正在帮助国产模型在全球开发者生态中快速渗透。

从更宏观的视角看，过去大模型的价值主要体现在“技术突破”上，现在已经转向“产业落地”。2025年下半年，中国企业级大模型日均调用量飙升至37万亿Token，较上半年增长263%。

当每天有数十万亿的Token在真实业务场景中流转，大模型的商业化就不再是“概念炒作”，而是实体经济的数字血脉。

不过，我们也需要保持清醒。高速增长的营收背后，亏损依然是一道绕不过去的坎。

2025年，智谱净亏损达47.18亿元，MiniMax经调整净亏损也高达17亿元。算力采购、研发投入、人才薪酬——这些硬成本短期内不可能大幅削减。

对于投资人来说，他们赌的不是当下的利润率，而是未来当规模效应真正发挥作用时，当前的“战略性亏损”能否转化为未来的“结构性盈利”。这场赌局的结果，可能还需要两到三年才能见分晓。

多模态与智能体，谁将接过叙事权杖？

如果说过去两年是“大语言模型”的主场，那么2026年的剧本正在向两个方向延伸：多模态和智能体。

先看多模态。从技术趋势来看，以Google Gemini Omni为代表的统一基座全模态模型的出现，标志着行业进入了全新的阶段。国内厂商同样在加速布局——阶跃星辰、智谱等均在多模态赛道持续发力。

东吴证券认为，多模态是端侧AI当前最重要的迭代方向之一，终端设备天然拥有摄像头、麦克风等多元输入系统入口，多模态能力能够更直接地对接真实使用场景。

更重要的是，多模态正在打开新的商业化空间。开源证券测算，仅国内视频消费场景每日所需Token即有望达到350万亿。多模态大模型可深度赋能内容生产、营销、工业制造等领域，只要AI在工作流中创造的价值高于Token成本，需求就是星辰大海。

从豆包3月实现两年千倍增长，到智谱3月ARR同比增长60倍，Token调用量的指数级增长正在印证这一判断。

再看智能体。如果将大模型比作“大脑”，那么智能体就是“手脚”。从对话到执行，是AI从“聊天机器人”到“生产力工具”的关键跨越。

无问芯穹等算力基础设施服务商正在构建企业级智能体服务平台，面向不同行业场景提供解决方案。智谱的企业级智能体业务收入同比增长248.8%，增速远超整体营收。

Kimi K2.6模型则在长程编码和Agent自主化执行能力上实现了显著增强。可以预见，2026-2027年，“能干活的大模型”将成为新的竞争焦点。

此外，随着国资和产业资本的深度介入，大模型的发展正在从单一的“烧钱游戏”转向更具产业深度的“生态系统建设”。

DeepSeek与国家集成电路产业投资基金的合作，暗示着国产算力与国产模型的协同闭环正在加速形成。当“国产芯片+国产模型”的自主路线打通，中国大模型的估值故事就又多了一个极具分量的叙事维度。

结语

2026年5月的这场融资热潮，给国产大模型赛道贴上了“千亿估值俱乐部”的标签。

但如果我们把目光放得更长远一些，这场资本盛宴的真正意义，不在于创造多少亿万富豪，而在于它标志着一个根本性转变的发生：国产大模型正在从“技术乌托邦”走向“战略资产定价”，从“实验室里的参数比拼”走向“商业世界的价值兑现”。

“高考”尚未结束——真正的考验在于：当资本的潮水退去，哪些模型能跑出可持续的商业模式？哪些公司在经历了“烧钱换规模”的阶段后能真正实现盈利？

国产大模型能否从“追赶者”变成“引领者”，在全球AI格局中站稳属于自己的位置？

这些问题没有标准答案。

但有一点可以确定：中国大模型正在用真金白银的估值，回答一个曾经被无数人质疑的问题——我们不仅能做出来，还能把它做成一个值得千亿级赌注的生意。

千亿估值扎堆，国产大模型正在备战“资本高考”

文 | 影子备忘录文 | 影子备忘录 5月7日，月之暗面完成约20亿美元融资，投后估值突破200亿美元

相关推荐

半决赛前瞻:白边VS麦基+周琦VS大王京沪比拼阵容深度

龚宇的AI梦，为何成了爱奇艺的公关噩梦？

华泰柏瑞“摇钱树”遭重砍，千亿明星基金经理柳军折戟！

市值仅剩3%，爱奇艺在悬崖边的自救！

千亿估值扎堆，国产大模型正在备战“资本高考”

文 | 影子备忘录 文 | 影子备忘录 5月7日，月之暗面完成约20亿美元融资，投后估值突破200亿美元

相关推荐

半决赛前瞻:白边VS麦基+周琦VS大王 京沪比拼阵容深度

龚宇的AI梦，为何成了爱奇艺的公关噩梦？

华泰柏瑞“摇钱树”遭重砍，千亿明星基金经理柳军折戟！

市值仅剩3%，爱奇艺在悬崖边的自救！

文 | 影子备忘录文 | 影子备忘录 5月7日，月之暗面完成约20亿美元融资，投后估值突破200亿美元

半决赛前瞻:白边VS麦基+周琦VS大王京沪比拼阵容深度