2026年5月,中国AI大模型赛道迎来两枚重磅炸弹。

月之暗面(Kimi)即将完成新一轮20亿美元(约合人民币140亿元)融资,投后估值突破200亿美元(约合人民币1400亿元)。本轮融资由美团龙珠领投,中国移动、CPE源峰等参投,另有多家老股东加注。至此,Kimi累计融资额已超376亿元人民币,成为中国大模型创业公司中累计融资最多的公司。

几乎同一时间,DeepSeek首轮融资也浮出水面。据报道,DeepSeek首轮融资估值已达到约450亿美元(约合人民币3000亿元),大基金正在寻求领投。此前,DeepSeek创始人梁文锋曾明确表示对商业化兴趣寥寥,婉拒过多批投资人。如今姿态转变,意味着一场更大规模的资本博弈正在拉开序幕。

这是两笔性质截然不同的融资。Kimi背后站着的是产业资本和财务投资者的联手重注,DeepSeek则开始向国家队靠拢。但它们的共同点在于:都标志着中国大模型创业公司从“技术秀肌肉”全面进入“资本拼内力”的新阶段。


千问生成图片

两款模型的隔空内力大比拼

全球AI底层技术的话语权开始转移

更值得玩味的是,就在融资消息传出前,两家公司在技术战场上刚刚完成了一次“默契”的隔空交锋。

4月20日深夜,月之暗面发布并开源了Kimi K2.6模型——1T参数MoE架构,32B激活,可连续编码13小时,Agent可持续自主运行5天。在多项全球权威基准测试中,其表现持平甚至优于GPT-5.4、Claude Opus 4.6等顶尖闭源模型,一举夺回开源模型全球第一宝座。

四天后,DeepSeek V4接踵而至。两款模型前后相隔不到四天发布,包揽全球权威开源模型榜单前两名。有人把这比作中国AI界的iPhone时刻:从DeepSeek到Kimi,中国AI公司正从追赶者成为规则重构者。

在Artificial Analysis智能指数开源模型榜单上,全球前五名开源模型全部为中国模型。据OpenRouter统计,今年一季度全球API调用量中,中国开源大模型的周Token调用量占比已超过60%,Kimi与DeepSeek稳居前列。

悄然间,全球AI底层技术的话语权开始转移。

DeepSeek悄然转身

当技术理想主义遇上资本和人才现实

DeepSeek首轮融资的浮出水面,是一个意味深长的信号。

一年前,梁文锋还是那个对商业化说“不”的技术理想主义者。当一批批投资人登门拜访,他给出的回答几乎相同:不感兴趣。彼时,DeepSeek刚刚凭借R1模型引爆全球AI江湖,以开源加低价的组合拳成为现象级的国民AI应用。

但形势比人强。

据最新报道,DeepSeek首轮融资估值已达约450亿美元。这个数字意味着什么?横向对比,在港股上市的AI双雄,MINIMAX市值约2495亿港元,合2192亿元人民币,智谱市值4260亿港元,约3744亿元人民币。DeepSeek作为一个从未融资、完全靠创始人自有资金和量化交易收入支撑的公司,首轮融资就站上450亿美元,在全球AI创业史上几乎是前无古人的案例。

这意味着,全球资本正在给中国AI公司重新定价。而这种重估并非空穴来风——英伟达CEO黄仁勋在今年CES上展示下一代GPU性能时,使用的基准模型正是DeepSeek和Kimi K2-Thinking,这是历史上第一次。

估值骤起,但挑战也如影随形。据媒体报道,DeepSeek正面临“留人难”的困境,核心研究员被字节、小米等大厂以数倍薪资挖角。在缺乏股权激励的情况下,纯粹的技术理想很难长期留住顶级人才。首轮融资的启动,或许正是为了解决这一结构性问题。

同时,DeepSeek也在加速构筑自己的生态壁垒。V4模型深度适配华为昇腾芯片,发布会上更明确将降价节奏与昇腾950超节点批量上市挂钩。这种“模型+芯片”的协同战略,在全球AI竞争中是独特的存在——用中国的芯片,跑中国的模型,对全世界开源。

DeepSeek的融资转身,标志着大模型创业的底层逻辑正在发生深刻变化:当技术领先的红利窗口逐渐收窄,资本的厚度、生态的广度、商业化的速度,正在成为决定终局的更关键变量。

大模型群雄逐鹿

“六小虎”的洗牌与突围

Kimi和DeepSeek的军备竞赛,只是中国AI大模型赛道巨变的冰山一角。

2026年,全球AI产业正经历从“技术奇观”到“商业验证”的关键转折。截至2026年初,全球AI独角兽已达约370家;今年第一季度,生成式AI领域融资额达1635亿美元,较去年同期增长599%。然而,繁荣表面之下,一场无声的分化与淘汰正在加速。


AI大模型也面临洗牌(千问AI生成图片)

曾经被资本与媒体冠以“AI六小虎”之名的六家明星公司——智谱AI、MiniMax、月之暗面、阶跃星辰、百川智能、零一万物——其发展轨迹已无法再用同一标签概括。短短两年间,它们从集体讲述AGI故事,到路径急剧分化,走出了一个行业从野蛮生长到理性分层的完整周期。

2026年开年,智谱AI与MINIMAX相继登陆港交所,分别成为“全球大模型第一股”和“全球化AGI第一股”,标志着大模型创业进入资本化新阶段,也划定了行业分化的分水岭。

智谱AI代表的是典型的B端深耕策略。聚焦政企市场,以API+私有化部署双轮驱动,2025年营收7.24亿元,MaaS平台ARR达17亿元。更具标志性的是,智谱敢于逆势涨价83%后调用量不降反升,展现出罕见的定价权与客户粘性。但硬币的另一面是,亏损接近50亿,收入连研发投入的四分之一都不到——B端定制化项目如何实现规模化盈利,仍是悬在头顶的达摩克利斯之剑。

MINIMAX则走了一条截然不同的C端全球化道路。旗下社交应用Talkie等C端产品占公司收入超七成,AI原生产品收入占比达71.4%,在海外市场建立了可观的用户基础。上市后,MiniMax开始发力企业级市场,C端与B端双线并进。但C端用户增长已现见顶迹象,高昂算力成本持续吞噬营收,盈利仍面临巨大压力。

Kimi与DeepSeek,是“六小虎”中走出独特道路的两个异类。它们都没有走传统B端定制或C端应用的路线,而是以“技术驱动+API变现”的模式,在全球开源生态中杀出一条血路。

Kimi的ARR收入从3月初突破1亿美元,到4月超过2亿美元,付费用户订阅和API调用成为主要推动力。DeepSeek则以极致性价比为武器,V4模型API价格仅为竞品的1/20。两者的路径共同验证了一个核心命题:在AI基础设施层,技术领先可以直接转化为商业回报。

而它们之间,更生长出一种超越竞争的惺惺相惜。Kimi的MLA注意力机制中,流淌着DeepSeek早期公开探索的脉络;DeepSeek V4中关键的Muon优化器,其有效性由Kimi团队率先验证,DeepSeek还在技术报告中公开致谢。这种技术联动,在竞争白热化的大模型江湖实属罕见。

并非所有人都能留在通用大模型的牌桌上。百川智能和零一万物,选择了“断臂求生”。

百川智能放弃了通用大模型赛道,裁撤金融、教育等B端团队,全力押注AI医疗。其医疗大模型Baichuan-M3在权威评测中以65.1分位列全球第一,首次实现对GPT-5.2的超越。但代价是退出一线竞争,市场规模和想象力空间也相应收窄。零一万物则直接收缩业务,转向轻量化行业定制模型。

这条路的残酷之处在于:垂直领域的先发优势和时间窗口有限,一旦大厂的通用模型能力溢出,随时可能遭遇“降维打击”。深耕者必须在数据壁垒、行业know-how和客户关系上加速构筑护城河,窗口期可能只有一到两年。

垂类赛道的新秀崛起,边界外的“闯入者”

当“六小虎”在通用大模型赛道鏖战时,一批在特定赛道快速崛起的AI新秀正在改写竞争版图。

视频生成赛道已形成三足鼎立格局。生数科技(U-ViT路线)完成近20亿元B轮融资,估值超20亿美元,计划最快2026年上半年启动港股IPO,其To C产品近期突破3000万用户。爱诗科技(DiT路线)完成约20亿元C轮融资。Sand.ai选择自回归架构的激进路线,近期完成约5000万美元融资,年度经常性收入已超千万美元。

具身智能成为2025年以来的最大热点。2025年中国新晋的8家AI独角兽中,有7家聚焦于机器人或具身智能领域。与美国重金押注基础大模型不同,中国将优势集中于“技术+产业场景”的结合,推动人形机器人和工业自动化在制造、仓储等场景的大规模商用。

AI Agent更是2026年最明确的产业爆发点。OpenClaw在全球开发者社区爆火,GitHub星标接近25万,超越所有开源软件项目。这款AI Agent产品形成了一个巨大的Token消耗引擎,2026年2月最后一周,OpenRouter平台前十位模型的总Token消耗约8.7万亿,中国模型独占5.3万亿,占比61%。MiniMax、Kimi、智谱三家凭借与OpenClaw生态的深度绑定,完成了从技术厂商到AI基础设施的跃迁。

大模型之战的终局推演

独立上市还是并入大厂生态

当资本、技术、生态三重变量交织,中国AI新秀赛道的终局可能呈现三种格局。

目前的AI大模型最顶端的是字节系(豆包)与阿里系(千问),它们凭借流量与云生态占据通用AI入口,少数独立模型公司(DeepSeek、Kimi等)作为技术基础设施供应商存活,其余参与者转向垂直应用层。2026年第一季度,中国大模型全球周调用量已达12.96万亿Token,为美国的4.3倍,国产大模型已从“跟跑”迈入“领跑”,这一实力基础支撑了独立发展的可能性。

随着头部大厂资本开支持续攀升——阿里巴巴未来三年投入超3800亿元,字节跳动2026年资本支出预计高达1600亿元——独立AI公司的生存空间将不断被挤压,并购整合成为大概率事件。

在未来的全球化分工中,中国AI企业凭借性价比优势和Agent生态适配能力,在全球AI产业分工中占据独特位置。正如OpenClaw效应所展示的,中国模型正在成为全球Agent部署的基础设施。

而对于身处浪潮中的每一家公司而言,一个共识正在浮现:大模型创业从来不是人人都能分一杯羹的机会,而是强者生存、弱者淘汰的战场。竞争的焦点已从“谁更聪明”转向“谁更有用”——即谁能将AI能力更高效、更深度地融入产业,创造出真正的商业价值。

在中国AI大模型这场千亿级别的军备竞赛中,资金储备决定了下牌桌的底线,但技术创新与商业落地的双轮驱动,才是走得更远的真正内力。而这场群雄逐鹿的大戏,才刚刚进入最精彩的章节。

原标题:《月之暗面刚拿140亿,DeepSeek估值3000亿,中国AI大模型进入“诸神之战”》

栏目主编:张武

文字编辑:杜俊超

本文作者:潮新闻

题图来源:上观题图