月之暗面刚拿140亿，DeepSeek估值3000亿，中国AI大模型进入“诸神之战”

2026年5月，中国AI大模型赛道迎来两枚重磅炸弹。

月之暗面（Kimi）即将完成新一轮20亿美元（约合人民币140亿元）融资，投后估值突破200亿美元（约合人民币1400亿元）。本轮融资由美团龙珠领投，中国移动、CPE源峰等参投，另有多家老股东加注。至此，Kimi累计融资额已超376亿元人民币，成为中国大模型创业公司中累计融资最多的公司。

几乎同一时间，DeepSeek首轮融资也浮出水面。据报道，DeepSeek首轮融资估值已达到约450亿美元（约合人民币3000亿元），大基金正在寻求领投。此前，DeepSeek创始人梁文锋曾明确表示对商业化兴趣寥寥，婉拒过多批投资人。如今姿态转变，意味着一场更大规模的资本博弈正在拉开序幕。

这是两笔性质截然不同的融资。Kimi背后站着的是产业资本和财务投资者的联手重注，DeepSeek则开始向国家队靠拢。但它们的共同点在于：都标志着中国大模型创业公司从“技术秀肌肉”全面进入“资本拼内力”的新阶段。

千问生成图片

两款模型的隔空内力大比拼

全球AI底层技术的话语权开始转移

更值得玩味的是，就在融资消息传出前，两家公司在技术战场上刚刚完成了一次“默契”的隔空交锋。

4月20日深夜，月之暗面发布并开源了Kimi K2.6模型——1T参数MoE架构，32B激活，可连续编码13小时，Agent可持续自主运行5天。在多项全球权威基准测试中，其表现持平甚至优于GPT-5.4、Claude Opus 4.6等顶尖闭源模型，一举夺回开源模型全球第一宝座。

四天后，DeepSeek V4接踵而至。两款模型前后相隔不到四天发布，包揽全球权威开源模型榜单前两名。有人把这比作中国AI界的iPhone时刻：从DeepSeek到Kimi，中国AI公司正从追赶者成为规则重构者。

在Artificial Analysis智能指数开源模型榜单上，全球前五名开源模型全部为中国模型。据OpenRouter统计，今年一季度全球API调用量中，中国开源大模型的周Token调用量占比已超过60%，Kimi与DeepSeek稳居前列。

悄然间，全球AI底层技术的话语权开始转移。

DeepSeek悄然转身

当技术理想主义遇上资本和人才现实

DeepSeek首轮融资的浮出水面，是一个意味深长的信号。

一年前，梁文锋还是那个对商业化说“不”的技术理想主义者。当一批批投资人登门拜访，他给出的回答几乎相同：不感兴趣。彼时，DeepSeek刚刚凭借R1模型引爆全球AI江湖，以开源加低价的组合拳成为现象级的国民AI应用。

但形势比人强。

据最新报道，DeepSeek首轮融资估值已达约450亿美元。这个数字意味着什么？横向对比，在港股上市的AI双雄，MINIMAX市值约2495亿港元，合2192亿元人民币，智谱市值4260亿港元，约3744亿元人民币。DeepSeek作为一个从未融资、完全靠创始人自有资金和量化交易收入支撑的公司，首轮融资就站上450亿美元，在全球AI创业史上几乎是前无古人的案例。

这意味着，全球资本正在给中国AI公司重新定价。而这种重估并非空穴来风——英伟达CEO黄仁勋在今年CES上展示下一代GPU性能时，使用的基准模型正是DeepSeek和Kimi K2-Thinking，这是历史上第一次。

估值骤起，但挑战也如影随形。据媒体报道，DeepSeek正面临“留人难”的困境，核心研究员被字节、小米等大厂以数倍薪资挖角。在缺乏股权激励的情况下，纯粹的技术理想很难长期留住顶级人才。首轮融资的启动，或许正是为了解决这一结构性问题。

同时，DeepSeek也在加速构筑自己的生态壁垒。V4模型深度适配华为昇腾芯片，发布会上更明确将降价节奏与昇腾950超节点批量上市挂钩。这种“模型+芯片”的协同战略，在全球AI竞争中是独特的存在——用中国的芯片，跑中国的模型，对全世界开源。

DeepSeek的融资转身，标志着大模型创业的底层逻辑正在发生深刻变化：当技术领先的红利窗口逐渐收窄，资本的厚度、生态的广度、商业化的速度，正在成为决定终局的更关键变量。

大模型群雄逐鹿

“六小虎”的洗牌与突围

Kimi和DeepSeek的军备竞赛，只是中国AI大模型赛道巨变的冰山一角。

2026年，全球AI产业正经历从“技术奇观”到“商业验证”的关键转折。截至2026年初，全球AI独角兽已达约370家；今年第一季度，生成式AI领域融资额达1635亿美元，较去年同期增长599%。然而，繁荣表面之下，一场无声的分化与淘汰正在加速。

AI大模型也面临洗牌（千问AI生成图片）

曾经被资本与媒体冠以“AI六小虎”之名的六家明星公司——智谱AI、MiniMax、月之暗面、阶跃星辰、百川智能、零一万物——其发展轨迹已无法再用同一标签概括。短短两年间，它们从集体讲述AGI故事，到路径急剧分化，走出了一个行业从野蛮生长到理性分层的完整周期。

2026年开年，智谱AI与MINIMAX相继登陆港交所，分别成为“全球大模型第一股”和“全球化AGI第一股”，标志着大模型创业进入资本化新阶段，也划定了行业分化的分水岭。

智谱AI代表的是典型的B端深耕策略。聚焦政企市场，以API+私有化部署双轮驱动，2025年营收7.24亿元，MaaS平台ARR达17亿元。更具标志性的是，智谱敢于逆势涨价83%后调用量不降反升，展现出罕见的定价权与客户粘性。但硬币的另一面是，亏损接近50亿，收入连研发投入的四分之一都不到——B端定制化项目如何实现规模化盈利，仍是悬在头顶的达摩克利斯之剑。

MINIMAX则走了一条截然不同的C端全球化道路。旗下社交应用Talkie等C端产品占公司收入超七成，AI原生产品收入占比达71.4%，在海外市场建立了可观的用户基础。上市后，MiniMax开始发力企业级市场，C端与B端双线并进。但C端用户增长已现见顶迹象，高昂算力成本持续吞噬营收，盈利仍面临巨大压力。

Kimi与DeepSeek，是“六小虎”中走出独特道路的两个异类。它们都没有走传统B端定制或C端应用的路线，而是以“技术驱动+API变现”的模式，在全球开源生态中杀出一条血路。

Kimi的ARR收入从3月初突破1亿美元，到4月超过2亿美元，付费用户订阅和API调用成为主要推动力。DeepSeek则以极致性价比为武器，V4模型API价格仅为竞品的1/20。两者的路径共同验证了一个核心命题：在AI基础设施层，技术领先可以直接转化为商业回报。

而它们之间，更生长出一种超越竞争的惺惺相惜。Kimi的MLA注意力机制中，流淌着DeepSeek早期公开探索的脉络；DeepSeek V4中关键的Muon优化器，其有效性由Kimi团队率先验证，DeepSeek还在技术报告中公开致谢。这种技术联动，在竞争白热化的大模型江湖实属罕见。

并非所有人都能留在通用大模型的牌桌上。百川智能和零一万物，选择了“断臂求生”。

百川智能放弃了通用大模型赛道，裁撤金融、教育等B端团队，全力押注AI医疗。其医疗大模型Baichuan-M3在权威评测中以65.1分位列全球第一，首次实现对GPT-5.2的超越。但代价是退出一线竞争，市场规模和想象力空间也相应收窄。零一万物则直接收缩业务，转向轻量化行业定制模型。

这条路的残酷之处在于：垂直领域的先发优势和时间窗口有限，一旦大厂的通用模型能力溢出，随时可能遭遇“降维打击”。深耕者必须在数据壁垒、行业know-how和客户关系上加速构筑护城河，窗口期可能只有一到两年。

垂类赛道的新秀崛起，边界外的“闯入者”

当“六小虎”在通用大模型赛道鏖战时，一批在特定赛道快速崛起的AI新秀正在改写竞争版图。

视频生成赛道已形成三足鼎立格局。生数科技（U-ViT路线）完成近20亿元B轮融资，估值超20亿美元，计划最快2026年上半年启动港股IPO，其To C产品近期突破3000万用户。爱诗科技（DiT路线）完成约20亿元C轮融资。Sand.ai选择自回归架构的激进路线，近期完成约5000万美元融资，年度经常性收入已超千万美元。

具身智能成为2025年以来的最大热点。2025年中国新晋的8家AI独角兽中，有7家聚焦于机器人或具身智能领域。与美国重金押注基础大模型不同，中国将优势集中于“技术+产业场景”的结合，推动人形机器人和工业自动化在制造、仓储等场景的大规模商用。

AI Agent更是2026年最明确的产业爆发点。OpenClaw在全球开发者社区爆火，GitHub星标接近25万，超越所有开源软件项目。这款AI Agent产品形成了一个巨大的Token消耗引擎，2026年2月最后一周，OpenRouter平台前十位模型的总Token消耗约8.7万亿，中国模型独占5.3万亿，占比61%。MiniMax、Kimi、智谱三家凭借与OpenClaw生态的深度绑定，完成了从技术厂商到AI基础设施的跃迁。

大模型之战的终局推演

独立上市还是并入大厂生态

当资本、技术、生态三重变量交织，中国AI新秀赛道的终局可能呈现三种格局。

目前的AI大模型最顶端的是字节系（豆包）与阿里系（千问），它们凭借流量与云生态占据通用AI入口，少数独立模型公司（DeepSeek、Kimi等）作为技术基础设施供应商存活，其余参与者转向垂直应用层。2026年第一季度，中国大模型全球周调用量已达12.96万亿Token，为美国的4.3倍，国产大模型已从“跟跑”迈入“领跑”，这一实力基础支撑了独立发展的可能性。

随着头部大厂资本开支持续攀升——阿里巴巴未来三年投入超3800亿元，字节跳动2026年资本支出预计高达1600亿元——独立AI公司的生存空间将不断被挤压，并购整合成为大概率事件。

在未来的全球化分工中，中国AI企业凭借性价比优势和Agent生态适配能力，在全球AI产业分工中占据独特位置。正如OpenClaw效应所展示的，中国模型正在成为全球Agent部署的基础设施。

而对于身处浪潮中的每一家公司而言，一个共识正在浮现：大模型创业从来不是人人都能分一杯羹的机会，而是强者生存、弱者淘汰的战场。竞争的焦点已从“谁更聪明”转向“谁更有用”——即谁能将AI能力更高效、更深度地融入产业，创造出真正的商业价值。

在中国AI大模型这场千亿级别的军备竞赛中，资金储备决定了下牌桌的底线，但技术创新与商业落地的双轮驱动，才是走得更远的真正内力。而这场群雄逐鹿的大戏，才刚刚进入最精彩的章节。

原标题：《月之暗面刚拿140亿，DeepSeek估值3000亿，中国AI大模型进入“诸神之战”》

栏目主编：张武

文字编辑：杜俊超

本文作者：潮新闻

题图来源：上观题图