图片来源:unsplash
AI正在落地。
这几年,人们都看到了AI很厉害,也不满足于它只是“看上去很厉害”。
“打工人”希望AI替自己干活,企业主想叫AI帮自己赚钱。就连习惯了在AI中“放飞自我”的极客们,也觉得该着陆了。
“这几年,AI就像是我的‘飞天扫帚’,刚开始骑着它冲冲冲很爽,但现在回头看又没什么拿得出手的成果,感觉有点空虚。我也想做出‘龙虾OpenClaw’这种人们日常也想用的东西。”一位开发者在为自己的新项目找投资时表示。
类似的渴求与尝试,正在快速涌现。
但落地的路,并不轻松。
算力是AI的土壤,而国内的算力本就紧张。
不少2024-2025年创业的极客开发者,都曾吐槽过有限的算力优先流向大厂,生态不够完善、开放,团队要花费大量时间写算子、填充生态缺口等问题。
但情况已经发生改变。
开发者们渐渐发现,自己能和大厂用上同等级的算力了,以鲲鹏昇腾生态为代表的中国算力生态变得更加好用、易用,也加速走向开放、开源。
曾经的盐碱地,成了肥沃的黑土。在这里落地AI看起来已经不是难事,而那些“死磕”过来的极客们,要动手搞出点真正的大事情了。
与华为“极限拉扯”的极客“小团队”
AIGCode(蔻町智能)团队最初找到的,只是一片“荒漠”。
这家公司想把vibe coding(氛围编程)这种前沿的AI编程范式做成实用产品,让不懂代码的人也能仅凭文字描述,就生成自己的网站和应用。
2024年1月公司成立,核心团队是来自微软、华为以及国内互联网大厂的一群极客。
“我们这二、三十人的小团队中,很多人在传统大厂的评价体系中并不以综合能力见长,但技术能力都非常强,80、90分以上那种。”公司联合创始人兼CTO陈秋武介绍称。
这群人一上来就想“搞件大事情”,打破Anthropic模型的能力垄断,用自研基础模型做出“一句话生成网站和应用”的vibe coding产品。
居中为蔻町智能联合创始人&CTO陈秋武
但落地挑战巨大,尤其是在算力上。
彼时的国内AI圈,缺卡焦虑正浓。
用国产卡训练大模型,还缺少足够的成功经验,更关键的是,当时的国产算力生态很难与被英伟达视作“最强护城河”的CUDA生态等量齐观。
按业内人士所言,芯片硬件代表着算力的理论能力上限,软件生态才决定着算力的实际能力上限。换言之,没有生态的算力,只是徒有其表的空中楼阁。
“说实话,一开始用国产是因为‘穷’,我们初创小公司,没那么多钱买N卡。”陈秋武回忆称,AIGCode当时选的是华为的昇腾芯片。
但团队很快发现,这片土地比想象中更“荒”。
华为对标英伟达CUDA的是CANN生态,用陈秋武的话说,2024年初的感觉有点像“荒漠”,很多东西都没有。团队做7B模型的预训练,20台机器跑起来,缺算子、缺工具链,常常“一边踩坑,一边填坑”。
极客们向来“爱较劲”,这支小团队也由此开启了跟华为的“极限拉扯”,常常提出各类问题和需求,让华为拿出解决方案。
陈秋武称,自己曾很严厉地向华为团队指出CANN生态的差距,甚至向负责的高层表示,必须要直面问题,不要讲漂亮话,否则永远都赶不上CUDA。
“质变”比想象中来得更快。
大半年过去后,CANN生态已经“越用越顺手”。到2025年,陈秋武称看到CANN的覆盖率到百分之八九十,连他自己“都吓了一跳”。
回顾那段“走出荒漠”的经历,陈秋武觉得CANN生态之所以进步如此之快,一方面得益于昇腾硬件很扎实,擅长创新,另一方面,沟通和人的因素也很重要。
他举例称,团队开发涉及到汇编层面的底层优化,如果是在英伟达的CUDA生态中,类似的深度定制根本找不到人,查资料也查不到。但在跟华为团队的沟通中,能很方便地链接到人,还有专家级人员来跟团队密切合作解决问题。
其实,所谓“拉扯”,就是有来有回。对于开发者与算力产业来说,出现问题能有反馈,是生态建立的基础;收到反馈能解决问题,则是生态发展的要义。
尤其在AI时代,个性化的真实数据、反馈正是难得的资产和养料,也是AIGCode看到“荒漠”变为“黑土地”的关键。
如今,这支极客“小团队”已经成为昇腾CANN生态的深度共创者,交付了多个项目。他们还把MoE(混合专家模型)预训练的MFU(算力利用率)做到了65%,是行业平均水平的两倍,让昇腾上“一张卡可以当两张卡用”。
陈秋武认为,从可掌控性和发展速率来看,CANN已有胜过CUDA之处。业内不少声音也认为,鲲鹏昇腾已跨过生态拐点,正在加速发展。陈秋武还表示,自己现在仍会参加很多次华为的技术闭门会,也经常提出各种问题和建议,而华为的反馈也一如既往地快。
看起来,“拉扯”还远未结束。
AI落地何所依?
“死磕”华为生态的,不止AIGCode。
清华大学团队联合多方合作单位,基于鲲鹏服务器构建“地球系统模拟器”。这些科学家极客将AI引入传统地球系统模拟中部分依赖经验公式估算的环节,把全球模拟分辨率提升至公里级;只需计算一天,就能完成约一年模式时间的天气-气候演化模拟。
中科大团队基于鲲鹏进行算法创新,优化求解器,“榨干”鲲鹏张量运算部件和高带宽内存的优势,相比传统方法提升40倍左右。
更受关注的,是DeepSeek今年4月末发布的V4,这让中国的算力生态和中国大模型的深度耦合站到全球聚光灯下。DeepSeek当时预告,“预计下半年昇腾950超节点批量上市后,V4 Pro的价格会大幅下调”。就在5月22日晚,DeepSeek宣布6月起Pro版正式降至原价的四分之一,不少声音猜测中国算力在其中发挥了关键作用。
金融、能源、教育、交通……越来越多的行业在鲲鹏昇腾生态上落地AI能力,有的管证券交易,有的管水力发电,有的管反诈拦截。
极客开发者们,似乎找到了AI着陆的所依之地。
有“戒断英伟达,用上国产卡”的开发者,视这片新土地为“意外惊喜”;也有率先迁移到基于中国的生态的团队,将之作为“秘密武器”。
有业内人士称,在DeepSeek与昇腾进行深度适配后,全球很多巨头、机构都在“深扒其中的门道”。
其中,自然有硬核的技术突破。
比如昇腾950芯片在HiF8新型数据格式、底层架构等方面的创新,鲲鹏CPU面向Agentic AI时代在多核数、高性能、低时延等方面的针对性设计,尤其是让芯片能“集群作战”的超节点,为中国的算力提供了更多可能。
但另一方面,常被忽视的生态构建,同样关键。
生态的“门道”,听起来千头万绪,其实核心无非两点:好用,易用。
想要“好用”,除了做好硬件、软件、软硬结合,持续提升性能,更要考虑开发者的需求、偏好和实际感受。
与华为有深入合作的中科大先进计算机系统结构实验室副研究员陈俊仕评价,鲲鹏在高性能计算领域没有选择CPU+GPU异构路线,而是“另辟蹊径”走出一条独特的鲲鹏架构路线,本质上就是“把复杂留给自己,把简单留给开发者”。
而“易用”,则是降低学习成本和迁移门槛,提高兼容性和便捷度。
华为强调“硬件开放,软件开源”,CANN生态2025年底全面开源开放后,社区开源项目5个月从零增至65个,开源代码从827万行激增到1244万行,平均每天新增3万行,下载量突破千万。这意味着开发者遇到的大多数问题都能找到现成方案,不必从“造轮子”开始。清华大学团队的王一鸣提到,鲲鹏昇腾生态的代码迁移成本低,社区反馈丰富,“能让科研人员的精力回到科研本身,不用在适配和优化上反复踩坑”。
好用、易用,就会吸引更多人来用。而用的人越多,AI就会越好用。
技术革新、大国争锋、商业竞赛都会带来很多不确定性,对于致力于在变动的时代落地自身热情、创意与价值的开发者来说,一个能汇聚众人、持续滋养创造力的生态,就是一种确定性。
让智能抵达更多人
生态的意义,还在于成就超乎个体能力和预料的事。
DeepSeek的“高性价比”让更多不那么富裕的团队也能接入AI;四处涌现的Agent,将数字员工、AI助理带进现实。AIGCode的vibe coding产品,让非技术人群能通过AI快速落地自己的创意;清华大学团队的“地球系统模拟器”,则致力于为普通人预警气候灾害。
鲲鹏、昇腾的生态总会提到“使能”这个词,让合作伙伴具备能力。而在AI时代,快速跃进的智能已经引发了“能力垄断”“能力鸿沟”等焦虑。只有解决好智能的普惠,才能实现技术的平权。
那些把“AI价格打下来”、让普通人也能coding出应用、为社区居民预警灾害的极客们,正把自己的能量和生态的“使能”聚在一起,传递给更多人。AI落地,智能扩散,最终,繁荣才能属于所有人。
寻找到土壤的极客们,对未来的底气更足了,他们都想要“搞点大事情”。
DeepSeek专注于实现AGI;清华大学团队则致力于攻克气候建模领域的国际前沿难题;AIGCode则想把AI Coding做到L5,在搞定“一句话前端、后端、数据库全部生成”后,把更高复杂度的软件一句话生成自动化完成。陈秋武还希望继续与华为“拉扯”,期待打通国内算力+自研模型完整链路,让千行百业都能用上全栈自主创新的大模型。
华为自身也在鲲鹏昇腾开发者大会2026上披露,将在Agentic AI时代继续深耕超节点架构,打造好用易用的算力底座,共建繁荣共生的智能体时代算力新生态。
相信在这片土地上,还会有更多的大事发生。