同样的算力和数据,谁能学得更多、推得更快就能活到下一阶段。 ![]() 撰文/祝余 编辑/春山 ![]() 大模型创业公司的命运,正在被一件事重新排序:不是谁的Demo更像人,而是谁能把“聪明”做得更便宜、更持久、更可复制。过去两年,中国AI圈最热闹的战场是C端助手:投流、抢榜、卷免费、卷入口。 Kimi曾在长文本红利期吃到过第一波,但很快就被更强的流量机器、更大的补贴弹药、更密的产品矩阵逼到边缘——这并不羞耻,它只是告诉你一个残酷事实:在超级应用面前,创业公司的“单点优势”很难长期抵抗“系统性碾压”。 于是杨植麟换了打法。在AGI-Next峰会上,他把答案抛得很硬:下一代范式,核心是效率——Token效率与长上下文,再叠加面向Agent的长链路任务能力。简单说就是:同样的算力、同样的数据,谁能学得更多、推得更快、做得更稳,谁就能活到下一阶段。 这条路听起来像理工科的自嗨,实际上极其商业:因为AI的利润,不是从“更聪明一点”里长出来的,而是从“单位智能成本下降”里长出来的。 OpenRouter与a16z基于真实流量做的“100万亿Token研究”也在暗示同一件事:模型使用正在从一问一答转向更长的、多步推理和代理式工作流——这会把推理成本推到台前,逼所有人从“榜单叙事”回到“成本叙事”。 更关键的是:当同行开始冲IPO、讲增长、讲收入,月之暗面却在资本层面反其道而行——不急上市,继续融资、继续堆筹码。1月20日前后,多家媒体援引CNBC消息称,月之暗面新一轮融资估值达48亿美元,较不久前的43亿美元抬升,且交割可能很快完成。 这不是“资本又上头了”,而是市场在给一种更稀缺的东西投票:下一代成本曲线的可能性。 下一代范式的门票,不在“更大”,在“更省” 杨植麟讲的“Token效率”,如果翻译成商业语言,就是“同样预算买到更多智能”。这听着像一句废话,但在大模型行业,它意味着生死:因为今天的大模型竞争,早已不是谁能做出一个好模型,而是谁能持续做出一系列好模型,并且每一代都能让训练与推理的单位成本下降。 AGI-Next的讨论里,几位来自不同阵营的代表形成了一个越来越公开的共识:Scaling仍有价值,但边际收益在下降,算力、数据、成本越堆越大,智能提升的增量却越来越小。这就是范式切换的土壤:当“更大”不再自动等于“更强”,你就必须回答“更强从哪来”。 ![]() 月之暗面给出的答案是两条主线:一条是训练阶段的Token效率,另一条是推理阶段的长上下文能力。细节看似偏技术,但它们对应的,恰恰是“下一代Agent是否能成立”的关键约束。 先说Token效率。媒体对其技术路径的公开信息提到,月之暗面在预训练中强调通过优化器提升学习效率,并配合稳定训练的手段去解决训练发散类问题,让更大规模的模型训练更稳、更省。 这类改进的意义,不是让你在榜单上多赢0.2分,而是让你在同样算力预算下,把“可迭代次数”提高——能迭代,才有工程优势;能持续迭代,才有商业优势。 再说长上下文。长文本曾是Kimi最出圈的标签,但杨植麟这次把它重新定义为“Agent时代的基础设施”:长上下文不是为了让你读更长的PDF,而是为了让模型能在长程任务里保持低损耗,完成多步骤规划、工具调用与自我修正。 公开报道提及的Kimi-Linear线性注意力等方向,本质也是在做一件事:把“长上下文”从实验室能力,变成可规模化部署的推理能力——速度、成本、稳定性都要过关。 这两条线叠加起来,才是杨植麟口中“下一代范式船票”的真实含义:用更少的Token,完成更长的任务。一旦Agent工作流成为主流,Token消耗会从“聊天长度”升级为“任务链路长度”,成本曲线将决定产品曲线。 OpenRouter那份基于真实调用的报告之所以重要,就在于它用流量告诉你:多步推理、编程与代理式任务正在吞噬更多Token,行业需求正在把“效率”推到第一优先级。 这也解释了一个看似矛盾的现象:Kimi在C端可能掉队,但月之暗面仍然能在资本市场维持高热度。因为资本赌的不是“下一个爆款App”,而是“谁能在下一代成本曲线里占个好位置”。 当AI开始“拼家底”,月之暗面要用资本买时间,用技术买议价权 但问题也显而易见:范式押注很贵,而且很慢。对没有大厂生态的独立模型公司来说,“慢”本身就是风险:窗口期越来越短,领先优势可能随时被新模型刷新,市场注意力也不会等你把论文写完。 所以月之暗面必须同时做两件事:一是用资本把研发周期撑住;二是用某种方式把技术优势转化为可持续的收入与议价权。否则“效率叙事”只会变成“烧钱叙事”。 先看资本。1月20日前后,媒体援引知情人士称月之暗面正在敲定新融资,估值升至48亿美元,且需求旺盛、交割或很快完成。与此同时,公开报道也提到公司在前一轮融资后现金储备充足、短期不急于上市的表态。 ![]() 这种“先不去二级市场接受审视”的选择,本质是用一级市场的耐心换研发自由度——你可以不讲短期利润,但必须讲清楚长期技术路线的确定性。 但光有钱不够,行业已经从“技术叙事”转向“结果叙事”。这时候,月之暗面如果彻底放弃应用,只做底座,很可能被两头挤:上面有闭源巨头拼算力拼生态,下面有开源模型快速追平并压低价格。 OpenRouter报告里开源使用占比上升的趋势,本质也在挤压闭源/创业公司的溢价空间:当“能用的模型”越来越多,客户会更在意“性价比”和“可控性”。 因此,月之暗面现在强调的Agent与工具调用,不只是技术好看,而是商业上必须:Agent一旦能稳定跑长任务,它就具备“嵌入工作流”的资格。 嵌入工作流,才可能产生更高ARPU、更强粘性、更低获客成本。C端助手烧投流拼不过大厂,那就转去拼“生产力场景的ROI”,用更少用户带来更多收入——这才是独立公司更现实的生存路线。 外部信号也在帮月之暗面“抬轿子”。2026年CES上,英伟达在开源生态叙事中展示了包括Kimi在内的多家模型名字,强调开源模型迭代与生态的重要性。 更微妙的是:当英伟达把某些模型放进自己的性能叙事里,本质上是在给它们一种“供应链级别的背书”——你不一定因此卖出更多订阅,但你会更容易进入开发者视野,进入海外开发者的工具链,进入B端评估清单。这类“被看见”的价值,对独立模型公司非常现实。 同样,OpenRouter等平台的真实调用数据,也为“谁在海外被使用”提供了一个侧面视角。部分媒体引用OpenRouter统计称,在2024年11月到2025年11月期间,月之暗面模型的调用量达到0.92万亿Token,并列出与其他厂商的对比。 这不等于收入,但它是“进入海外开发者心智”的证据之一——在Agent时代,入口不只在应用商店,也在开发者平台、API聚合层、工作流工具里。 所以你会发现,月之暗面的算盘越来越清晰:C端不再靠投流硬刚,而是把有限资源集中到“下一代范式+可嵌入的Agent能力”,再通过资本买时间,通过生态曝光买议价权。它赌的是:当行业从“谁更会聊天”走向“谁更会干活”,效率领先会变成新的护城河。 结语 月之暗面今天的选择,像一场典型的创业者豪赌:放弃短期热闹,去押一个更长周期、更高不确定性的未来。 它的对手不是某一个App,而是一条行业趋势——大厂在用生态压缩你的获客空间,开源在用速度压缩你的技术溢价,客户在用ROI压缩你的定价想象。留给独立模型公司的路越来越窄,窄到必须回答一个更底层的问题:你到底凭什么长期存在? 杨植麟把答案押在“下一代范式”上:Token效率、长上下文、Agent长链路——说到底是一句话:让智能更便宜、更可用、更能进入工作流。 如果他赌赢了,月之暗面会从“一个做Kimi的公司”变成“下一代成本曲线的受益者”,到那时,上市只是工具,融资只是手段,真正值钱的是它对成本与效率的定义权。 但如果赌输了,也很简单:C端错过的时间不会回来,技术领先的窗口期也不会等你。大模型史已经证明,榜单上“各领风骚三两月”是常态;真正稀缺的,是把领先变成系统能力,把系统能力变成现金流。 所以这不是一篇关于“Kimi掉队”的文章,而是一篇关于“独立模型公司如何活下去”的文章。 下一代AI范式到底长什么样,没人敢打包票;但可以确定的是,未来的赢家不会只是更聪明,而是更会算账——能用更少的Token,做完更长的事。 |