过去,人工智能行业的核心竞争焦点在于“谁拥有最智能的模型”。模型参数、推理能力以及基准测试排名,几乎构成了所有AI公司发布会的主题。OpenAI、Anthropic、智谱、MiniMax、月之暗面等公司,在讲述自身优势时,都遵循着相似的模式。模型越强大,公司价值就越高,这是早期大型模型公司的普遍认知。
然而,这种叙事模式正在悄然改变。以MiniMax M3的发布为例,其亮点不再仅仅集中于模型本身的性能,而是突出了BrowserComp、SWE Bench、Terminal Bench、OSWorld、MCP Atlas等能力。这些新能力的共同特点在于,它们不再关注模型“知道什么”,而是聚焦于模型“能够完成什么”。
许多人将这种转变解读为“Agent”概念的兴起。但若将时间线拉长来看,M3更值得关注的并非Agent本身,而是MiniMax对其自身价值定位的重新思考。该公司正试图解答一个行业此前鲜少认真面对的问题:一家AI公司真正提供的核心价值究竟是什么?
第一代AI公司:出售“智能”
在过去的几年里,竞争逻辑非常直接:模型的能力即是产品,基准测试成绩即是价值。MMLU、GSM8K、HumanEval、LiveCodeBench等测试,不仅仅是技术检验,更被视为市场认可的价值衡量标准。如同CPU有SPEC,GPU有MLPerf,数据库有TPC一样,成熟的产业都需要统一的标准来评估产品价值、辅助采购决策,并帮助资本形成共识。因此,模型参数规模或排行榜上的位置,成为衡量AI公司最直观的指标。在此阶段,模型本身就是商品。
MiniMax M3的发布中一个容易被忽视的细节是,MiniMax花费了大量篇幅介绍另一类能力。SWE Bench、BrowserComp、Terminal Bench、OSWorld、MCP等测试,其共同点在于几乎不关心模型是否能回答问题,而是关注模型能否修复实际的软件缺陷、独立执行网页操作、调用开发环境、集成企业现有系统,以及完成一项完整的任务。
这标志着基准测试的评价对象发生了转变。过去评价的是“智能”(Intelligence),现在则转向“任务完成度”(Task Completion)。模型首次接受的是“岗位考核”,而非“知识考试”。这不仅仅是评测体系的革新,更是MiniMax向市场传递的一个信号:模型能力依然关键,但真正驱动商业价值的,将是其“工作能力”。
MiniMax为何开始强调“工作”?
过去,大型模型的首要客户是开发者,他们购买的是模型的能力,关注点在于模型是否更智能、能否解决更复杂的问题。而企业客户在采购AI时,往往不关心模型在排行榜上处于何种位置。企业真正关心的是:AI能帮助业务完成多少工作?能节省多少人力成本?能融入多少现有流程?能提升多少效率?
因此,产品表达方式也随之改变。浏览器能力不再仅仅是浏览功能,而是融入办公流程;编程能力不再只是代码生成,而是进入研发流程;终端能力不再局限于Linux,而是进入开发环境;MCP能力也不再是简单的协议,而是集成到企业已有的软件系统中。将这些能力整合起来看,MiniMax所展示的,已不再是单一的模型,而是一整套“工作流能力”。
从Token到Workflow:价值单位的转变
许多人仍将AI公司视为API提供商,收入模式基于“Token”的消耗。调用次数越多,收入越高,这是第一代AI的商业模式。然而,当前一个新的趋势正在显现:越来越多的企业购买AI,并非为了获得更多的“回答”,而是为了完成更多的“工作”。
修复一个Bug、整理一次会议纪要、处理一张工单、分析一份合同、完成一次网页自动化操作,这些都标志着价值单位的改变。过去,一次调用对应一个“答案”(Answer);如今,一次调用越来越对应一项“任务”(Task)。MiniMax M3的产品设计也日益围绕这一逻辑展开。
模型正从核心产品转变为底层基础设施,而“工作流”(Workflow)则成为新的产品形态。将M3置于行业大背景下审视,它代表了一种新的产品叙事。越来越多的AI公司开始证明其“工作能力”。这种转变并非MiniMax独有。Claude Code强调开发工作流;OpenAI的Operator和Computer Use关注任务执行;Google不断强化Gemini在Workspace和浏览器中的协同能力。整个行业正围绕一个新的竞争维度展开:工作流和生产力。
为何这种转变值得资本关注?
资本市场关心的始终是技术如何转化为持续的收入,而非技术领先本身。模型能力可以构建技术壁垒,而工作流能力则更容易建立商业壁垒。一旦工作流深入企业应用,便意味着数据沉淀、流程绑定、员工习惯养成以及系统集成。这些因素共同作用,能够带来更高的续费率、更强的客户粘性以及更稳定的商业模式。
因此,越来越多的AI公司正将产品叙事从模型能力转向工作能力。这并非放弃模型本身,而是在探索模型之外更长远的价值来源。从更宏观的视角来看,M3最值得关注的,并非某个特定的基准测试,而是MiniMax对未来竞争对手的重新定义:它不再仅仅是另一个模型公司,而是企业工作入口、浏览器、IDE、Office、ERP、CRM等。企业的数据不会沉淀在一次次的对话中,而是最终积累在日常的工作流程里。谁能更深入地融入这些工作流,谁就拥有更坚实的商业基础。
从这个角度看,MiniMax未来的竞争对手,不仅包括OpenAI或Anthropic,更包括所有定义企业工作方式的软件平台。
尾声:AI公司价值重构的开端
如果说过去的大模型竞争围绕“智能”展开,那么MiniMax M3所展示的,是另一种竞争逻辑。模型依然重要,但它正从产品演变为基础设施。真正站到台前的是模型如何进入企业、连接软件、完成工作。
对于MiniMax而言,这可能比一次基准测试排名更为关键。它标志着公司开始尝试回答一个新问题:当模型能力逐渐趋同,一家AI公司还能依靠什么来建立长期价值?M3给出的答案,不是更多的参数或排行榜上的名次,而是更多真实的工作场景。这或许也是AI行业进入下一阶段最重要的信号。
未来,决定一家AI公司价值的,将不再仅仅是模型有多么智能,而是它能够帮助企业重新组织多少生产力。
精彩评论
在爱游戏体育,我们为您精选一手赛事资讯,提供深度数据分析,满足您对足球、篮球等热门项目的多元化需求,让您轻松掌握比赛动态。
用户B
2026年5月10日 10:30
爱游戏体育,让您不错过任何精彩。我们聚焦体育赛事,提供实时资讯、赛程安排及深度分析,并通过个性化推荐,为您打造专属的体育信息流。
用户C
2026年4月28日 18:00

实时比分更新,赛程安排一目了然。爱游戏体育覆盖足球、篮球等热门项目,更有专业数据分析,助您洞悉比赛走向,掌握先机。
用户A
2026年5月15日 15:12