MiniMax M3：一家AI公司，为什么开始重新定义自己的价值？

体育资讯精选

过去，人工智能行业的核心竞争焦点在于“谁拥有最智能的模型”。模型参数、推理能力以及基准测试排名，几乎构成了所有AI公司发布会的主题。OpenAI、Anthropic、智谱、MiniMax、月之暗面等公司，在讲述自身优势时，都遵循着相似的模式。模型越强大，公司价值就越高，这是早期大型模型公司的普遍认知。

然而，这种叙事模式正在悄然改变。以MiniMax M3的发布为例，其亮点不再仅仅集中于模型本身的性能，而是突出了BrowserComp、SWE Bench、Terminal Bench、OSWorld、MCP Atlas等能力。这些新能力的共同特点在于，它们不再关注模型“知道什么”，而是聚焦于模型“能够完成什么”。

许多人将这种转变解读为“Agent”概念的兴起。但若将时间线拉长来看，M3更值得关注的并非Agent本身，而是MiniMax对其自身价值定位的重新思考。该公司正试图解答一个行业此前鲜少认真面对的问题：一家AI公司真正提供的核心价值究竟是什么？

第一代AI公司：出售“智能”

在过去的几年里，竞争逻辑非常直接：模型的能力即是产品，基准测试成绩即是价值。MMLU、GSM8K、HumanEval、LiveCodeBench等测试，不仅仅是技术检验，更被视为市场认可的价值衡量标准。如同CPU有SPEC，GPU有MLPerf，数据库有TPC一样，成熟的产业都需要统一的标准来评估产品价值、辅助采购决策，并帮助资本形成共识。因此，模型参数规模或排行榜上的位置，成为衡量AI公司最直观的指标。在此阶段，模型本身就是商品。

MiniMax M3的发布中一个容易被忽视的细节是，MiniMax花费了大量篇幅介绍另一类能力。SWE Bench、BrowserComp、Terminal Bench、OSWorld、MCP等测试，其共同点在于几乎不关心模型是否能回答问题，而是关注模型能否修复实际的软件缺陷、独立执行网页操作、调用开发环境、集成企业现有系统，以及完成一项完整的任务。

这标志着基准测试的评价对象发生了转变。过去评价的是“智能”（Intelligence），现在则转向“任务完成度”（Task Completion）。模型首次接受的是“岗位考核”，而非“知识考试”。这不仅仅是评测体系的革新，更是MiniMax向市场传递的一个信号：模型能力依然关键，但真正驱动商业价值的，将是其“工作能力”。

MiniMax为何开始强调“工作”？

过去，大型模型的首要客户是开发者，他们购买的是模型的能力，关注点在于模型是否更智能、能否解决更复杂的问题。而企业客户在采购AI时，往往不关心模型在排行榜上处于何种位置。企业真正关心的是：AI能帮助业务完成多少工作？能节省多少人力成本？能融入多少现有流程？能提升多少效率？

因此，产品表达方式也随之改变。浏览器能力不再仅仅是浏览功能，而是融入办公流程；编程能力不再只是代码生成，而是进入研发流程；终端能力不再局限于Linux，而是进入开发环境；MCP能力也不再是简单的协议，而是集成到企业已有的软件系统中。将这些能力整合起来看，MiniMax所展示的，已不再是单一的模型，而是一整套“工作流能力”。

从Token到Workflow：价值单位的转变

许多人仍将AI公司视为API提供商，收入模式基于“Token”的消耗。调用次数越多，收入越高，这是第一代AI的商业模式。然而，当前一个新的趋势正在显现：越来越多的企业购买AI，并非为了获得更多的“回答”，而是为了完成更多的“工作”。

修复一个Bug、整理一次会议纪要、处理一张工单、分析一份合同、完成一次网页自动化操作，这些都标志着价值单位的改变。过去，一次调用对应一个“答案”（Answer）；如今，一次调用越来越对应一项“任务”（Task）。MiniMax M3的产品设计也日益围绕这一逻辑展开。

模型正从核心产品转变为底层基础设施，而“工作流”（Workflow）则成为新的产品形态。将M3置于行业大背景下审视，它代表了一种新的产品叙事。越来越多的AI公司开始证明其“工作能力”。这种转变并非MiniMax独有。Claude Code强调开发工作流；OpenAI的Operator和Computer Use关注任务执行；Google不断强化Gemini在Workspace和浏览器中的协同能力。整个行业正围绕一个新的竞争维度展开：工作流和生产力。

为何这种转变值得资本关注？

资本市场关心的始终是技术如何转化为持续的收入，而非技术领先本身。模型能力可以构建技术壁垒，而工作流能力则更容易建立商业壁垒。一旦工作流深入企业应用，便意味着数据沉淀、流程绑定、员工习惯养成以及系统集成。这些因素共同作用，能够带来更高的续费率、更强的客户粘性以及更稳定的商业模式。

因此，越来越多的AI公司正将产品叙事从模型能力转向工作能力。这并非放弃模型本身，而是在探索模型之外更长远的价值来源。从更宏观的视角来看，M3最值得关注的，并非某个特定的基准测试，而是MiniMax对未来竞争对手的重新定义：它不再仅仅是另一个模型公司，而是企业工作入口、浏览器、IDE、Office、ERP、CRM等。企业的数据不会沉淀在一次次的对话中，而是最终积累在日常的工作流程里。谁能更深入地融入这些工作流，谁就拥有更坚实的商业基础。

从这个角度看，MiniMax未来的竞争对手，不仅包括OpenAI或Anthropic，更包括所有定义企业工作方式的软件平台。

尾声：AI公司价值重构的开端

如果说过去的大模型竞争围绕“智能”展开，那么MiniMax M3所展示的，是另一种竞争逻辑。模型依然重要，但它正从产品演变为基础设施。真正站到台前的是模型如何进入企业、连接软件、完成工作。

对于MiniMax而言，这可能比一次基准测试排名更为关键。它标志着公司开始尝试回答一个新问题：当模型能力逐渐趋同，一家AI公司还能依靠什么来建立长期价值？M3给出的答案，不是更多的参数或排行榜上的名次，而是更多真实的工作场景。这或许也是AI行业进入下一阶段最重要的信号。

未来，决定一家AI公司价值的，将不再仅仅是模型有多么智能，而是它能够帮助企业重新组织多少生产力。