MiniMax M3：一家AI公司，为什么开始重新定义自己的价值？

体育资讯

过去，人工智能领域的竞争焦点集中在“谁拥有最智能的模型”。模型参数、推理能力以及在基准测试中的排名，几乎构成了所有 AI 公司发布会的核心内容。无论是 OpenAI、Anthropic，还是智谱、MiniMax、月之暗面，它们的叙事方式都高度相似：模型越智能，公司价值就越高，这是第一代大型模型公司的共同逻辑。

然而，这一叙事正在发生转变。以 MiniMax M3 的发布为例，其最引人注目的不再仅仅是模型本身的能力，而是 BrowserComp、SWE Bench、Terminal Bench、OSWorld、MCP Atlas 等一系列新的评估维度。这些评估的共同点在于，它们不再关注模型“知道什么”，而是更侧重于模型“能够做什么”。

许多人将这种转变解读为“Agent”概念的兴起。但若放眼更长远的时间线，M3 的真正价值在于 MiniMax 对自身定位的重新思考。它开始尝试解答一个行业此前较少认真面对的问题：一家 AI 公司真正销售的到底是什么？

第一代 AI 公司，销售的是“智能”

在过去的几年里，竞争逻辑非常直接：模型能力即产品，基准测试即价值。MMLU、GSM8K、HumanEval、LiveCodeBench 等一系列基准测试，不仅是技术能力的衡量，更是市场普遍认可的价值标尺。正如 CPU 有 SPEC，GPU 有 MLPerf，数据库有 TPC 一样，成熟的产业需要统一的标准来评估产品价值、指导采购决策，并帮助资本形成共识。因此，模型参数规模和排行榜位置成为市场理解 AI 公司最直接的窗口。在此阶段，模型本身就是商品。

MiniMax M3 的一个容易被忽视的亮点是，MiniMax 投入了大量篇幅介绍另一类能力。SWE Bench、BrowserComp、Terminal Bench、OSWorld、MCP 等基准测试，几乎都不关心模型能否回答问题，而是关注模型能否修复真实世界的 Bug、独立完成网页操作、调用开发环境、连接企业系统，以及完成一项完整的工作。这意味着，评价对象的重心从“智能”转向了“任务完成能力”。模型首次面临“岗位考核”，而非仅仅是“知识考试”。这不仅是评测体系的演变，更是 MiniMax 向市场传递的信号：模型能力固然重要，但真正驱动商业价值的是其“工作能力”。

MiniMax 为何开始强调“工作”？

过去，大型模型的主要客户是开发者，他们购买的是模型的能力，关注的是其智能程度和解决复杂问题的潜力。然而，企业客户在采购 AI 时，通常不关心模型在排行榜上的位置，而是更关注 AI 能为业务带来多少实际工作量，节省多少人力，融入多少流程，以及提升多少效率。

因此，产品表达方式也随之改变。Browser 不再仅仅是浏览器功能，而是融入办公流程；Coding 不再是简单的代码生成，而是进入研发流程；Terminal 不再局限于 Linux，而是成为开发环境的一部分；MCP 不再是简单的协议，而是整合进企业现有的软件系统。将这些能力整合来看，MiniMax 试图展示的不再是单一模型，而是一套完整的“工作流能力”。

从 Token 到 Workflow

许多人仍将 AI 公司视为 API 服务商，收入来源于 Token 消耗，即调用次数越多，收入越高。这是第一代 AI 的商业模式。然而，一种新的趋势正在显现：越来越多的企业购买 AI，并非为了获得更多回答，而是为了完成更多工作。修复一个 Bug、整理一次会议、处理一张工单、分析一份合同、完成一次网页操作，其价值单位正在发生转变。过去，一次调用对应一个“答案”，如今，一次调用越来越对应一项“任务”。

MiniMax M3 的产品设计也越来越围绕这一逻辑展开。模型成为底层基础，而“工作流”（Workflow）则成为产品本身。将 M3 置于行业背景下观察，它代表了一种新的产品叙事。越来越多的 AI 公司开始证明其“工作能力”。这一变化并非 MiniMax 独有：Claude Code 强调开发工作流；OpenAI 的 Operator 和 Computer Use 关注任务执行；Google 则不断强化 Gemini 在 Workspace 和浏览器中的协同能力。整个行业正围绕“工作流”和“生产力”构建新的竞争格局。

为何这种转变值得资本关注？

资本市场关心的始终是技术如何转化为持续的收入。模型能力可以构建技术壁垒，而“工作流”则更容易构建商业壁垒。一旦工作流深入企业应用，就意味着数据沉淀、流程绑定、员工习惯形成以及系统集成。这些因素共同作用，能够带来更高的续费率、更强的客户粘性以及更稳健的商业模式。因此，越来越多的 AI 公司正将产品叙事从模型能力转向工作能力。这不是放弃模型，而是寻求模型之外更长期的价值来源。

从更宏观的视角来看，M3 最值得关注的并非某个具体的基准测试，而是 MiniMax 对未来竞争对手的重新定义：从其他模型公司，转变为企业工作入口、浏览器、IDE、Office、ERP、CRM 等平台。企业数据不会沉淀在一次简单的对话中，而是最终汇聚在日常的工作流里。谁能更深入地融入企业的工作流，谁就拥有更坚实的商业基础。从这个角度看，MiniMax 未来的竞争对手，不仅包括 OpenAI 或 Anthropic，更包括所有定义企业工作方式的软件平台。

尾声：一家 AI 公司价值重构的开端

如果说过去的大模型竞争围绕“智能”展开，那么 MiniMax M3 则展示了另一种竞争逻辑。模型依然重要，但正从产品演变为基础设施。真正站到台前的，是模型如何进入企业、连接软件、完成工作。对 MiniMax 而言，这可能比一次基准测试排名更为关键，因为它意味着公司开始尝试回答一个新问题：当模型能力日趋同质化时，一家 AI 公司还能依靠什么建立长期价值？M3 给出的答案，不是更多的参数或排行榜，而是更多真实的工作。这或许是 AI 行业进入下一阶段的最重要信号。未来，决定一家 AI 公司价值的，将不仅仅是模型有多聪明，更是它能帮助企业重组多少生产力。