过去,人工智能领域的竞争焦点集中在“谁拥有最智能的模型”。模型参数、推理能力以及在基准测试中的排名,几乎构成了所有 AI 公司发布会的核心内容。无论是 OpenAI、Anthropic,还是智谱、MiniMax、月之暗面,它们的叙事方式都高度相似:模型越智能,公司价值就越高,这是第一代大型模型公司的共同逻辑。
然而,这一叙事正在发生转变。以 MiniMax M3 的发布为例,其最引人注目的不再仅仅是模型本身的能力,而是 BrowserComp、SWE Bench、Terminal Bench、OSWorld、MCP Atlas 等一系列新的评估维度。这些评估的共同点在于,它们不再关注模型“知道什么”,而是更侧重于模型“能够做什么”。
许多人将这种转变解读为“Agent”概念的兴起。但若放眼更长远的时间线,M3 的真正价值在于 MiniMax 对自身定位的重新思考。它开始尝试解答一个行业此前较少认真面对的问题:一家 AI 公司真正销售的到底是什么?
第一代 AI 公司,销售的是“智能”
在过去的几年里,竞争逻辑非常直接:模型能力即产品,基准测试即价值。MMLU、GSM8K、HumanEval、LiveCodeBench 等一系列基准测试,不仅是技术能力的衡量,更是市场普遍认可的价值标尺。正如 CPU 有 SPEC,GPU 有 MLPerf,数据库有 TPC 一样,成熟的产业需要统一的标准来评估产品价值、指导采购决策,并帮助资本形成共识。因此,模型参数规模和排行榜位置成为市场理解 AI 公司最直接的窗口。在此阶段,模型本身就是商品。
MiniMax M3 的一个容易被忽视的亮点是,MiniMax 投入了大量篇幅介绍另一类能力。SWE Bench、BrowserComp、Terminal Bench、OSWorld、MCP 等基准测试,几乎都不关心模型能否回答问题,而是关注模型能否修复真实世界的 Bug、独立完成网页操作、调用开发环境、连接企业系统,以及完成一项完整的工作。这意味着,评价对象的重心从“智能”转向了“任务完成能力”。模型首次面临“岗位考核”,而非仅仅是“知识考试”。这不仅是评测体系的演变,更是 MiniMax 向市场传递的信号:模型能力固然重要,但真正驱动商业价值的是其“工作能力”。
MiniMax 为何开始强调“工作”?
过去,大型模型的主要客户是开发者,他们购买的是模型的能力,关注的是其智能程度和解决复杂问题的潜力。然而,企业客户在采购 AI 时,通常不关心模型在排行榜上的位置,而是更关注 AI 能为业务带来多少实际工作量,节省多少人力,融入多少流程,以及提升多少效率。
因此,产品表达方式也随之改变。Browser 不再仅仅是浏览器功能,而是融入办公流程;Coding 不再是简单的代码生成,而是进入研发流程;Terminal 不再局限于 Linux,而是成为开发环境的一部分;MCP 不再是简单的协议,而是整合进企业现有的软件系统。将这些能力整合来看,MiniMax 试图展示的不再是单一模型,而是一套完整的“工作流能力”。
从 Token 到 Workflow
许多人仍将 AI 公司视为 API 服务商,收入来源于 Token 消耗,即调用次数越多,收入越高。这是第一代 AI 的商业模式。然而,一种新的趋势正在显现:越来越多的企业购买 AI,并非为了获得更多回答,而是为了完成更多工作。修复一个 Bug、整理一次会议、处理一张工单、分析一份合同、完成一次网页操作,其价值单位正在发生转变。过去,一次调用对应一个“答案”,如今,一次调用越来越对应一项“任务”。
MiniMax M3 的产品设计也越来越围绕这一逻辑展开。模型成为底层基础,而“工作流”(Workflow)则成为产品本身。将 M3 置于行业背景下观察,它代表了一种新的产品叙事。越来越多的 AI 公司开始证明其“工作能力”。这一变化并非 MiniMax 独有:Claude Code 强调开发工作流;OpenAI 的 Operator 和 Computer Use 关注任务执行;Google 则不断强化 Gemini 在 Workspace 和浏览器中的协同能力。整个行业正围绕“工作流”和“生产力”构建新的竞争格局。
为何这种转变值得资本关注?
资本市场关心的始终是技术如何转化为持续的收入。模型能力可以构建技术壁垒,而“工作流”则更容易构建商业壁垒。一旦工作流深入企业应用,就意味着数据沉淀、流程绑定、员工习惯形成以及系统集成。这些因素共同作用,能够带来更高的续费率、更强的客户粘性以及更稳健的商业模式。因此,越来越多的 AI 公司正将产品叙事从模型能力转向工作能力。这不是放弃模型,而是寻求模型之外更长期的价值来源。
从更宏观的视角来看,M3 最值得关注的并非某个具体的基准测试,而是 MiniMax 对未来竞争对手的重新定义:从其他模型公司,转变为企业工作入口、浏览器、IDE、Office、ERP、CRM 等平台。企业数据不会沉淀在一次简单的对话中,而是最终汇聚在日常的工作流里。谁能更深入地融入企业的工作流,谁就拥有更坚实的商业基础。从这个角度看,MiniMax 未来的竞争对手,不仅包括 OpenAI 或 Anthropic,更包括所有定义企业工作方式的软件平台。
尾声:一家 AI 公司价值重构的开端
如果说过去的大模型竞争围绕“智能”展开,那么 MiniMax M3 则展示了另一种竞争逻辑。模型依然重要,但正从产品演变为基础设施。真正站到台前的,是模型如何进入企业、连接软件、完成工作。对 MiniMax 而言,这可能比一次基准测试排名更为关键,因为它意味着公司开始尝试回答一个新问题:当模型能力日趋同质化时,一家 AI 公司还能依靠什么建立长期价值?M3 给出的答案,不是更多的参数或排行榜,而是更多真实的工作。这或许是 AI 行业进入下一阶段的最重要信号。未来,决定一家 AI 公司价值的,将不仅仅是模型有多聪明,更是它能帮助企业重组多少生产力。
精彩评论
沉浸于赛事的魅力,MK体育为您精心策划海量精彩瞬间集锦,让您随时重温那些令人血脉偾张的进球、绝杀和经典时刻。每一次回放,都是一次激情重燃。
资深球迷B
2026年5月15日
作为一家自2012年成立的体育传媒公司,MK体育传媒有限公司始终坚持提供最权威、最全面的赛事资讯。我们相信,精准的信息和专业的分析是热爱体育的您不可或缺的伴侣。
体育评论员
2026年5月15日

聚焦全球顶级赛事,MK体育为您带来最即时的比分动态,让您仿佛置身赛场。我们的专业团队深入剖析每场比赛,提供独到见解,助您更精准地把握比赛脉搏。
资深球迷A
2026年5月15日