6月30日,中国人工智能领域迎来了一个重要的日子。
美团和华为在同一天发布了各自的开源模型,而算力芯片领域的领军企业寒武纪的市值也在盘中突破了万亿大关,这标志着模型、芯片和资本市场实现了协同发展。
美团发布了其新一代开源模型LongCat-2.0,该模型拥有高达1.6万亿的参数量,其测试版本在调用量方面已位列全球前三。
尽管参数量达到1.6万亿的国产模型并非首见,与4月份发布的DeepSeek模型相当,但这款模型完全基于国产算力进行训练,这凸显了“国模国芯”(国产模型与国产芯片)深度融合的发展趋势。
过去虽然也曾出现过基于国产算力训练的模型,但其参数量均未达到1.6万亿的规模。与此同时,大多数模型在探索使用国产算力进行推理的同时,训练环节仍旧依赖英伟达的芯片。这也解释了为何作为国产算力概念股的寒武纪,在经历了超过9个月的横盘期后,才开始冲击万亿市值。
另一方面,随着Mythos 5等前沿模型的“出口管制”变相实施,越来越多的中国企业如美团和华为开始推出开源模型,为全球“主权AI”用户提供了更多选择。
中国企业在开源领域崭露头角
公开数据显示,开源大模型的生态系统正以惊人的速度增长。
根据美国独立研究机构Interconnects AI发布的ATOM报告,从2025年3月到2026年3月,全球开源模型的总下载量从3.39亿激增至20.4亿,同比增长达到6倍。在2024年11月至2026年1月期间,中国、美国和欧洲的开源模型使用量占比分别为72.7%、10.4%和16.8%。
与去年同期相比,中国开源模型的下载量增长了11.9倍,美国为4.1倍,欧洲为2.5倍,增长速度差异显著。
在中国开源模型中,阿里巴巴的Qwen系列占据了重要地位,并在近期持续占据榜首。2025年9月,阿里Qwen的下载量首次超越了Meta的Llama模型。截至2026年3月,Qwen的总下载次数已达9.42亿,接近Llama的两倍。
比尔·盖茨在2025年3月于纽约经济俱乐部的一次讲座中提到,“全球排名前八的模型中,有三种来自中国。”事实上,在全球最大的AI开源社区Hugging Face的排行榜上,前十名的开源大模型绝大多数都来自中国。
Meta前首席AI科学家、图灵奖得主Yann LeCun也一直高度评价中国开源模型,他认为“目前最好的开源模型来自中国,整个研究社区都在依赖它们。”
中国开源模型之所以能够领先,得益于人才储备、效率优势以及国内开源的普及。
清华大学智能产业研究院(AIR)创始院长张亚勤在2026年达沃斯论坛上表示,中国AI人才的培养规模大约是美国的五倍。此外,DeepSeek等模型通过算力和电力成本的极致优化,不断提升着开源模型的全球竞争力。
中国开源大模型取得突破性进展的标志性事件是DeepSeek R1的发布。
2025年1月20日,DeepSeek发布了其开源模型R1。一周后,英伟达的股价大幅下跌约17%,市值蒸发了5900亿美元。这被当时的市场解读为“对巨资构建AI大语言模型的合理性和前景产生质疑”。
正如AI领域的泰斗级人物吴恩达所判断的那样,当时美国遏制中国AI发展的举措,反而促使中国走上了一条效率极高的“第二增长曲线”。根据DeepSeek的技术报告显示,DeepSeek V3模型仅使用了由2048块H800组成的集群进行训练。
前HuggingFace亚太生态负责人王铁震提到,目前DeepSeek的强化学习训练算法正在直接提升美国实验室的产出效率。“许多中国开源模型的权重都运行在美国的硬件上。”中国的开源模型也正在加速美国闭源模型的进化。
相比之下,闭源模型的控制权掌握在单一厂商手中,并且更容易受到监管的限制。
此前,Fable 5和Mythos 5曾出现“全球下线”的情况。在经过一系列封号和漏洞修复后,这些模型重新上线,但重新开放后的Fable 5系列,非美国公民已无法使用。
《经济学人》评论称:“美国政府对顶尖模型越来越多的限制,将把更多用户推向中国AI模型的怀抱。”
阿里巴巴集团主席蔡崇信观察到,欧洲的高管和科学家最关心的是“主权”问题。他们担心技术被“一键关闭”,也担心一旦数据交出去就无法收回。“开源正好解决了这两个问题。模型可以下载到自己的数据中心,与原始制造商就没有关系了,数据也能留在自己的防火墙内。”
目前,开源已成为大模型的“集体信仰”,国内主要模型几乎全部实现了开源,包括DeepSeek、Qwen、Kimi、混元、小米MiMo等。
与此同时,中国大模型的迭代速度也在不断加快。模型的更新周期已从过去的“半年一代”缩短至“一月数款”。有网友在X平台上向马斯克提问,预测中国大模型何时能达到Anthropic的Fable水平。马斯克预测是在2027年第一季度。
随后,智谱AI创始人唐杰回复马斯克表示:“用不了那么久。”
从“追赶者”转变为“领跑者”,中国开源模型仅用了一年的时间。然而,在快速前进的同时,中国大模型还需要克服算力自主的另一道挑战。
重新评估国产算力
在过去很长一段时间里,模型训练都依赖英伟达的GPU。然而,随着美国出口管制措施的不断收紧,Hopper系列和Blackwell系列之后的多款先进芯片已被禁止出口到中国。
2025年,黄仁勋多次表示,中国市场的销量将为零。在刚刚结束的英伟达2026财年股东大会上,黄仁勋透露,2026财年英伟达来自中国的营收占比已降至约9%。
《金融时报》援引一位交易员的消息称,受出口管制影响,英伟达的非合规产品价格普遍暴涨。例如,RTX 6000 Pro等算力相对较低的产品,价格已从年初的约5万元人民币上涨至最高13万元人民币,涨幅高达160%。
一道道出口禁令迫使大量算力需求转向国内,为“寒武纪们”创造了最佳的市场机遇。6月30日,寒武纪市值盘中突破10000亿,这充分证明了国产算力正在被重新估值。
我们在文章开头提到,越来越多的国产模型在推理层面开始引入国产算力。
4月底发布的DeepSeek V4,其技术报告首次将昇腾NPU与英伟达GPU并列进行验证,这是DeepSeek尝试将推理路径从单一硬件依赖中解耦出来。与此同时,在完成超过500亿的融资后,DeepSeek也开始推动数据中心的建设,这相当于为国产算力增加了新的增长空间。
梁文锋(DeepSeek创始人)的投入,为国产算力带来了巨大的机遇。
6月17日,智谱发布并开源了其新一代旗舰大模型GLM-5.2。昇腾、平头哥、摩尔线程等国产算力平台当天就完成了“Day 0”级别的推理适配,在国产芯片集群上实现了高吞吐、低延迟、大并发的稳定运行。
越来越多的中国模型开始释放算力需求,但国产算力的供应也面临挑战。
华为昇腾的一位内部专家在一次沟通会上表示:“一卡难求,包括我自己,我们虽然生产卡,但是我想用卡也很难。”
2025年初,由于市场上仍能抢购到英伟达和AMD等提供的合规产品,业内对国产卡的态度几乎集中在“好不好用”的问题上。然而,在过去一年多海外算力供应中断的真空期,中国大模型面临的则是“不得不使用”的问题。
如果说DeepSeek在推理层面迈出了与国产算力匹配的关键一步,那么美团通过其1.6万亿参数的Long-Cat 2.0,则为国产算力训练打开了想象空间。
中国算力与中国模型的融合,已经走了很长一段路,这就像《荷马史诗》中那场持续十年的“奥德赛时期”——漫长而充满不确定性。
精彩评论
沉浸于赛事的魅力,MK体育为您精心策划海量精彩瞬间集锦,让您随时重温那些令人血脉偾张的进球、绝杀和经典时刻。每一次回放,都是一次激情重燃。
资深球迷B
2026年5月15日
作为一家自2012年成立的体育传媒公司,MK体育传媒有限公司始终坚持提供最权威、最全面的赛事资讯。我们相信,精准的信息和专业的分析是热爱体育的您不可或缺的伴侣。
体育评论员
2026年5月15日

聚焦全球顶级赛事,MK体育为您带来最即时的比分动态,让您仿佛置身赛场。我们的专业团队深入剖析每场比赛,提供独到见解,助您更精准地把握比赛脉搏。
资深球迷A
2026年5月15日