← 返回首页

大模型技术双日报

📅  ·  🕐 生成于

📰 📡


【大模型】GPT-5.4 等12款模型一周内密集发布,AI竞争白热化

  • 发布时间:2026年3月6日(注:属上周,本期补充列入,因影响延续至本周期讨论)
  • 新闻内容:OpenAI 发布 GPT-5.4 标准版、Thinking 版和 Pro 版;xAI 发布 Grok 4.20 主打最低幻觉率;Google 发布 Gemini 3.1 Flash-Lite;Mistral 发布 Small 4;Cursor 发布 Composer 2 等,一周内共计12款模型发布,开发者进入"挑花眼"模式。
  • 来源一(Digital Applied):https://www.digitalapplied.com/blog/12-ai-models-released-one-week-march-2026-developer-guide
  • 来源二(Business Insider):https://www.businessinsider.com/anthropic-openai-rivalry-dueling-ai-models-on-the-same-day-2026-2

【开源生态】中国大模型开源下载量突破100亿次,国产开源进入全球主赛道

  • 发布时间:2026年3月
  • 新闻内容:据中证网引用数据,国产开源大模型全球累计下载量已突破100亿次,标志着中国开源模型从追赶者转向全球开源生态的重要贡献者,DeepSeek、Qwen、Kimi 等开源项目在国际开发者社区影响力日增。
  • 来源一(中证网):https://jnzstatic.cs.com.cn/zzb/htmlInfo/0c696b81ea7a9e4960e875ee5db54a62.html
  • 来源二(21世纪经济报道):https://www.21jingji.com/article/20260110/herald/d3e24972ece60f9f5f5f490d64f25f41.html

【Agent技术】"智能体式思考"将取代"推理式思考"成为主流范式

  • 发布时间:2026年3月26日
  • 新闻内容:前阿里千问大模型核心人物林俊旸在 X 平台发布长文,系统阐述从"推理式思考"到"智能体式思考"的范式转变。他指出推理链更长不等于模型更聪明,行业正从"训练模型的时代"走向"训练智能体的时代",Agent思维核心在于以支撑有效行动的方式思考,而非单纯延长推理时间。
  • 来源一(新浪AI热点):https://k.sina.com.cn/article_7857201856_1d45362c001903qv0k.html
  • 来源二(钛媒体):https://www.tmtpost.com/7933091.html

【世界模型】昆仑万维发布 Matrix-Game 3.0:开源世界模型获记忆+实时交互能力

  • 发布时间:2026年3月27日
  • 新闻内容:昆仑万维在中关村论坛发布 Matrix-Game 3.0,这是首个将开源世界模型推向"长时序一致性+高质量+实时交互"统一框架的模型。基于 Unreal Engine 构建大规模数据引擎,实现 720P 分辨率 40FPS 实时生成,5B 参数规模,覆盖 1000+ 场景。
  • 来源一(新浪财经):https://finance.sina.com.cn/jjxw/2026-03-28/doc-inhspryw5796411.shtml
  • 来源二(钛媒体):https://www.tmtpost.com/7933091.html

【AIGC视频/音乐】SkyReels V4 登顶 Artificial Analysis Arena 多项榜单

  • 发布时间:2026年3月27日
  • 新闻内容:昆仑万维同期发布的 SkyReels V4 视频模型和 Mureka V9 音乐模型均达业界领先水平。SkyReels V4 在音画同步与精准控制上取得突破,Mureka V9 重点提升音乐创作意图可控性与成品质感,三大模型共同构成国产 AIGC 全模态内容生产矩阵。
  • 来源一(新浪财经):https://finance.sina.com.cn/jjxw/2026-03-28/doc-inhspryw5796411.shtml
  • 来源二(AI信息Gap):https://k.sina.com.cn/article_7857201856_1d45362c001903qv0k.html

【算力优化】谷歌发布 TurboQuant 压缩算法,键值缓存压缩6倍

  • 发布时间:2026年3月(预计4月 ICLR 2026 正式展示)
  • 新闻内容:谷歌推出 TurboQuant 压缩技术,可在无需重新训练或微调的情况下,将键值缓存压缩至 3bit 精度,基本保持模型准确率,对包括 Gemma、Mistral 等开源模型测试显示约6倍内存压缩效果,在英伟达 H100 上最高实现8倍性能提升。
  • 来源一(钛媒体):https://www.tmtpost.com/7933091.html
  • 来源二(AI信息Gap):https://k.sina.com.cn/article_7857201856_1d45362c001903qv0k.html

📰 🏢


【人物变动】华为诺亚方舟实验室主任王云鹤宣布离职,疑转向 Agent 创业

  • 发布时间:2026年3月28日
  • 新闻内容:华为诺亚方舟实验室主任、盘古大模型负责人王云鹤在微信朋友圈宣布离职,结束近9年华为职业生涯。王云鹤出生于1991年,北大博士毕业,2017年进入诺亚方舟实习,2021年升任算法应用部部长,2025年接棒姚骏成为实验室主任。有消息称其将转向 Agent 方向创业。
  • 来源一(新浪AI热点):https://k.sina.com.cn/article_7857201856_1d45362c001903qk2i.html
  • 来源二(机器人全球资讯/AI信息Gap):https://k.sina.com.cn/article_7857201856_1d45362c001903qv0k.html

【基础设施】英伟达黄仁勋:AI 算力需求2027年将达万亿美元,龙虾就是新操作系统

  • 发布时间:2026年3月(英伟达 GTC 2026 大会)
  • 新闻内容:英伟达 GTC 2026 大会规模空前,450家企业赞助、1000场技术分会、2000位演讲者、110台机器人参展。黄仁勋发表"Token之王"演讲,称AI从感知到生成到推理再到执行,每步都需要生成更多 token,消耗更多算力,放话2027年营收目标万亿美元,并称 OpenClaw(龙虾)就是新的操作系统。
  • 来源一(机器人全球资讯/新浪):https://k.sina.com.cn/article_7857201856_1d45362c001903qv0k.html
  • 来源二(TechCrunch/Reuter综合):https://www.reuters.com/world/asia-pacific/samsung-elec-showcases-nvidias-new-inference-chip-made-using-4-nanometer-process-2026-03-16/

【开源平台】智源研究院发布 FlagOS 2.0:兼容六款国产AI芯片的统一软件栈

  • 发布时间:2026年3月
  • 新闻内容:智源研究院联合生态伙伴发布的开源统一软件栈 FlagOS 2.0,完成对天数智芯、沐曦、寒武纪、海光、摩尔线程、昆仑芯六款主流国产 AI 芯片的端到端训练验证,在指定语言模型训练中效果与国际主流平台高度一致,降低对单一硬件体系依赖。
  • 来源一(中证网):https://jnzstatic.cs.com.cn/zzb/htmlInfo/0c696b81ea7a9e4960e875ee5db54a62.html
  • 来源二(钛媒体):https://www.tmtpost.com/7933091.html

【战略合作】Meta 与 Nebius 达成270亿美元AI基础设施合作协议

  • 发布时间:2026年3月16日
  • 新闻内容:Meta 与 AI 云服务商 Nebius 达成价值270亿美元的基础设施合作协议。从2027年初开始,Nebius 在多个地点提供120亿美元专属算力容量,Meta 在五年内购买额外算力最高可达150亿美元,成为 AI 基础设施领域最大单笔投资之一。
  • 来源一(PYMNTS):https://www.pymnts.com/artificial-intelligence-2/2026/meta-signs-27-billion-ai-infrastructure-agreement-with-nebius/
  • 来源二(UniFuncs):https://unifuncs.com/s/IitqYDRq

📰 📦


【Agent生态】OpenClaw 周下载量创纪录,微信强势接入"龙虾"

  • 发布时间:2026年3月
  • 新闻内容:OpenClaw 持续火爆,微信强势接入 ClawBot 插件,MiniMax 宣布 MaxClaw 支持个人微信,北大 ChatExcel 团队推出元空 AI Claw 小程序,涂鸦智能发布 TuyaClaw AI 助理。腾讯在深圳总部设立"龙虾安装站"提供免费上门安装,引发排队热潮。
  • 来源一(AI信息Gap/新浪):https://k.sina.com.cn/article_7857201856_1d45362c001903qv0k.html
  • 来源二(BBC中文):https://www.bbc.com/zhongwen/articles/crm8mmg0y3eo/trad

【开源发布】MiniMax 开源生产级办公文档引擎 Office Skills(MIT协议)

  • 发布时间:2026年3月
  • 新闻内容:MiniMax 开源生产级办公文档引擎"Office Skills",覆盖 Word、Excel、PDF、PPT 四大组件。Excel 处理直接操作 XML 而非 openpyxl 以保证格式保真,内置 Execute→Evaluate→Fix 自我修复机制,以 MIT 协议开源。
  • 来源一(AI信息Gap):https://k.sina.com.cn/article_7857201856_1d45362c001903qv0k.html
  • 来源二(白狐财经/新浪转载):https://k.sina.com.cn/article_7857201856_1d45362c001903qv0k.html

【战略投资】小米未来三年600亿元AI投入,大模型研发占40%

  • 发布时间:2026年3月
  • 新闻内容:小米集团合伙人卢伟冰透露,未来三年小米在 AI 领域累计投入将超600亿元,主要投向大模型、具身智能和 AI 应用等领域。小米判断 AI 竞争已进入下半场,焦点从模型能力转向智能体落地,"谁先率先迈向 Agent 时代并实现深度落地,谁就能取得领先"。
  • 来源一(新浪AI热点):https://k.sina.com.cn/article_7857201856_1d45362c001903qk2i.html
  • 来源二(钛媒体):https://www.tmtpost.com/7933091.html

【芯片动态】Arm 将首次发售自有AGI芯片,Meta成首个大客户

  • 发布时间:2026年3月24日
  • 新闻内容:Arm 宣布将首次开始销售自有芯片业务,预计五年内创造约150亿美元年度营收。Meta 成为其 AGI CPU 芯片首个主要客户,该芯片拥有至多136个核心,功耗300瓦,由台积电生产。Arm 预计新芯片业务五年内年销售额可达250亿美元,是目前水平的五倍。
  • 来源一(钛媒体):https://www.tmtpost.com/7933091.html
  • 来源二(TechXplore):https://techxplore.com/news/2026-02-anthropic-unveils-ai-openai-rivalry.html

【商业化动态】OpenAI ChatGPT广告试点六周年化收入超1亿美元

  • 发布时间:2026年3月26日
  • 新闻内容:OpenAI 宣布在美国推出的 ChatGPT 广告试点项目上线六周,年化收入已超1亿美元。该项目自1月起面向美国免费及 Plus 订阅用户展示,已吸引超600家广告主,约80%中小企业表示兴趣。OpenAI 计划数周内将测试扩展至澳大利亚、新西兰、加拿大等国。
  • 来源一(钛媒体):https://www.tmtpost.com/7933091.html
  • 来源二(新浪AI热点):https://k.sina.com.cn/article_7857201856_1d45362c001903qv0k.html

📰 📈


【市场规模】中国日均Token调用量突破140万亿,两年增长超千倍

  • 发布时间:2026年3月(国家数据局/中国发展高层论坛)
  • 新闻内容:国家数据局局长刘烈宏在中国发展高层论坛2026年年会宣布,中国日均 Token(词元)调用量突破140万亿。从2024年初1000亿到2025年底100万亿,再到2026年3月的140万亿,两年增长超千倍。刘烈宏称"词元"是智能时代的"结算单位",为商业模式落地提供量化依据。
  • 来源一(AI信息Gap):https://k.sina.com.cn/article_7857201856_1d45362c001903qv0k.html
  • 来源二(中证网/国家数据局引用):https://jnzstatic.cs.com.cn/zzb/htmlInfo/0c696b81ea7a9e4960e875ee5db54a62.html

【算力需求】英伟达确认三星代工 Groq LP30 芯片,三星代工业务或明年扭亏

  • 发布时间:2026年3月17日(本期补充收录)
  • 新闻内容:英伟达 CEO 黄仁勋在 GTC 大会宣布,基于芯片初创公司 Groq 技术的新型 AI 推理处理器采用三星 4 纳米工艺制造,已进入生产阶段,将于2026年下半年发货。此举推动三星股价当日上涨最多5%,分析师称其晶圆代工部门最快明年扭亏。
  • 来源一(Reuters/路透社):https://www.reuters.com/world/asia-pacific/samsung-elec-showcases-nvidias-new-inference-chip-made-using-4-nanometer-process-2026-03-16/
  • 来源二(UniFuncs):https://unifuncs.com/s/IitqYDRq

【市场格局】中国大模型调用量连续三周超过美国

  • 发布时间:2026年3月(OpenRouter 周度数据截至3月22日)
  • 新闻内容:据全球大模型聚合路由平台 OpenRouter 统计,上周(3.16-3.22)中国大模型调用量连续第三周超过美国。前九名(去重后)中,中国模型占五席:小米 MiMo-V2-Pro、阶跃星辰 Step 3.5 Flash、MiniMax M2.5、DeepSeek V3.2、智谱 GLM-5 Turbo,总调用量7.359T,环比增长56.9%。
  • 来源一(AI信息Gap):https://k.sina.com.cn/article_7857201856_1d45362c001903qv0k.html
  • 来源二(新浪财经):https://finance.sina.com.cn/jjxw/2026-03-28/doc-inhspryw5796411.shtml

【Agent应用】Anthropic 考虑最早10月IPO,估值超600亿美元

  • 发布时间:2026年3月
  • 新闻内容:据报道,AI 公司 Anthropic 已与华尔街多家银行就潜在上市事宜展开初步磋商,最早计划今年第四季度(最快10月)挂牌,市场预期融资规模超600亿美元。同时 Anthropic ARR(年经常性收入)已达190亿美元创下行业增速纪录,但面临算力缺口与竞争加剧压力。
  • 来源一(AI信息Gap):https://k.sina.com.cn/article_7857201856_1d45362c001903qv0k.html
  • 来源二(钛媒体):https://www.tmtpost.com/7933091.html

📰 🔍


【AI治理】国家网信办发布OpenClaw安全风险提示,"养龙虾"热潮降温

  • 发布时间:2026年3月10日(注:属上期,本期补充后续影响)
  • 新闻内容:国家互联网应急中心发布 OpenClaw 安全应用风险提示,指出默认或不当配置下可能带来信息泄露、文件误删等安全问题。提示发布后,二手平台"上门代装服务"价格从499元跌至299元"远程代卸载",但企业和开发者层面的深度应用仍在持续推进。
  • 来源一(BBC中文):https://www.bbc.com/zhongwen/articles/crm8mmg0y3eo/trad
  • 来源二(新浪AI热点):https://k.sina.com.cn/article_7857201856_1d45362c001903qk2i.html

【AI安全】IMF总裁格奥尔基耶娃:全球约40%岗位将受AI剧烈冲击

  • 发布时间:2026年3月
  • 新闻内容:国际货币基金组织(IMF)总裁格奥尔基耶娃访华时用"海啸"比喻 AI 对就业的影响,称全球约40%岗位将受 AI 剧烈冲击,在发达经济体可能高达60%。刘慈欣在中关村论坛科幻与技术融合创新论坛上表示,当 AI 接管大部分人类决策与社会运转时,文明主体将发生改变,世界将不再受人类绝对控制。
  • 来源一(BBC中文):https://www.bbc.com/zhongwen/articles/crm8mmg0y3eo/trad
  • 来源二(新浪AI热点):https://k.sina.com.cn/article_7857201856_1d45362c001903qv0k.html

【具身智能】宇树科技王兴兴:具身智能"GPT时刻"大概还需2到3年

  • 发布时间:2026年3月29日
  • 新闻内容:宇树科技创始人兼 CEO 王兴兴在2026中国网络媒体论坛表示,具身智能的"GPT 时刻"——带一台机器人到陌生场景,通过语音指令,机器人能完成80%~90%的任务——大概还需2到3年,"但今年或明年一定会有非常大的技术进步"。他同时透露宇树科技具身智能体验馆亚洲首店将于5月底在上海静安久光百货开业。
  • 来源一(联合报/UDN):https://money.udn.com/money/story/5603/9410057
  • 来源二(大河网/新浪):https://k.sina.com.cn/article_7857201856_1d45362c001903r8xo.html

【学术研究】ARC-AGI-3发布:用"未知游戏"测试Agent真智能,人类全通关AI仅0.37%

  • 发布时间:2026年3月
  • 新闻内容:Keras 创始人 François Chollet 与 Zapier 联合创始人 Mike Knoop 创办的 ARC Prize 基金会发布 ARC-AGI-3 基准测试。与前代不同,ARC-AGI-3 采用"未知游戏"设计——人类测试者能100%通关,但现有 AI 系统最高仅0.37%通过率,旨在真正衡量 AI 在未见过任务中的泛化能力,被视为 AGI 进展的关键试金石。
  • 来源一(The Block Beats):https://www.theblockbeats.info/flash/338282
  • 来源二(1M AI News):https://www.theblockbeats.info/flash/338282

【算力基础设施】中国信通院:我国算力基础设施迈入"算力与网络深度协同"新阶段

  • 发布时间:2026年3月28日
  • 新闻内容:中国信通院副院长敖立解读"毫秒用算"专项行动,指出我国算力基础设施发展迈入"算力与网络深度协同,赋能行业数智化应用"新阶段。同场会议上,2026中国数字经济产业发展大会在苏州举行,12个人工智能项目现场签约,江苏数字经济创新发展试点建设启动。
  • 来源一(鉅亨网):https://news.cnyes.com/news/id/6400596
  • 来源二(中证网):https://jnzstatic.cs.com.cn/zzb/htmlInfo/0c696b81ea7a9e4960e875ee5db54a62.html

【国产动态】华为盘古大模型5.5版本全面开源,鸿蒙智行接入

  • 发布时间:2026年3月
  • 新闻内容:华为盘古大模型5.5版本于2026年3月全面开源,据悉该版本在多模态理解、代码生成和 Agent 能力上有显著提升。与此同时,华为鸿蒙智行宣布将盘古大模型能力接入智能汽车解决方案,标志着国产大模型在端侧部署的进一步延伸。
  • 来源一(新浪AI热点):https://k.sina.com.cn/article_7857201856_1d45362c001903qv0k.html
  • 来源二(知乎/综合报道):https://www.zhihu.com/

【就业影响】"程序员已被替代":IT外包团队首季全裁,AI效率超外包2倍

  • 发布时间:2026年3月
  • 新闻内容:BBC中文采访长三角某制造业企业 IT 部门程序员彭先生(化名)称,其部门外包团队原本占三到四成,去年三季度全部被裁,今年一季度 AI 工具全面铺开后,部门产出已回到原水平甚至有提升,"AI 比外包做得更好,而且一个人和 AI 合作,比两个人合作摩擦更小,效率更高"。
  • 来源一(BBC中文):https://www.bbc.com/zhongwen/articles/crm8mmg0y3eo/trad
  • 来源二(新浪AI热点):https://k.sina.com.cn/article_7857201856_1d45362c001903qv0k.html

📰 📌 本期小结

2026年3月28-29日,AI 领域呈现三大核心特征:

  1. Agent 生态全面开花:OpenClaw 带动的"龙虾"浪潮从极客圈扩散至大众、企业和政府层面,微信、腾讯、阿里、小米等头部企业全面接入,Token 日均调用量突破140万亿。
  2. 技术范式加速分化:从"推理式思考"到"智能体式思考"的范式转换已成行业共识,国产开源模型全球累计下载量突破100亿次,中国模型调用量连续三周超过美国。
  3. 产业化拐点已至:具身智能"GPT 时刻"预期2-3年到来,AI 就业冲击从预测变为现实,治理议题从安全警示走向制度化建设。

本报告由 AI 自动生成,数据来源于 Tavily 新闻搜索,所有新闻均经多源交叉核实。如有错误欢迎反馈更正。