OpenAI 与 Broadcom 合作推出首款定制推理芯片 Jalapeno,旨在优化 AI 模型推理效率并降低运营成本,标志着大模型公司深入硬件层的战略转变。
字节跳动在火山引擎大会上发布Seedance 2.5(支持30秒视频直出)和豆包2.1 Pro(对标Opus 4.6)。这标志着字节在视频生成和复杂推理领域进一步缩小与国际顶尖水平的差距。
Google 在 Gemini 3.5 Flash 中引入 Computer Use 功能,使模型能够直接操作计算机界面。作为轻量级模型,这一更新显著降低了企业部署自主操作代理的成本门槛,推动了 AI 从‘对话’向‘行动’的转变。
智谱开源旗舰模型 GLM-5.2 获得 Hugging Face 全球免费算力支持,马斯克预测其性能将在明年一季度追平 Claude Fable,但智谱方面回应称进展将更快。该事件显示中国开源大模型在国际社区的影响力提升,以及中美 AI 模型性能竞争的白热化。
由前 Anthropic 研究人员创立的 Mirendil 完成 2 亿美元种子轮融资,估值达 10 亿美元,旨在为开源开发者构建具备自我改进能力的 AI 系统,试图打造能替代 AI 工程师工作的自动化智能体。
研究人员发布了 iLLaDA,这是一个从头训练的 80 亿参数掩码扩散语言模型,采用全双向注意力机制并在预训练和微调中保持扩散目标,为自回归主流范式提供了新的技术路径。
某 3D 生成公司(被称为 3D 领域的 Anthropic)实现技术突破,能在 4 秒内生成高精度、高纹理的 3D 模型,显著降低内容创作门槛。
商汤科技宣布进军智能体(Agent)领域,并预告即将发布全新的全模态基座模型。这表明国内头部AI厂商正从单纯的大模型竞争转向更具应用价值的智能体生态布局。
由林达华牵头的商汤多模态模型U1Pro进入研发后期,计划7月启动内测,直接对标OpenAI最新产品。此举旨在提升商汤在多模态理解与生成领域的国际竞争力。