Google DeepMind 在轻量级模型 Gemini 3.5 Flash 中加入了直接操作计算机界面的能力,标志着多模态智能体技术正加速向低成本、高并发场景普及。
Google DeepMind 在轻量级模型 Gemini 3.5 Flash 中加入了直接操作计算机界面的能力,标志着多模态智能体技术正加速向低成本、高并发场景普及。
据 OpenAI 内部透露,GPT-5.6 将采取“有限预览”模式发布,且需经联邦政府逐一审批客户访问权限。传闻该模型上下文窗口将从 100 万 token 扩展至约 150 万,显示出其在长文本处理上的重大升级及合规层面的严格管控。
字节跳动在火山引擎大会上发布 Seedance 2.5(支持 30 秒视频直出)和豆包 2.1 Pro(对标 Opus 4.6),显著提升了其在视频生成和大模型推理领域的竞争力。
LangChain 与 Fireworks AI 联合研究显示,微调后的阿里 Qwen 模型在作为 Trace Judge 时性能超越通用模型,且大规模运行成本可降低 10-100 倍,为高效错误检测提供新方案。
Google 产品经理澄清 Gemma 4 专为本地设备端智能优化,旨在各硬件类别中实现最佳性能,不与 GLM 等服务器端前沿模型直接竞争。
介绍iLLaDA,一个从头训练的8B参数掩码扩散语言模型,采用全双向注意力机制,挑战了主流自回归模型的训练范式。
某 3D 生成公司实现 4 秒生成百万面模型及 12K 高清贴图,被比作 3D 领域的 Anthropic,标志着 3D 内容生成在速度与精度上取得重大进展。