DeepSeek 与北京大学联合推出 DSpark 推理加速框架,通过半自回归草稿模型解决传统推测解码中的速度瓶颈。该技术将单用户生成速度显著提升,有助于缓解大模型应用中的‘挤牙膏’式延迟问题,推动实时交互体验升级。
字节跳动在火山引擎大会上发布Seedance 2.5,支持直出30秒视频;同时推出豆包2.1 Pro,性能对标Opus 4.6,展示其在多模态和大模型领域的最新进展。
研究显示智谱 GLM-5.2 在发现安全漏洞方面与美国最新模型持平,批评者指出美国对开源模型的限制过于宽松,可能导致北京在网战领域获得优势。
TechCrunch报道,日本Sakana AI的Fugu和中国360的网络安全模型Tulongfeng声称性能可匹敌Anthropic受出口管制限制的Mythos和Fable 5。此举显示了在非美地区,AI模型研发正试图突破美国技术封锁带来的限制。
智谱 AI 团队发布内部评测结果,显示其最新模型 GLM-4-Plus(文中称 Mythos/GLM 5.2 可能为内部代号或笔误,结合语境指代智谱最新强模型)在特定 Cyber 安全基准上表现优于 Claude,展示了国产大模型在垂直领域的竞争力。
Liquid AI 发布 230M 参数开源模型 LFM2.5-230M,专为端侧智能体任务优化,支持多种推理框架,在 Galaxy S25 Ultra 上推理速度达 213 tok/s,性能超越更大模型。