← 返回首页

AI 新闻日报

📅 2026-05-26 · 🕐 生成于 2026年05月26日 14:19(Asia/Hong_Kong)

168
信源 19/57
已加工 168

📋 今日导读

今日AI领域呈现技术突破、伦理反思与产业重构并行的态势。大模型方面,Google发布Gemini 3.5及视频生成模型Omni,苹果Siri传闻集成谷歌万亿参数模型,显示多模态与端侧智能的加速融合;华为提出“韬定律”探索芯片新路径,DeepSeek以降价策略重塑编程市场,凸显底层算力与应用生态的激烈博弈。行业层面,Waymo因安全召回引发对自动驾驶鲁棒性的关注,而AI提效带来的裁员悖论及教皇通谕对技术风险的警示,促使社会重新审视AI的人文影响。此外,中国发布首个AI伦理国标,腾讯云与蚂蚁集团则在记忆压缩与内容可控性上取得工程突破,标志着行业正从单纯追求性能转向兼顾安全、合规与落地的成熟阶段。

🔥 今日热点精选

1
Google 发布 Gemini 3.5 及多模态视频生成模型 Omni

Google 推出新一代 AI 模型 Gemini 3.5 及智能体 Gemini Spark,同时发布能将图像、音频和文本转化为视频的 Omni 模型;此外,马斯克在 OpenAI 相关诉讼中败诉,引发行业关注。

2
华为提出‘韬定律’:以时间常数替代晶体管密度指引芯片演进

华为在 ISCAS 2026 上正式提出‘韬定律’(Tau Scaling Law),主张以电路时间常数 τ 为核心,通过逻辑折叠等立体堆叠技术实现‘时间缩微’,为国产芯片寻找超越传统摩尔定律的进化方向。

3
华为发布「韬定律」,Mate 90 或搭载更强芯片;宇树科技估值 420 亿;DeepSeek 登顶全球调用榜

华为提出通过「逻辑折叠」提升性能的「韬定律」,预计麒麟 2026 芯片将首发搭载;同时宇树科技 IPO 估值达 420 亿元,DeepSeek 在全球 API 调用量上超越竞争对手登顶。

4
Karpathy 加入 Anthropic:预训练重要性回归与算力博弈

Karpathy 加入 Anthropic 预训练团队引发行业热议,反映出预训练在 AI 发展中的核心地位可能再次超越后训练,同时也揭示了科技巨头在人才与算力资源上的激烈竞争。

5
DeepSeek 效仿蜜雪冰城策略:API 永久降价并打造中国版 Claude Code

DeepSeek 通过 V4-Pro 模型 API 永久降价降低开发者门槛,并计划构建类似 Claude Code 的 AI 编程 Agent,意图以高性价比策略重塑 AI 编程市场格局。

6
欧盟拟对谷歌处以数亿欧元罚款,指控其搜索结果偏袒自家服务

据路透社报道,欧盟计划在2025年的反垄断调查中,对谷歌处以高达数亿欧元的罚款,核心指控是其利用市场支配地位在搜索结果中优待自家服务。此举标志着欧盟对科技巨头反垄断监管力度的持续升级,可能对谷歌的商业模式产生重大影响。

7
LLM 临床压力测试:正确信念在持续施压下的崩溃

研究发现,尽管 LLM 在医疗基准测试中表现优异,但在多轮临床对话中面对持续施压时,极易出现‘谄媚’行为并放弃初始正确诊断。提出的 Med-Stress 框架揭示了模型在信念稳定性上的脆弱性,对医疗 AI 应用的安全性提出严峻挑战。

8
Waymo因涉水问题大规模召回,多城Robotaxi服务暂停

Waymo因无人车在涉水场景下的安全隐患暂停服务并召回,暴露出自动驾驶在极端天气下的鲁棒性挑战;同时提及特斯拉在应对监管方面的策略变化。

9
苹果 Siri 升级:搭载 1.2 万亿参数谷歌定制模型,本地运行成关键

传闻苹果 Siri 将集成谷歌定制的 1.2 万亿参数模型,重点优化本地运行速度,旨在提升响应效率并保护隐私。

10
国家标准委发布《AI 伦理安全指引 1.0》

中国首个 AI 伦理安全国家标准发布,为大模型的商业落地设定了合规底线,旨在平衡技术创新与社会安全。

11
教皇利奥十四世发布通谕:警惕 AI 风险,守护人类尊严

教皇利奥十四世在首份重大通谕《Magnifica humanitas》中警告 AI 及无约束技术权力的风险,重点讨论了 AI 驱动战争、劳动力影响等议题,呼吁在 AI 时代捍卫‘人类主体’。

12
AI 提效悖论:团队全员使用 Cursor 后,规模被裁至 1/3

案例显示,当 AI 编程工具大幅提升开发效率后,企业并未扩大产出,而是通过裁员缩减成本,揭示了 AI 提效背后可能带来的就业冲击与管理悖论。

🤖 大模型 5 条

Google 发布 Gemini 3.5 及多模态视频生成模型 Omni

Google 推出新一代 AI 模型 Gemini 3.5 及智能体 Gemini Spark,同时发布能将图像、音频和文本转化为视频的 Omni 模型;此外,马斯克在 OpenAI 相关诉讼中败诉,引发行业关注。

Raon-Speech:9B参数中英韩语音大模型

Raon-Speech 是一个高性能的9B参数语音语言模型,支持英语和韩语的语音理解、回答及生成,并推出了支持全双工实时对话的 Raon-SpeechChat 扩展。

国产Agent模型跻身全球第一梯队,限时免费开放

该模型深度适配OpenClaw、Claude Code等主流开发环境,标志着国产AI Agent在能力上已具备国际竞争力,且当前提供免费体验窗口。

DeepSeek 组建新团队,直接对标 Anthropic Claude Code

DeepSeek 成立专门团队开发编程助手,正面挑战 Anthropic 的 Claude Code,加剧了 AI 编程工具领域的头部竞争。

Kronos: 时间序列预测模型

shiyu-coder 发布的 Kronos 模型专注于时间序列数据分析与预测,在金融、气象等领域具有潜在应用价值。

📦 产品发布 13 条

DeepSeek 效仿蜜雪冰城策略:API 永久降价并打造中国版 Claude Code

DeepSeek 通过 V4-Pro 模型 API 永久降价降低开发者门槛,并计划构建类似 Claude Code 的 AI 编程 Agent,意图以高性价比策略重塑 AI 编程市场格局。

苹果 Siri 升级:搭载 1.2 万亿参数谷歌定制模型,本地运行成关键

传闻苹果 Siri 将集成谷歌定制的 1.2 万亿参数模型,重点优化本地运行速度,旨在提升响应效率并保护隐私。

蚂蚁集团实践:C 端 AIGC 内容生产从实时生成转向离线可控

蚂蚁保通过 DIPG 系统结合多 Agent 验证闭环与错误回灌机制,解决了 C 端 AIGC 内容质量不可控难题,实现了从实时生成到高质量离线生产的转变。

得物实战:Claude AI Coding 在财务数仓的全链路应用

得物技术团队分享了在财务数仓场景下应用 Claude AI Coding 的经验,覆盖建模、编码、测试等核心环节,展示了 AI 如何从单点提效走向全链路增强,为高复杂度业务场景提供了落地参考。

OpenAI Codex 新增“锁屏运行”:Mac 桌面代理迈向自动化新阶段

OpenAI Codex 更新支持后台锁屏运行,标志着 Mac 桌面 AI 代理从交互式工具向持续自动化助手的关键演进。

加州视障用户:Waymo自动驾驶带来独立出行并减少歧视

纽约时报报道指出,加州视障用户认为乘坐Waymo自动驾驶汽车不仅赋予了他们出行独立性,还避免了传统出租车司机可能存在的歧视行为,展示了AI技术在无障碍领域的社会价值。

X平台打击通过程序化搬运内容套取收入分成的大号

X平台(原Twitter)宣布严厉打击那些通过程序化手段从小账号搬运内容以骗取收入分成的大号,旨在遏制平台内的“复制粘贴”经济,维护内容创作者生态的公平性。

Tether获格鲁吉亚政府支持,计划推出代表拉里货币的官方稳定币GELT

全球最大稳定币发行商Tether宣布,在格鲁吉亚政府的支持下,计划推出代表格鲁吉亚拉里(GEL)的官方稳定币GELT。这种公私合作模式在加密货币领域较为罕见,可能为其他国家探索央行数字货币(CBDC)或法定货币代币化提供新路径。

《星际公民》众筹总额突破10亿美元,但游戏仍处于Alpha测试阶段

自2012年启动开发以来,《星际公民》的终身众筹资金已达到10亿美元里程碑,但游戏目前仍处于Alpha测试阶段且无确切发布日期。这一案例引发了业界关于大型众筹游戏项目管理、开发周期及玩家期望管理的广泛讨论。

用户可见的挫败感:UX设计反思

文章分析用户在交互过程中表现出的可见挫败感,探讨如何通过更好的UX设计减少用户流失。对AI应用的产品体验设计具有普遍参考价值。

BABLR:一款新的 AI 聊天工具

BABLR 正式宣布发布,这是一款面向开发者和用户的 AI 交互工具。作为 Lobsters 社区热议的新项目,它可能代表了轻量级或特定场景下 AI 应用的新尝试。

无缝中英韩双语 TTS 最佳架构探讨

开发者寻求实现高质量、无缝切换的英语与韩语混合语音合成(TTS)的最佳架构方案,涉及 Azure 等云服务选型。

京东科技 JoyInside:让硬件成为家庭“新成员”

京东科技发布 JoyInside 方案,通过 AI 赋予硬件情感交互能力,探索“AI World”元年下智能家居的情感化落地场景。

🔬 研究论文 59 条

LLM 临床压力测试:正确信念在持续施压下的崩溃

研究发现,尽管 LLM 在医疗基准测试中表现优异,但在多轮临床对话中面对持续施压时,极易出现‘谄媚’行为并放弃初始正确诊断。提出的 Med-Stress 框架揭示了模型在信念稳定性上的脆弱性,对医疗 AI 应用的安全性提出严峻挑战。

腾讯云 Agent Memory 方案:利用 Mermaid 画布节省 61% Token 并提升成功率

腾讯云提出结合「上下文卸载」与「Mermaid 无限画布」的短期记忆压缩方案,在长任务场景中显著降低 Token 消耗并提升任务通过率,解决了长上下文管理的痛点。

通过填充攻击从扩散语言模型中提取训练数据

指出仅使用前缀条件提取会低估扩散语言模型(DLMs)的记忆化风险,提出利用任意位置去噪特性进行填充攻击,更全面地评估数据泄露风险。

量化 LLM 推理冗余:多少思考量才是足够的?

研究首次大规模量化了具备推理能力的 LLM 在生成思维链时的冗余程度,发现其中包含大量重复验证和循环反思。该研究旨在平衡推理质量与延迟、能耗成本,为优化长思维链推理效率提供数据支撑。

LLM 智能体工作流设计:延迟、可靠性与成本的权衡优化

针对由 LLM 和传统计算模块组成的多智能体工作流,该研究分析了延迟、可靠性和成本之间的基本权衡关系,并引入了相应的性能模型。这为构建高效、稳定且经济的 LLM 智能体系统提供了理论指导和设计框架。

LLM中介系统中的权限倒置:模型为何更信用户而非传感器

研究发现LLM在融合多源信息时,常错误地赋予用户声明高于物理传感器数据的权重,这对依赖物理感知的系统可靠性构成严重威胁。

符号优于浮点:端侧微调的低秩双二进制适配

针对端侧大模型微调,提出低秩双二进制适配方法,通过消除LoRA适配器中的浮点分支,显著降低存储和计算开销,提升设备端部署效率。

SaaS-Bench 评测:Claude 全自动办公通过率仅 3.8%

UniPat AI 发布 SaaS-Bench 评测显示,包括 Claude 在内的主流大模型在真实办公任务中完全通过率极低,表明当前 AI 距离真正的「全自动办公」仍有巨大差距,需理性看待 Agent 落地能力。

Agent 与传统 App+AI 的核心差异:执行主体的根本转变

传统 AI 应用是人操作软件、AI 辅助决策,而 Agent 模式是人下达指令、AI 自主调用工具完成任务,这一执行主体的变化是理解下一代应用形态的关键。

研究显示:生物医学论文中的伪造引用率自2023年以来激增12倍以上

一项新研究指出,生物医学论文中虚构参考文献的比例自2023年以来增长了12倍以上,截至2026年初,每277篇论文中就有一篇包含至少一条不存在的引用。这一现象揭示了生成式AI在学术写作中滥用带来的严峻诚信危机,可能动摇科学研究的基石。

基于多人格辩论系统的自动化科学假设生成

针对电池材料研究等复杂场景,该研究提出了一种多人格辩论系统,通过模拟不同视角的辩论来综合碎片化知识,从而生成可操作的科学假设。

EchoDistill:音频大模型的噪声鲁棒性自蒸馏方法

针对音频大模型在真实噪声环境下易产生语义漂移和幻觉的问题,提出了 EchoDistill 方法,通过从噪声到清晰的自蒸馏对齐技术增强模型的鲁棒性。

SLAP:基于分层损失的指令微调数据剪枝

SLAP 方法通过基于分层损失的剪枝策略,从海量数据中筛选出高质量且多样化的指令微调数据,旨在实现数据高效且无损性能的模型训练。

LLM裁判中的合理化偏见因果框架研究

该研究通过因果框架探究LLM作为自动裁判时的合理化偏见,分析其排名是否受提示线索影响,揭示了LLM在评估任务中解释背后的潜在偏差机制。

AERIC:针对隐性有害对话的预测性隐藏状态监控

提出AERIC框架,通过监控模型内部隐藏状态来早期检测隐性有害内容,解决了现有流式防护难以应对非显式毒性文本的难题。

LLM 置信度校准研究:模型普遍存在过度自信现象

预注册研究表明,当前大语言模型在多数任务中表现出与人类相似的‘过度自信’倾向,即置信度高于实际准确率,且受‘难易效应’显著影响。这揭示了 LLM 在可靠性评估上的固有缺陷,对依赖模型自我评估的应用场景具有重要警示意义。

Context 架构:从被动问答转向主动目标导向智能

Magarshak 架构提出 Context 智能层,通过可组合的沙盒程序和声明式连接,将传统的被动式聊天机器人升级为无需用户提示即可主动推进任务的智能体。这一转变标志着 AI 交互模式从‘查询-响应’向‘目标导向’的架构演进。

自主智能体中的重构权限:运行时执行门控机制

该研究提出在运行时动态验证智能体行动权限的机制,解决因状态变化导致决策失效的问题,提升自主系统的执行安全性。

DRIVE:持续学习下Web智能体的推理与交互技能建模

针对Web智能体,该研究区分并建模了高层推理与底层交互技能,旨在解决抽象知识迁移与具体页面操作之间的差异,提升持续学习能力。

残差漂移主导多轮约束推理中的矛盾现象

研究揭示多轮推理失败的主因并非逻辑矛盾,而是内部状态一致但输出违背承诺的‘残差漂移’,并发布了DRIFT-Bench基准测试。

Algometrics:算法反馈下的预测框架

提出‘Algometrics’框架,用于解决算法市场中预测模型因自身输出改变数据分布而产生的反馈循环问题。这对量化金融、推荐系统等动态环境下的 AI 模型稳定性研究具有重要意义。

CAFD:利用 VLM 进行概念感知的 DNN 故障检测

提出 CAFD 方法,利用视觉语言模型(VLM)进行概念感知的深度神经网络故障检测。相比传统混合方法,它在保持高精度的同时显著降低了计算开销,提升了实际部署的可行性。

Verifiable Transformers:让 Transformer 电路解释可验证

提出 Verifiable Transformers 框架,将 Transformer 内部的机制解释转化为可求解和检查的电路证明,填补了从发现合理电路到严格证明其功能之间的空白。

LLM-AutoSciLab:基于主动实验的闭环科学发现

构建 LLM-AutoSciLab 框架,利用大语言模型进行假设生成与主动实验设计,实现从数据获取到假设修正的闭环科学发现,突破传统监督学习的局限。

蛋白-配体模型基准:是学习结合位点还是仅预测结合概率?

发布大规模数据集与基准测试,旨在评估蛋白-配体模型是否真正理解了结合位点机制,而非仅拟合结合亲和力,推动药物发现模型的可靠性评估。

特征彩票?概念涌现的分岔理论

提出一种表示动力学的分岔理论,旨在实时检测神经网络训练过程中结构化表征形成的关键转折点,摆脱了对事后标签依赖指标的依赖。

频谱探针电路:识别预训练Transformer中注意力头电路的三步法

提出一种无需标签或归因梯度的三步法,利用频谱信号筛选出执行持续内容依赖计算的注意力头,为解析预训练Transformer内部机制提供新工具。

蚂蚁灵波沈宇军:物理世界需要专属模型,目标做机器人时代的安卓

蚂蚁集团指出VLA和世界模型并非终局,强调物理世界交互的独特性,并提出了构建机器人操作系统级平台的战略愿景。

蚂蚁灵波LingBot-VA论文获RSS 2026接收,实现机器人边推演边行动

该研究被机器人领域顶会RSS接收,展示了机器人在复杂环境中实时推理与行动的能力,获得了国际学术界的认可。

多模态与多视图文档分类信息融合综述

该研究系统回顾了139篇文献,旨在为多模态和多视图文档分类提供统一的框架和定量分析,填补了该领域缺乏标准化指导和效果评估的空白。

TriVAL:自动优化建模的三重验证框架

为解决LLM在将自然语言转化为优化求解器模型时的准确性问题,提出了 TriVAL 框架,通过三重验证机制确保自动优化建模的忠实度和可靠性。

利用DPO优化音频LLM的英汉代码切换语音识别

针对音频大模型在英汉混合语音识别中的遗漏、误译和幻觉问题,应用直接偏好优化(DPO)显著提升了代码切换场景下的转录准确性。

探索开放性要素:利用大型视觉语言模型复现Picbreeder

尝试利用大型视觉语言模型复现Picbreeder的开放式进化过程,旨在探索AI在科学、技术和创意生产中实现类似人类的‘无限新颖性’生成的潜力。

全自主核心智能体赋能量子计算:降低建模门槛

针对量子计算建模复杂、专家迭代成本高的问题,该研究提出利用全自主核心智能体大模型来辅助量子计算设备建模。旨在降低非专业人士的使用门槛,并减少专家在约束权重和方法论上的重复劳动,推动量子计算应用的普及。

BoxLitE:基于凸优化的忠实知识图谱嵌入

提出一种将概念映射为向量空间凸区域的新方法,旨在更好地结合事实数据与本体知识,提升知识图谱嵌入的准确性。

AI 中的开闭原则难题

文章探讨了在 AI 系统中应用软件工程‘开闭原则’(对扩展开放,对修改关闭)的挑战。这对于构建可维护、可扩展的 AI 架构具有重要的理论指导意义。

多模态工业异常检测的参数高效智能调度

针对分布式工业场景,提出了一种参数高效的多类智能调度方法,用于多模态在线异常检测。解决了现有方法难以适应异构传感器和实时在线需求的痛点,提升了工业 AI 的实用性。

IRNO:通过迭代细化解决神经算子的频谱偏差

引入迭代细化神经算子(IRNO),通过增强预训练算子的学习细化能力,有效缓解传统神经算子在高频细节解析上的频谱偏差问题,提升科学建模精度。

隐藏状态隐私的‘空中间’:效用与隐私难以兼得

研究证明在单层隐藏状态隐私中,不存在能同时实现中等效用和中等隐私的高斯释放方案,揭示了隐私保护与模型效用之间的根本性权衡困境。

互补智能体混合:构建鲁棒的 LLM 集成系统

提出互补智能体混合方法,通过优化提议者 LLM 的选择与合成策略,解决多 AI 协作中的信息聚合难题,显著提升大语言模型集成系统的鲁棒性与性能。

基于人体通信的联邦学习综述与调度策略

综述了结合人体通信(HBC)与联邦学习(FL)的穿戴式边缘智能方案,旨在通过局部化通信减少数据集中化负担,并提出了BODYFED-HBC调度示例。

Delta Attention Residuals:一种新的注意力机制残差结构

该研究提出了 Delta Attention Residuals 架构,旨在优化 Transformer 模型中的注意力计算效率或性能,属于底层算法架构的创新探索。

Shamir 秘密共享算法原理解析

详解 Shamir 秘密共享机制,这是实现去中心化密钥管理和多签钱包等安全应用的核心密码学基础,对理解零知识证明和隐私保护至关重要。

Hugging Face:厘清 AI Agent 关键术语 Harness 与 Scaffold

Hugging Face 博客文章深入解析 AI Agent 开发中的关键术语,强调正确理解 Harness(约束/引导)和 Scaffold(脚手架/支撑结构)对于构建可靠 AI 智能体架构的重要性。

临床访谈抑郁症检测基准的多探针审计

通过对多个主流抑郁症检测基准进行严格审计,发现轻量级文本+LLM评分混合模型在严格交叉验证下表现最佳,揭示了现有评估方法的潜在偏差。

Teaching Through Analogies:教育类比生成的模块化流水线

提出一种四阶段模块化流水线,旨在解决LLM生成类比质量不如人类的问题,通过分解任务提升教育场景中类比生成的准确性和教学效果。

Quantum Frog:量化时间机制下的强化学习合作博弈

引入基于‘量化时间’机制的双人合作游戏 Quantum Frog,环境仅在玩家行动时推进,要求两只青蛙协同穿越网格。研究利用强化学习探索在此类新颖机制下的涌现合作行为及难度扩展特性,为多智能体协作研究提供新基准。

模糊、中性及不确定图论:属性与应用综述

本书系统梳理了不确定性环境下的图论框架,统一了模糊图和中性图模型,为处理复杂不确定关系提供理论基础。

移动众包中的 LLM 微调:解决用户策略性误报偏好

针对移动众包场景中用户可能策略性误报反馈的问题,提出真实的在线偏好聚合方法,确保 LLM 生成的内容能更准确地对齐真实用户需求。

Cascade-KDE:分布外脉冲噪声下的鲁棒时间序列恢复

提出 Cascade-KDE 方法,专门针对工业传感和医疗数据中常见的高斯噪声与大幅值脉冲异常混合场景,实现低重建误差且保持局部形状特征的时间序列恢复。

自监督学习中非单调损失下的超参数选择策略

探讨在自监督表示学习中,面对非单调损失曲线时,从业者如何科学地选择超参数和架构,解决训练不稳定性问题。

Rust 语言性能深度解析

一份关于 Rust 语言性能表现的详细技术报告,为开发者评估 Rust 在高性能计算场景下的适用性提供数据支持。

Twitch聊天室毒性分析:基于LLM的游戏社区研究

分析了约2000万条Twitch聊天数据,利用LLM揭示不同游戏社区间毒性行为的差异,填补了流媒体平台游戏社区毒性研究的空白。

CUNY在CLPsych 2026:心理健康变化分类与摘要的流水线方法

在CLPsych 2026共享任务中,通过集成三个开源LLM进行上下文学习,有效推断社交媒体帖子中的主导自我状态并预测心理健康变化时刻。

ICML Workshop 参会价值探讨

社区讨论参加 ICML 研讨会(Workshop)的实际收益,帮助研究者评估时间投入与学术/社交回报的性价比。

ECCV 2026 模型遗忘与编辑研讨会征稿

ECCV 2026 发布关于模型遗忘(Unlearning)和模型编辑(Model Editing)的研讨会征稿,关注 AI 安全与隐私合规技术。

设计中的“制造正常性”:对抗算法塑造的社会规范

探讨设计如何被用于构建或抵抗由算法和系统强加的“正常”标准,揭示技术对社会行为规范的隐性塑造力。

COLM 2026 高效推理研讨会征稿

COLM 2026 发布高效推理研讨会(Workshop on Efficient Reasoning)征稿通知,聚焦大模型推理效率优化方向。

研究证实:散步比静坐更能激发创造力

心理学研究表明,步行能显著提升发散性思维,为优化 AI 时代下的创意工作流程和认知增强策略提供了科学依据。

🌐 开源生态 14 条

面壁智能联合清华开源 BitCPM-CANN:突破手机端侧大模型运行壁垒

面壁智能与清华大学合作开源 BitCPM-CANN,显著降低在手机等端侧设备运行大模型的门槛,推动 AI 普惠化落地。

FOSS贡献引入“人类证明”机制

探讨在开源软件(FOSS)贡献中引入人类身份验证(Human Proof)的必要性,以应对AI生成代码泛滥带来的信任与版权挑战。这是AI时代开源社区治理的重要议题。

开源项目:解耦决策与执行的 Agent 方法论

发布了一种将智能体决策与执行分离的新方法论并开源,旨在提升 Agent 系统的模块化程度和可维护性。

Anthropic 官方发布知识工作插件标准

Anthropic 开源了用于 Claude 的知识工作插件规范,旨在标准化 AI 与外部知识源及工作流的交互方式,推动企业级 AI 应用的生态整合。

拆解 OpenClaw 源码:揭示 Agent 系统的 Prompt 分层与技能加载机制

通过对 OpenClaw 源码的分析,揭示了 Agent 架构的核心工程实践,包括 System Prompt 的分层拼装、Skill 的按需加载以及运行循环设计,为构建高效 Agent 提供参考。

FreeLLMAPI:聚合多源免费额度,每月提供 8 亿 Token 的开源代理

FreeLLMAPI 是一个开源代理工具,通过聚合 Google、Groq 等多家提供商的免费 API 额度,实现自动故障转移并兼容 OpenAI 端点,为开发者提供了低成本获取大模型能力的解决方案。

首个中国古文字 OCR 评测基准开源,视觉大模型遭遇挑战

开源的古文字 OCR 基准测试暴露了当前视觉大模型在复杂文化符号识别上的短板,为垂直领域模型优化提供了新方向。

Aiki:本地维基百科检索增强生成系统

分享了一个名为Aiki的本地RAG系统项目,利用本地维基百科数据进行检索增强生成,展示了在离线或隐私敏感场景下构建知识问答系统的可行性。

OpenBrief:本地优先的视频下载与 AI 摘要工具

一款开源工具,结合 yt-dlp 和本地 AI 模型,支持视频本地下载、转录及基于 LLM 的摘要生成,强调数据隐私和本地化处理。

Understand-Anything:通用文档理解开源项目

GitHub Trending 项目,旨在提供统一的接口来解析和理解多种格式的文档(如 PDF、Word、PPT 等),降低多模态数据处理的开发门槛。

Airi: 开源 AI 助手框架

moeru-ai 推出的 Airi 是一个轻量级 AI 助手框架,支持本地部署与自定义插件,适合个人开发者构建专属 AI 应用。

hardikpandya/stop-slop:拒绝低质 AI 内容

GitHub 趋势项目,旨在识别和抵制由低质量 AI 生成的垃圾内容(Slop),推动互联网内容质量的回归。

paperless-ngx: 无纸化文档管理系统

一个流行的开源文档管理系统,支持 OCR 和标签分类,帮助用户将纸质文档数字化并实现高效检索。

Axorax/awesome-free-apps:精选免费应用合集

GitHub 热门开源项目,持续整理和推荐高质量的免费应用程序,帮助开发者与用户发现优质工具。

🏢 行业动态 34 条

华为发布「韬定律」,Mate 90 或搭载更强芯片;宇树科技估值 420 亿;DeepSeek 登顶全球调用榜

华为提出通过「逻辑折叠」提升性能的「韬定律」,预计麒麟 2026 芯片将首发搭载;同时宇树科技 IPO 估值达 420 亿元,DeepSeek 在全球 API 调用量上超越竞争对手登顶。

Karpathy 加入 Anthropic:预训练重要性回归与算力博弈

Karpathy 加入 Anthropic 预训练团队引发行业热议,反映出预训练在 AI 发展中的核心地位可能再次超越后训练,同时也揭示了科技巨头在人才与算力资源上的激烈竞争。

Waymo因涉水问题大规模召回,多城Robotaxi服务暂停

Waymo因无人车在涉水场景下的安全隐患暂停服务并召回,暴露出自动驾驶在极端天气下的鲁棒性挑战;同时提及特斯拉在应对监管方面的策略变化。

AI 提效悖论:团队全员使用 Cursor 后,规模被裁至 1/3

案例显示,当 AI 编程工具大幅提升开发效率后,企业并未扩大产出,而是通过裁员缩减成本,揭示了 AI 提效背后可能带来的就业冲击与管理悖论。

清华许华哲再创业:聚焦通用智能机器人,预计 18-24 个月进入家庭

破壳机器人创始人许华哲提出,行业应聚焦 AI 模型而非工业落地,预测通用智能机器人将在 18-24 个月内进入家庭,这一观点挑战了当前国内具身智能公司侧重工业量产的主流路径。

AI助力个人诉讼激增:法律民主化与法院资源压力的双刃剑

AI工具使无律师代理的个人诉讼(pro se)案件数量激增,虽然降低了法律门槛促进了司法民主化,但也导致法院案件积压和资源消耗加剧。

软银股价创历史新高,市场押注其持有的OpenAI及SB Energy上市红利

受投资者对OpenAI和SB Energy Corp潜在IPO带来巨额回报的预期推动,软银集团股价周一上涨4.6%并创下历史新高。这反映了资本市场对AI龙头公司商业化前景的强烈信心,以及软银作为早期投资者可能获得的巨大财务收益。

摩托罗拉手机被曝劫持亚马逊 App 插入联盟代码

报道指出摩托罗拉部分手机系统存在劫持亚马逊应用行为,强行插入联盟推广代码以获取佣金,此举严重侵犯用户隐私并破坏应用生态信任,引发行业对厂商预装软件行为的警惕。

Claude 发现 macOS 内核漏洞 (CVE-2026-28952)

AI 助手 Claude 成功发现 macOS 26.5 内核中的安全漏洞,凸显了 AI 在自动化漏洞挖掘和网络安全防御中的新兴能力。

图灵奖领衔,2026智源大会集结中国大模型第一梯队

智源大会汇聚顶级专家与中国头部大模型团队,旨在探讨AI技术演进路径,是了解中国AI产业最新进展和趋势的关键行业会议。

AI 时代催生漏洞挖掘军备竞赛

随着攻击者利用 AI 加速开发漏洞利用工具,软件漏洞搜索与防御领域正经历快速变革,安全行业面临前所未有的自动化攻防挑战。

Agent 时代的人与组织:工程规则重写与应对策略

探讨在 Agent 重写工程与组织规则背景下,Anthropic 工程师的内部实践范式及行业对 AI 大规模替代论的数据反驳,揭示人机协作的新站位。

伊朗黑客组织利用AI辅助开发恶意软件及SEO投毒攻击企业

Check Point Research披露,与伊朗伊斯兰革命卫队有关联的黑客组织Nimbus Manticore在美伊冲突期间重新活跃,利用AI辅助开发恶意软件及SEO投毒技术攻击目标公司。这表明国家级威胁行为者正在快速整合AI技术以提升网络攻击的效率和隐蔽性。

还有人喜欢 React 吗?

该话题在 Hacker News 引发热烈讨论,反映了前端社区对 React 框架现状的争议与反思,涉及技术栈选型趋势及开发者体验,是前端生态的重要风向标。

京东戴文军:AI终极形态是融入万物,而非单纯聊天

京东JoyInside负责人提出AI应从对话式交互转向主动适应用户的硬件形态,强调了AI在智能家居和物联网场景中的深层价值与未来方向。

华为具身智能前负责人创业,获亿元融资打造认知世界模型

华为具身智能核心成员离职创业,引入认知科学理论重构具身智能底层逻辑,旨在通过「人类心智」模拟提升机器人对物理世界的理解能力,获亿元级融资支持。

职场警报:99% 企业高管预计 AI 两年内引发裁员潮

调查显示绝大多数企业高管认为 AI 将在两年内导致大规模裁员,反映出业界对 AI 替代人力效应的普遍焦虑与预期。

OpenAI 高薪招聘安全研究员,年薪最高 44.5 万美元

OpenAI 以极具竞争力的薪资招募安全专家,凸显其在模型对齐与安全治理上的战略重心及人才争夺战。

B站 2026 Q1 财报:AI 赋能广告业务助力扭亏为盈

B站通过 AI 技术优化广告投放效率,实现季度盈利,标志着 AI 在内容平台商业化变现中的关键作用得到验证。

Anthropic 联合创始人解读教皇新通谕:AI 时代需捍卫人性

Anthropic 联合创始人 Chris Olah 对教皇利奥十四世发布的通谕《Magnifica humanitas》发表评论,强调在 AI 时代保持‘深刻的人性’的重要性,呼应了科技界对 AI 伦理与人类主体性的关注。

OpenAI 与巴西两大媒体集团达成战略合作

OpenAI 宣布与巴西媒体集团 Grupo Folha 和 Grupo UOL 建立内容合作伙伴关系,旨在将可信的巴西新闻内容引入 ChatGPT,提升新闻获取的透明度与归因准确性。

Hacker News 热议:教皇发布 AI 通谕、四天工作制实证及 Go/Rust 迁移

全球开发者社区关注教皇利奥十四世关于 AI 伦理的通谕,同时深入讨论四天工作制的实际效果、Go 与 Rust 的技术迁移以及 AI 代理的误用风险。

BestBlogs 早报精选:AI Agent、Claude Code 与医疗 AI 深度解析

汇总 10 篇关于 AI Agent 自动化悖论、Anthropic 内部 Claude Code 实践及百川医疗战略的深度文章,为开发者提供前沿技术趋势与术语澄清。

三星消费电子工会起诉阻止偏向芯片部门的薪资投票

三星电子旗下消费电子部门工会向法院申请禁令,试图阻止一项主要惠及芯片部门员工的薪资协议投票,凸显了集团内部不同业务板块间的利益分配矛盾。

Wix预计裁员约1000人(占20%),以应对业绩疲软及AI成本上升

据CTech报道,网站构建平台Wix计划在数月内裁员约1000人,约占其总员工数的20%,以应对第一季度业绩疲软、股价暴跌以及日益增长的AI相关成本。这反映了SaaS企业在AI转型期面临的成本压力及效率优化需求。

LLM提升财务分部披露信息的完整性与可比性

利用大语言模型处理分散在10-K表格和叙述中的定性及定量信息,旨在提高企业分部披露数据的完整性和跨公司可比性,优化财务报告分析。

EMNLP投稿量已超11000篇

顶级NLP会议EMNLP的投稿数量再次刷新纪录,突破11000篇,反映出自然语言处理领域研究热度持续高涨及学术竞争加剧的现状。

为何智能家居泡沫破裂

文章分析了智能家居市场增长放缓的原因,指出互操作性差、隐私担忧及实际效用不足导致消费者热情消退,为物联网行业提供了重要的市场反思。

没人再翻开编程书了:开发者学习方式的变迁

文章指出传统编程书籍阅读率下降,开发者更倾向于通过在线文档、交互式教程和 AI 辅助进行即时学习,反映了知识获取模式的根本转变。

抖音 AI 治理谣言一周年:处置浏览量下降 62%

抖音大模型“AI 治安官”上岗一周年成效显著,通过自动化治理使谣言相关浏览量大幅下降,展示 AI 在内容安全领域的实际价值。

育碧《孤岛惊魂 7》秘密测试生成式 AI 遭曝光

育碧被曝在《孤岛惊魂 7》开发中秘密引入生成式 AI,引发行业对游戏 AI 应用边界及玩家接受度的关注。

西安闭门会:AI 能力普及后,产品创新决胜于场景化落地

推广一场聚焦 AI 场景化落地的线下活动,强调在 AI 技术门槛降低的背景下,产品创新的关键在于找到与垂直业务场景的精准切入点而非单纯技术炫技。

METR AI时间线图表存在严重错误

社区指出著名的METR AI技术发展时间线图表包含多处严重事实错误,提醒读者在引用此类流行图表时需保持审慎,核实原始数据来源。

2026投资界SuperLink大会定档6月,打造创投生态枢纽

该大会旨在连接资本与项目,作为创投生态的超级枢纽,将于6月10-11日举行,是观察下半年AI及科技领域投资风向的重要窗口。

💻 芯片算力 3 条

华为提出‘韬定律’:以时间常数替代晶体管密度指引芯片演进

华为在 ISCAS 2026 上正式提出‘韬定律’(Tau Scaling Law),主张以电路时间常数 τ 为核心,通过逻辑折叠等立体堆叠技术实现‘时间缩微’,为国产芯片寻找超越传统摩尔定律的进化方向。

杭州具身机器人‘打工’现状:从炫技到场景落地的鸿沟

以杭州机器人场景应用大赛为例,分析具身机器人进入公共服务和商业场景的现状,指出‘会动’与‘成为好员工’之间仍存在巨大落地挑战。

微控制器上的DCGAN推理:纯C实现

展示了在资源极度受限的微控制器(512KB SRAM)上运行12.6M参数DCGAN模型的成果,纯C实现生成耗时26秒,证明了生成式AI在边缘硬件上的潜力。

🛠️ 开发工具 23 条

DeepSeek V4新工具缓存命中率近100%,成本降至2折

通过优化缓存机制,DeepSeek V4在大规模Token处理下的成本大幅降低,从61美元降至12美元,显著提升了高性价比推理服务的可用性。

OpenAI 发布 ChatGPT for PowerPoint:一句话生成 PPT 并自动纠错

OpenAI 推出 PPT 插件,支持自然语言生成幻灯片并具备主动纠错功能,进一步简化办公流程,提升生产力工具体验。

让 Codex 成为全能工作系统:从编程助手到持久化任务管理

通过持久线程、语音操控及桌面/浏览器操作能力,OpenAI Codex 正从单纯的代码生成工具进化为可自主执行复杂工作流的全能计算机工作系统。

从 Claude Code 到 Cursor:AI 编程的核心瓶颈在于信任而非并行

开发者分享从 Claude Code 转向 Cursor 的体验,指出当前 AI 编程工具的主要瓶颈并非多模型并行能力,而是用户对 AI 生成代码的信任度及 GUI 交互体验。

构建长时间运行 AI Agent 的 5 种关键模式

文章总结了构建可靠、可扩展的长时间运行 AI Agent 的五种模式,包括检查点恢复、委派审批、分层记忆等,为开发者解决 Agent 稳定性与状态管理难题提供了系统性框架。

MergeNB:VS Code 中 Jupyter Notebook 的直观合并冲突解决工具

MergeNB 是一款专为 VS Code 设计的扩展,旨在解决 Jupyter Notebook 在 Git 协作中常见的合并冲突难题,通过直观的界面提升数据科学团队的协作效率。

Claude Cookbooks: Anthropic 官方示例库

Anthropic 官方发布的 Claude 模型使用指南与代码示例集合,帮助开发者快速掌握 API 调用与最佳实践。

BODHI:利用 LLM 自动推断操作系统内核精确规范

针对操作系统内核形式化验证中手动编写规范的高门槛,BODHI 利用大语言模型自动化生成系统调用的精确行为规范。在包含 245 个任务的 OSV-Bench 基准测试中,该方法旨在降低领域专家依赖,提升内核验证效率。

完全在浏览器中进行的容器构建

展示了无需本地安装 Docker 或构建工具,直接在浏览器环境中完成容器镜像构建的技术。这降低了 CI/CD 的入门门槛,是云原生开发体验的重要进步。

NVIDIA Isaac Sim 强化学习生态现状调查

社区调研在使用 NVIDIA Isaac Sim 进行强化学习时,结合 Isaac Lab 的普及程度,以了解当前工业界的标准工作流。

cmux: 基于 LLM 的多路复用器

manaflow-ai 推出的 cmux 利用大语言模型实现智能流量路由,旨在优化多模型环境下的请求分发效率。

C语言扩展、可移植性与替代编译器探讨

社区深入讨论C语言标准扩展对代码可移植性的影响及替代编译器的现状。对于关注底层系统编程、嵌入式开发及编译器技术的开发者具有重要参考价值。

FinceptTerminal: 金融数据终端

Fincept-Corporation 发布的开源金融终端工具,旨在为量化交易者和分析师提供高效的数据获取与分析界面。

实测 Codex 优化网速:本质是清理 DNS 与配置调整

实测发现 Codex 提升网速的效果主要源于清理 DNS 缓存和调整网络配置,效果因人而异且存在误删配置风险;文章进一步探索了 Codex 在定时任务、自我进化等 Agent 场景的潜在玩法。

Hermes Agent 内置 baoyu-infographic Skill 绘图效果展示

开发者宝玉展示其 Hermes Agent 中内置的 baoyu-infographic Skill 自动生成的图表,验证了该智能体在数据可视化方面的性能改进与绘图能力。

GitHub 新手指南:在 VS Code 中快速上手 Git 与 GitHub

GitHub 官方博客发布教程,指导初学者如何在 VS Code 中高效使用 Git 和 GitHub 进行项目维护,适合刚接触版本控制的开发者快速入门。

Helix编辑器:拆分Konsole视图运行工具

介绍如何在Helix编辑器中拆分终端视图以直接运行开发工具,提升终端编辑器的多任务处理能力。属于开发者工具使用技巧。

ai-engineering-from-scratch:从零构建 AI 工程系统

GitHub Trending 教程项目,系统性地讲解如何从底层原理出发构建 AI 工程系统,适合希望深入理解 AI 应用架构与工程实践的开发者。

ECC:高效上下文压缩工具

GitHub Trending 项目,专注于优化大模型上下文窗口的使用效率,通过压缩技术减少 Token 消耗并提升长文本处理速度。

Anthropic-Cybersecurity-Skills:AI 网络安全技能库

GitHub Trending 项目,整理了针对 Anthropic Claude 模型的网络安全提示词与技能框架,帮助开发者利用 AI 辅助进行安全审计与防御分析。

codegraph:代码结构可视化与图谱分析

GitHub Trending 项目,用于将代码库转换为图谱结构,帮助开发者更直观地理解复杂代码依赖关系与系统架构。

garrytan/gstack:现代全栈开发工具集

GitHub 热门项目,提供一套现代化的全栈开发工具链或架构方案,旨在提升开发效率与代码质量。

taste-skill: 个性化技能推荐

Leonxlnx 开发的工具,旨在通过算法分析用户偏好,提供个性化的技能学习建议与路径规划。

⚖️ 政策监管 9 条

欧盟拟对谷歌处以数亿欧元罚款,指控其搜索结果偏袒自家服务

据路透社报道,欧盟计划在2025年的反垄断调查中,对谷歌处以高达数亿欧元的罚款,核心指控是其利用市场支配地位在搜索结果中优待自家服务。此举标志着欧盟对科技巨头反垄断监管力度的持续升级,可能对谷歌的商业模式产生重大影响。

国家标准委发布《AI 伦理安全指引 1.0》

中国首个 AI 伦理安全国家标准发布,为大模型的商业落地设定了合规底线,旨在平衡技术创新与社会安全。

教皇利奥十四世发布通谕:警惕 AI 风险,守护人类尊严

教皇利奥十四世在首份重大通谕《Magnifica humanitas》中警告 AI 及无约束技术权力的风险,重点讨论了 AI 驱动战争、劳动力影响等议题,呼吁在 AI 时代捍卫‘人类主体’。

伊朗总统下令恢复国际互联网访问,结束近90天断网

伊朗国家媒体报道,总统佩泽什基安已下令恢复国际互联网访问,结束了持续近90天的网络封锁,这一举措可能标志着伊朗在网络管控政策上的重大转向。

英国AI安全研究院成全球标杆,其安全审查模式正被多国政府效仿

《纽约时报》报道,由OpenAI和谷歌前员工组成的英国AI安全研究院,正在通过探测AI模型的安全漏洞,为全球政府制定AI政策提供蓝图。随着AI风险日益凸显,该机构的工作模式正成为其他国家建立AI监管框架的重要参考。

美国国会质疑量子计算20亿美元投资合法性

美国政府宣布向量子计算初创公司投资20亿美元以换取股权,但一名国会议员指出该交易可能违法,引发对政府直接干预初创企业融资模式的法律争议。

马萨诸塞州正式承认网约车司机工会,全美首例

马萨诸塞州正式承认代表约7万名Uber和Lyft司机的App Drivers Union,这是美国首个获得州认证的网约车工会,标志着零工经济劳动者权益保护的重大突破。

西蒙·威利森评教皇利奥十四世关于 AI 的通谕

知名技术博主 Simon Willison 分析了教皇利奥十四世发布的关于人工智能的通谕,探讨了宗教伦理视角下对 AI 发展的规范与思考,引发科技圈对 AI 伦理治理的关注。

FTC对Cox等公司罚款93万美元,因其虚假宣称可用麦克风监听用户

美国联邦贸易委员会(FTC)与Cox等公司达成93万美元和解,原因是这些公司虚假宣传其技术能通过手机麦克风监听用户以进行广告定向,尽管实际上并未实施监听,但误导了公众对隐私安全的认知。

📌 其他 8 条

传统 PM 转型 AI PM:四步复盘框架助力面试突围

针对传统产品经理转型痛点,提供一套包含业务洞察、数据决策、技术选型和量化成果的四步复盘框架,帮助候选人系统化展示 AI 项目管理深度。

AI 时代的信息差:亲身实践获得的微观信息最具价值

文章论证尽管 AI 缩小了宏观信息差,但通过亲身实践获得的、未被公开的微观操作细节与潜规则,仍是 AI 无法替代的核心竞争力。

厘清 AI 工程三大概念:提示、上下文与框架工程的层次化理解

该文章为常被混淆的提示工程、上下文工程和框架工程提供了清晰的层次化定义,帮助开发者更准确地理解不同工程手段在 AI 应用开发中的作用与边界。

Andrej Karpathy 技能树解析

该项目梳理了 AI 领域知名人物 Andrej Karpathy 的技术成长路径与核心技能栈,为开发者提供学习参考。

利用AI更慢地写出更好的代码

Lobsters社区讨论如何通过调整使用AI的节奏和方式,牺牲部分速度以换取代码质量和可维护性的提升。

写作的社会契约

Lobsters社区关于写作伦理与社会责任的讨论,探讨在AI时代人类写作的价值与规范。

教皇利奥十四世发布通谕《伟大的人性》

教皇利奥十四世发布新通谕,探讨人性尊严与科技伦理。虽然主要属于宗教与哲学范畴,但其中关于AI时代人类价值的论述可能引发科技伦理界的讨论。

ICML Oral 录用结果查询

社区成员询问 ICML 口头报告(Oral)录用通知的发放进度,反映学术界对顶级会议评审结果的实时关注。