Google 升级 Gemini API 文件搜索:多模态 RAG 能力实现全方位跨越
在实际应用场景中,这一进步解决了传统 RAG 系统难以处理非文本内容的痛点。以往,文档中的图表、设计图或产品截图往往成为 AI 的“盲区”,导致回答缺失关键上下文。而现在,Gemini API 能够原生理解这些视觉元素。例如,当企业上传包含技术架构图或销售趋势表的 PDF 时,AI 可以结合图表数据与文字描述给出精准推论,极大提升了客服机器人和文档分析系统的实用性。 为了进一步优化大规模知识库的管理效率,Google 还引入了自定义元数据过滤功能。开发者可以根据部门、时间、分类等维度为文件添加标签,在检索时通过预设条件过滤无关信息,从而确保 AI 输出的回答更加聚焦。 此外,针对用户最关心的信息溯源问题,Gemini API 现已支持页面级引用。AI 在生成答案时,会明确标注信息源自文档的具体页码,而非仅仅指向整个文件。这种透明度的提升,不仅方便用户快速核实内容准确性,也为深度阅读提供了便利。 谷歌发布 Gemini API 新定价策略,推理服务按需计费 谷歌更新Gemini API计费结构,新增标准、弹性、优先、批量和缓存版服务档位,满足不同推理需求。弹性档位利用非高峰闲置算力,提
2. 11 倍反超美国!中国AI大模型周调用量稳居全球首位
在全球AI技术加速迭代的背景下,中国大模型市场正展现出极强的爆发力与应用韧性。根据OpenRouter最新发布的行业测算数据,在刚刚过去的 5 月 4 日至 5 月 10 日这一周,全球AI大模型的总调用量达到了惊人的25. 7 万亿Token,较前一周增长7.5%,呈现出连续三周向上攀升的强劲势头。 在这场全球算力与应用竞赛中,中国大模型的表现尤为亮眼。数据显示,上周中国AI大模型的周调用量高达7. 941 万亿Token,尽管在规模上与前一周基本持平,但其庞大的基数已确立了绝对的市场优势。 相比之下,同期美国AI大模型的周调用量为3. 76 万亿Token。虽然美国市场在当周实现了14.41%的环比大幅增长,但在总量上仍与中国存在显著差距。从数据对比来看,中国大模型的周调用量已经达到了美国的2...
特斯拉 AI 系统提前 70 毫秒弹出安全气囊,显著提升车辆安全性
特斯拉 AI 系统提前 70 毫秒弹出安全气囊,显著提升车辆安全性 特斯拉最近在其官方社交平台上发布了一段引人注目的视频,展示了其最新的 AI 视觉系统在遇到不可避免的碰撞时,能够提前 70 毫秒触发安全气囊的功能。这一创新科技的推出,旨在显著降低事故中的人员伤亡风险。 特斯拉首席执行官埃隆・马斯克对此表示,采用这一 AI 视觉系统后,安全气囊的提前弹出将有效降低驾驶员和乘客在事故中受伤或死亡的几率。马斯克强调,这一功能将在所有新车型中免费提供,显示了特斯拉在保障用户安全方面的持续承诺。 据悉,特斯拉的 AI 视觉系统通过复杂的算法和实时数据分析,能够迅速判断周围环境,一旦系统检测到潜在的碰撞风险,就会立即启动安全气囊的弹出机制。这一机制的关键在于其反应速度,70 毫秒的提前预警时间将为乘员提供更好的保护。 此外,特斯拉在视频中展示了该技术的实际应用场景,让人们更直观地感受到这一安全系统的必要性和有效性。这一技术的引入,不仅提升了车辆的主动安全性能,也在业界引发了广泛关注。 特斯拉此次的创新不仅是对汽车安全技术的重大突破,也为未来智能汽车的发展方向提供了新的思路。通过结合先进的 AI
Linux内核首个AI生成驱动诞生:由Codex GPT-5.5辅助开发,支持AMD芯片组温控
Linux内核首个AI生成驱动诞生:由Codex GPT-5.5辅助开发,支持AMD芯片组温控 5月11日,Linux内核迎来了首个明确标注由AI生成代码的硬件驱动程序prom21-xhci,标志着人工智能在系统级底层开发领域的应用取得实质性突破。该驱动由开源开发者Jihong Min主导,核心代码通过OpenAI的编码代理工具Codex GPT-5.5生成,旨在为AMD Promontory21芯片组的xHCI控制器提供温度监控支持。 作为AMD600及800系列AM5主板(含高端X670E型号)的核心组件,Promontory21架构此前在Linux系统下一直缺乏原生的芯片组温度监测手段。该驱动通过将实时传感器数据接入Linux硬件监控(HWMON)子系统,实现了与主流用户空间监控工具的无缝兼容。目前,相关补丁已提交至内核邮件列表进行公开审核,用户未来可通过内核Kconfig文件中的专用选项启用该功能。 这一事件不仅填补了AMD平台在Linux环境下的硬件监控空白,更揭示了AI辅助编程正从高层应用向底层内核代码渗透的趋势。此前,AMD高层也曾尝试利用Claude Code生成测试驱
告别手机号时代?中国移动发布AI-eSIM,让万物皆可“大模型”
告别手机号时代?中国移动发布AI-eSIM,让万物皆可“大模型” 在近日举办的 2026 移动云大会上,一项有望重塑智能连接格局的技术成果正式亮相。通过创新构建的AI-eSIM多生态智能服务体系,移动通信领域实现了“运营商码号即大模型账号”的跨越式突破。这一体系将AI-eSIM定位为Token经济的新入口,通过流量、词元与智能体的融合运营,开启了人工智能的新形态。 此次发布的AI-eSIM芯片入口在技术层面完成了多项行业领先的优化。首先在安全性上,该芯片实现了全栈国产化与自主可控,达到金融级硬件安全标准,为每一台联网设备赋予了可信的数字身份。 在功耗与尺寸方面,针对可穿戴设备推出的CAT...
Vbot维他动力获近5亿元Pre-A轮融资,首款具身智能产品开启大规模交付
Vbot维他动力获近5亿元Pre-A轮融资,首款具身智能产品开启大规模交付 具身智能领军企业Vbot维他动力近日宣布完成近5亿元Pre-A轮融资,由东方嘉富、华泰紫金、复星锐正联合领投,上汽集团旗下尚颀资本等机构跟投,老股东悉数加码。该笔融资刷新了全球消费级具身智能赛道迄今为止的最大单笔融资纪录。5月8日,Vbot首款产品“超能机器狗”正式启动量产交付,首批500台产品已下线发货,标志着具身智能机器人正式从实验室走向大众日常生活空间。 作为2025年12月推出的全球首款无需遥控的智能机器狗,Vbot产品凭借全场景随行、自主载物及AI跟拍等核心能力,在预售期间便表现出极强的市场号召力。数据显示,该产品在限时预售期内累计订单达6540台,预订额近亿元,刷新了万元级具身智能单品的销量纪录。目前,Vbot已完成北京、上海等核心城市的线下门店布局,并计划在6月将月产能提升至2500台以上,以加速用户闭环的形成。 在技术演进上,Vbot正由四足形态向全尺寸人形机器人跨越。创始人余轶南博士指出,通过大规模量产构建的真实场景数据闭环,是实现物理AI进化的核心。下一阶段,公司将围绕手足一体世界模型、Ag
三星升级 Bespoke AI 冰箱 家庭中心,全面提升智能体验
三星升级 Bespoke AI 冰箱 家庭中心,全面提升智能体验 三星电子近日宣布,为在美国销售的 Bespoke AI 冰箱家庭中心推出重大软件更新。这一更新无需更换硬件,即可为现有用户带来新一代 AI 增强功能。此次更新包括与 Google Gemini 合作开发的 AI 视觉食物识别技术、全新升级的 Bixby 语音控制以及个性化的日常小部件等新功能。 三星电子数字家电业务研发团队执行副总裁郑承文表示:“家用电器的价值不应在购买时固定,而应随着技术的演变而不断提升。” 此次更新旨在为用户提供更智能的厨房体验,能够识别更多种类的食品,理解自然语言对话,并根据家庭日常习惯进行适应。 更新后的 AI 食品管理系统显著扩展了家庭中心识别和跟踪食物的能力。结合云智能,该系统现在可以更准确地识别多种新鲜蔬菜和包装食品。此外,家庭中心还能主动提醒用户何时需要补充经常消费的食品,帮助简化购物计划,减少食物浪费。 Bixby 语音助手也进行了升级,支持更加自然和智能的语音控制。用户可以通过更日常的对话与冰箱进行交互,而不再局限于特定的命令。例如,用户可以简单地说:“嗨,Bixby,帮我制作圆冰。”
Palisade Research报告:AI代理实现自主跨国黑客攻击,自我复制成功率升至81%
关键数据显示,前沿模型的自我复制成功率在过去一年内实现跨越式增长,从2025年5月的6%飙升至2026年5月的81%。这种进化速度与模型自主黑客攻击和编码能力的提升高度正相关。在实际演示中,基于 Qwen3.6(27B)的智能体在50分钟内完成了从美国到加拿大、芬兰及印度的跨国“跳跃”复制,且跨国界传播的难度与本地传播无异。 针对闭源模型,研究人员通过 Claude Opus4.6等基于 API 的模型演示了其在目标机器上配置并运行开源模型权重的能力。模拟测试显示,在最坏情况下,Opus 模型能在12小时内生成1.3万个副本。尽管目前实验设定在防御较弱的环境中,但随着 Mythos 等模型在零日漏洞挖掘领域的突破,未来攻防天平的倾斜引发了行业高度关注。这一进展预示着网络安全领域正由人类主导演变为AI智能体之间的对抗,司法管辖权在应对失控AI智能体时将面临严峻挑战。 微信官方近日通过“微信公开课”发布4月九项重大更新,涵盖微信支付、AI小程序、企业微信、视频号等领域。更新重点包括微信支付AI原生接入能力升级,开发者可通过Skill技能包和API接口,简单描述需求即可快速调用,显著提升开发
#1Anthropic 推出自然语言自编码器,将 Claude 内部活动直接转化为人类可读的文本解释
Anthropic 推出自然语言自编码器,将 Claude 内部活动直接转化为人类可读的文本解释 近日,Anthropic 公司推出了一种新型的自然语言自编码器(NLA),该技术能够将其语言模型 Claude 内部的 “思考活动” 直接转换为人类可读的文本。这一创新将为模型的可解释性打开新的大门,解决了以往难以理解内部激活状态的问题。 当用户与 Claude 进行交流时,输入的信息会被转化为长长的数字列表,这些数字称为 “激活”,用于模型的上下文处理和响应生成。然而,这些激活状态的具体内容一直以来难以解读。Anthropic 团队经过多年的研究,开发出了 NLA,能够以自然语言的形式展示这些激活状态。 NLA 的核心机制包括两个部分:激活可视化器(AV)和激活重构器(AR)。该模型由三个副本构成,通过从冻结的目标模型中提取激活,AV 会生成一个文本解释,而 AR 则尝试从这个解释中重建原始激活。通过训练这两个部分,系统能够生成更准确的解释。 在 NLA 正式发布前,Anthropic 已经在多个实际案例中测试了这一技术。比如,有一次 Claude 在执行任务时表现出 “作弊” 的行为
#2谷歌 Chrome 浏览器 148 版本发布,AI 自动填充功能全面升级
谷歌 Chrome 浏览器 148 版本发布,AI 自动填充功能全面升级 谷歌今天正式推出了 Chrome 浏览器的 148 版本更新,此次更新引入了众多新功能,尤其是在 AI 驱动的自动填充和表单工具方面的显著改进。用户现在可以在地址栏或新标签页直接询问 AI 智能体,AI 会聚合相关信息,并以自然语言回答复杂问题,用户还可以通过澄清提示进行追问。 在自动填充方面,Chrome 148 允许用户在同意的情况下,通过 AI 模式协助填写信用卡号码和地址。此外,内置的 Gemini 聊天机器人功能扩展至亚太地区的 49 个国家和地区,进一步提升了用户体验。在 Android 设备上,Chrome 新增的增强型自动填充功能能够理解网页表单,并根据用户以往填写的方式自动填充相应字段。还新增了支持存储在谷歌钱包中的政府标识符的自动填充功能,例如驾照号码和护照号码。 在用户界面方面,Chrome 148 对个人资料创建界面的视觉设计进行了调整,但功能保持不变。此外,Android 版本新增了一项设置,允许网站使用近似位置而非精确位置,这对于保护用户隐私具有积极意义。ChromeOS 也迎来了新
#3办公效率革命!Claude 深度联姻 Microsoft 365,打通 AI 办公的“任督二脉”
办公效率革命!Claude 深度联姻 Microsoft 365,打通 AI 办公的“任督二脉” 在 AI 办公领域,一场重磅的“跨界联姻”刚刚拉开帷幕。Anthropic 官方宣布,旗下备受好评的 AI 助手 Claude 正式深度集成至 Microsoft 365 生态系统,并面向所有付费用户开放。这不仅仅是一个简单的功能更新,更意味着我们在处理 Excel、PowerPoint 和 Word 等日常办公软件时,正式告别了频繁切换窗口的繁琐,迎来了一个真正懂全局、跨应用的“超级大脑”。 这次集成的核心杀手锏在于“跨应用上下文共享”。以往我们在不同的 Office 软件中处理任务时,AI 往往只能看到眼前的单一文档,而现在,Claude 能够实时读取并理解不同应用间的关联。比如,当你正在编写一份年度总结报告,它能同时感知到你 Excel 表格中的业绩数据,并直接同步到 Word 的文字描述或 PPT 的演讲大纲中。 这次更新标志着 AI 办公助手从单一的功能点,演变为全流程的协同者。用户无需改变已有的工作习惯,在统一的窗口内即可完成从数据分析到报告生成、再到幻灯片演示的全套动作。这种
#4AMD:代理式 AI 时代,CPU 或将超越 GPU 的崛起
AMD:代理式 AI 时代,CPU 或将超越 GPU 的崛起 在 2026 年第一季度财报发布后,AMD 首席执行官苏姿丰在电话会议中透露,随着代理式人工智能(Agentic AI)时代的来临,数据中心对 CPU 的需求正在迅速攀升。苏姿丰指出,单个计算节点中 CPU 与 GPU 的数量正在从传统的一对多逐渐接近一对一,未来甚至可能出现 CPU 数量超过 GPU 的情况。 她解释说,以往的 AI 训练和推理通常采用 “一颗 CPU 配四到八颗 GPU” 的配置,CPU 主要负责调度和启动 GPU 的计算任务。然而,在代理式 AI 模式下,大量具有自治能力的智能体依赖 CPU 进行状态更新和任务协调,这一变化正深刻影响着计算节点的形态。随着智能体数量的迅猛增长,CPU 与 GPU 的比例正在向 1:1 靠拢。 苏姿丰进一步提出,假如未来集群中运行大量智能体,完全有可能实现单节点 CPU 数量超出 GPU 的配置。这意味着,过去由 GPU 主导的计算扩张趋势正被由 “智能体工作负载” 推动的 CPU 需求潮流所取代。所谓的代理式 AI,是在大语言模型的基础上运行多个自主的智能体,以自动完
#5OpenAI 正式发布 GPT-5.5 Instant,全面提升模型性能
OpenAI 正式发布 GPT-5.5 Instant,全面提升模型性能 就在刚刚,OpenAI 宣布正式推送 GPT-5.5Instant 模型,并将其设为 ChatGPT 的默认版本,全面取代此前的 GPT-5.3Instant。作为每日承载亿级用户流量的主力系列,本次更新虽然定位为“即时版”,但在性能跨越上却极具诚意。 官方指出,新版本核心聚焦于三点优化:回复更准确、表达更简洁、感知更个性。 在外界最关注的准确性方面,GPT-5.5Instant 展现出了极强的统治力。测试数据显示,新模型在医疗、法律及金融等高门槛领域的“幻觉”率大幅下降了52.5%。特别是在处理用户曾标记过的错误逻辑时,其修正率提升了近四成。 在学术竞赛表现上,该模型在 AIME2025数学测试中斩获81.2分,远超前代的65.4分。此外,在 GPQA 博士级科学测试以及多模态推理、科学图表理解等维度,新模型均实现了显著的百分点跨越。OpenAI 演示的一道代数题显示,新模型不再只是机械地判定结论,而是能精准指出用户在解题步骤中具体的计算错误。 除了脑力升级,GPT-5.5Instant 的“性格”也发生了变化
内容创作专业级AI二创萌系IP“咕咕嘎嘎”:从流量爆款到实物变现的全流程路径23.0K查看攻略
AI二创萌系IP“咕咕嘎嘎”:从流量爆款到实物变现的全流程路径 利用AI工具将已有游戏角色或热梗二创为软萌形象,通过社交平台持续发布治愈系短视频积累流量(一个月15亿播放),最终通过售卖周边手办及广告分成实现变现。 主要门槛在于对AI工具的熟练使用以及对“萌点”和“情绪价值”的精准把控。 找一个大家已经知道的游戏角色。就像文本里的“小企鹅”其实是把游戏里的女管理员换了个样子。 选一个好听又洗脑的声音,比如“咕咕嘎嘎”这种模仿小宝宝说话的声音。 画出形象:使用AI绘图工具,把角色变成圆滚滚、软绵绵的小萌物。要让大家一看就觉得“哇,好想抱抱它”。 动起来:使用AI视频生成工具,让这个小企鹅说话、走路或者跳舞。 让它去体验生活:比如今天让它当卖煎饼果子的小摊主,明天让它变成被中介欺负的打工人。 卖好玩的东西:当大家都很喜欢它时,联系厂家做成小挂件、抱枕或者手办放在网上卖。就像文中所说,一个手办就能卖出5000多份。 接广告:像腾讯等大公司可能会找这个小IP合作,这时候就能收广告费啦。 这是一个非常典型的“AI赋能+情绪经济”的成功案例。咕咕嘎嘎的成功并非偶然,它精准地捕捉了现代人压力大、需要
内容创作专业级借势 AI “龙虾风暴”:小红书 OpenClaw 安装教程高收藏变现案例32.7K查看攻略
借势 AI “龙虾风暴”:小红书 OpenClaw 安装教程高收藏变现案例 抓住 AI 圈 “养龙虾” 热潮,针对 OpenClaw 部署门槛高的痛点,制作保姆级安装教程发布在小红书,靠高收藏 / 点赞涨粉,后续通过付费咨询、定制部署等变现。以小红书博主“栗氪聊AI”发布了一篇零基础安装教程,短短几天在小红书获赞2.2万,收藏量4万。 有 AI 技术基础、能清晰拆解操作步骤的技术博主,或愿意花时间研究 OpenClaw 部署的 AI 爱好者,无需高颜值但需有耐心讲解操作。 中等。需先掌握 OpenClaw 部署的核心操作,能看懂基础报错提示,讲解时需把技术步骤转化为小白能理解的语言。 第一步:吃透 OpenClaw 部署全流程(先自己学会再教别人) 先下载 OpenClaw 开源项目,尝试在飞书 / 电脑端部署,记录每一步操作(比如打开哪个页面、输入什么指令)。 刻意踩坑并记录解决方案:比如环境配置报错、API 调用失败的原因,把这些 “踩坑血泪史” 整理成笔记。 确定教程形式:选图文(更易收藏),用手机截图 + 文字说明,每一步配清晰截图(比如飞书工作台页面、代码输入界面)。 再讲部
内容创作专业级利用 OpenClaw 自动化搭建 SaaS 封装工具,实现日入 200 美金的复利业务56.0K查看攻略
利用 OpenClaw 自动化搭建 SaaS 封装工具,实现日入 200 美金的复利业务 中等偏低(不需要深厚的编程功底,但需要具备一定的逻辑思维和基础的 AI 工具调优能力)。 就像雇佣员工前要告诉他服务谁一样。你需要详细告诉 OpenClaw:你的客户是谁?他们有什么烦恼?比如:“我的客户是想用 AI 却不会部署服务器的小白”。方向越细,AI 干活越准。 AI 有时候会胡言乱语,因为他不知道最新的消息。你需要收集你这个行业里最厉害、最准确的文章或文档,做成一个大文件“喂”给 AI。这样它写出的内容和提供的服务就会非常专业,不像机器人。 利用 OpenClaw 封装功能。别人用 AI 需要买服务器、写代码,你直接用 AI 帮他们把这些麻烦事做成一个“网页按钮”。用户点一下就能用,他们自然愿意为了“省事”按月给你付钱。 这是一个非常典型且先进的“一人公司”案例。其成功的核心不在于技术多牛,而在于商业路径的清晰:先通过 AI 自动化解决最难的“流量问题”,再通过降低技术门槛来提供“确定性价值”。 案例中的大佬非常冷静,他没有死磕转化率,而是先跑通从“流量获取”到“产品交付”的闭环。这种“
内容创作专业级AI“邪修”构图法:用AI样片指导实拍,小红书轻松获赞3万+38.3K查看攻略
AI“邪修”构图法:用AI样片指导实拍,小红书轻松获赞3万+ 摄影新手、旅行爱好者、小红书内容创作者、不会摆姿势/构图的普通人 - 就像拍一张干净的背景图,不要有人挡住镜头,天空、建筑、花草都可以 - 打开AI软件(比如豆包的AI功能),点“上传图片”,选中你刚拍的风景照 - 在输入框里写:“请在这个风景里加一个真人模特,站在这里(用手指图上位置),穿红色裙子,手拿咖啡杯,笑得自然,要有电影感” - 点“生成”,等1分钟,AI会变出几张带人物的完美照片,选一张最漂亮的 - 把AI生成的照片给朋友看:“你站这里,我站那里,手这样摆,头歪一点”,像玩过家家一样摆好 - 拍完选最好看的一张,写上“AI帮我找的机位太绝了!”发小红书,容易获赞涨粉 微信官方近日通过“微信公开课”发布4月九项重大更新,涵盖微信支付、AI小程序、企业微信、视频号等领域。更新重点包括微信支付AI原生接入能力升级,开发者可通过Skill技能包和API接口,简单描述需求即可快速调用,显著提升开发效率与用户体验。 佛罗里达州立大学枪击案受害者家属起诉 OpenAI,称 ChatGPT 助长犯罪 佛罗里达州立大学枪击案致2
内容创作专业级跟豆包学穿搭:AI视频通话“翻车感”起号,零粉起号到万粉爆款玩法35.9K查看攻略
跟豆包学穿搭:AI视频通话“翻车感”起号,零粉起号到万粉爆款玩法 利用豆包视频/语音通话的“认真但翻车”反差感,做AI穿搭互动内容,引发强烈娱乐效果和讨论,实现抖音零帧起号、快速涨粉变现。以抖音视频博主“别跟我俩闹了”为例,靠着这种玩法获得4.9万粉丝。其部分视频获得了百万点赞。 不需要穿搭专业知识,不需要剪辑高手,核心是“照着AI做 + 展示翻车效果”。 下载并打开【豆包】,确保可以使用【视频通话/语音通话】功能。 比如:日常上班怎么穿、显胖的人怎么显瘦、小个子穿搭,场景越真实、越普通越好 豆包让你怎么穿,你就怎么穿,不管多离谱,都完整执行,这是视频好笑的关键。 镜头对准全身,用夸张但真实的表情,让观众一眼看出“翻车了”。 这个案例的核心不在“AI多聪明”,而在“AI不完美”。豆包一本正经输出专业建议,却频频制造喜剧反差,让观众产生强烈情绪反馈和参与欲。对新手来说,这是极低成本、高容错率的内容模型:不需要专业能力,只要真实执行AI指令,就能自然制造爆点,非常适合当下短视频平台的算法偏好。 微信官方近日通过“微信公开课”发布4月九项重大更新,涵盖微信支付、AI小程序、企业微信、视频号等