腾讯开源 Hy-MT 翻译模型:440MB 实现离线运行,性能超越谷歌翻译
腾讯开源 Hy-MT 翻译模型:440MB 实现离线运行,性能超越谷歌翻译 腾讯近日正式开源紧凑型 AI 翻译模型 Hy-MT1.5-1.8B-1.25bit。该公司声称,该模型在保持高性能的同时,可在智能手机上实现完全离线运行。目前,该模型支持包括中、英、德、法、日、藏、蒙在内的33种语言及5种方言,涵盖1056个翻译方向,并在国际机器翻译大赛中累计斩获30项冠军。 技术突破的核心在于“激进压缩”方案:通过每参数仅使用1.25比特的量化技术,该模型体积从3.3GB 骤减至440MB,较此前的1.67比特方案缩小约25%,推理速度提升约10%,且未产生质量损失。在标准基准测试中,仅440MB 的 Hy-MT 表现出与商业翻译服务及 Qwen3-32B 等超大模型相当的翻译质量,实现了以极小量级抗衡百 GB 级模型的跨越。 目前,腾讯已提供 Android 演示应用(APK 形式),支持对手机内任何应用的文字进行跨屏离线翻译。行业观察指出,随着谷歌推出本地化模型 Gemma4,终端侧 AI(On-device AI)已成为技术竞争新前线。腾讯 Hy-MT 通过量化技术的突破,大幅降低了高
告别通用模型依赖,微软通过定制算法开启垂直领域 AI 助手新范式
告别通用模型依赖,微软通过定制算法开启垂直领域 AI 助手新范式 微软近日宣布通过美国 Frontier 计划正式推出专为法律专业人士设计的 AI 工具——“法律助手”(Legal Assistant)。该助手深度集成于 Word 环境中,旨在通过自动化手段彻底简化合同处理流程,标志着微软在垂直行业 AI 应用领域的又一重要动作。 功能层面,“法律助手”支持对合同进行逐条审查,能够精准标记潜在风险与法律义务,并实现跨文档版本的快速比对。该助手直接在文档内提供带有“修订追踪”功能的修改建议,在保持原有排版格式不变的前提下,清晰区分早期版本与新提案。此外,用户可将现有合同与公司内部的合规标准进行一键比对。 技术路径上,微软采取了差异化的设计理念。该代理并非单纯依赖通用的黑盒大语言模型,而是遵循结构化的法律工作流程。通过与法律界专家深度咨询,微软开发了能够一致性处理编辑操作的定制化算法,确保每一次合同修订都具备逻辑一致性与专业严谨性,从而规避了生成式 AI 常见的随机性问题。 行业分析指出,微软此举展示了其将 AI 助手从“通用型”向“专业型”转变的战略企图。通过在特定领域引入定制算法而非全
四大科技巨头2026年 AI 资本开支上调至7250亿美元,同比激增77%
四大科技巨头2026年 AI 资本开支上调至7250亿美元,同比激增77% 据《金融时报》最新报道,谷歌、亚马逊、微软及 Meta 计划在2026年共计投入7250亿美元用于人工智能领域,较去年创纪录的4100亿美元大幅增长77%,显著高于今年2月预估的6100亿美元。仅在2026年第一季度,这四家巨头的资本开支已累计达1300亿美元,显示出 AI 基础设施竞赛正处于极度升温状态。 具体财务数据显示,各大厂商投入均呈翻倍式增长:微软开支预计达1900亿美元,增幅高达192.3%,领跑行业;Alphabet(谷歌母公司)与 Meta 的投入亦分别突破1450亿与1900亿美元,增幅均超100%;亚马逊则计划投入逾2000亿美元。尽管谷歌云计算业务最新季度营收增长达63%,表现强劲,但受内存芯片及核心组件价格上涨影响,成本压力同步激增。谷歌与微软均公开表示,现有计算能力仍远未满足爆发式增长的市场需求。 针对巨额支出,微软首席执行官萨蒂亚·纳德拉明确暗示了定价逻辑的转变:软件收费模式正从传统的固定“按席位计费”转向“席位费+使用费”的混合模式。这意味着随着 AI 算力成本向终端传导,B 端客
剑指 AGI 物理训练,Meta 吞并 ARI 补齐全身人形机器人控制版图
剑指 AGI 物理训练,Meta 吞并 ARI 补齐全身人形机器人控制版图 社交媒体巨头 Meta 近日宣布已正式收购人形机器人初创公司 Assured Robot Intelligence (ARI),旨在强化其在复杂动态环境下机器人理解与预测人类行为的前沿能力。收购完成后,包括联合创始人王晓龙(前英伟达研究员、加州大学圣地亚哥分校副教授)与勒雷尔·平托(前纽约大学教授)在内的 ARI 核心团队将整体并入 Meta超级智能实验室(Superintelligence Labs)。 ARI 此前曾获 AIX Ventures 的种子轮融资,核心业务专注于为人形机器人构建基础模型,使其能够胜任家务等各种体力劳动。Meta 发言人指出,该团队在机器人控制、自学习模型以及全身人形机器人控制技术方面的深厚积淀,将直接助力 Meta 实现其硬件与模型协同的人形机器人战略目标。此前曾有泄露备忘录显示,Meta 内部早已启动针对消费者市场的 AI 机器人研究计划。 行业分析普遍认为,Meta 此举反映了人工智能领域向“具身智能”进化的共识,即通用人工智能(AGI)的实现需要模型在物理世界中通过直接交互
OpenAI 发布 ChatGPT Images2.0,印度市场贡献首周最大用户增量
OpenAI 发布 ChatGPT Images2.0,印度市场贡献首周最大用户增量 OpenAI 周四宣布,其最新推出的图像生成工具 ChatGPT Images2.0自上周发布以来,印度已迅速成为该功能最大的用户群体所在地。这款新工具旨在处理复杂提示词并生成包含多语言精确文本的精细图像,标志着 OpenAI 在多模态交互领域的进一步深耕。 Sensor Tower 数据显示,ChatGPT 应用在全球范围内的反响呈现地域性差异,发布首周下载量环比增长11%,但日活跃用户数和会话数等核心参与度指标增幅仅约1%。Similarweb 的数据同样印证了这一温和趋势,全球网站流量环比增长约1.6%。然而,以印度为首的新兴市场表现出极强的增长动力,巴基斯坦、越南和印度尼西亚等地的应用下载量在推广期间周增幅高达79%。 在印度市场,ChatGPT 首周下载量约为500万次,显著超过美国的200万次。OpenAI 观察到,印度用户正将该工具从纯功能性输出转向深度的“自我表达”,广泛应用于创作影棚风格肖像、风格化头像及奇幻主题视觉素材。为适应这一趋势,Images2.0强化了对印地语和孟加拉语等非
钉钉发布 AI 录音硬件 DingTalk A1Pro:售价1299元,支持手机反向充电
钉钉发布 AI 录音硬件 DingTalk A1Pro:售价1299元,支持手机反向充电 4月30日,钉钉正式发布 AI 硬件家族新成员DingTalk A1Pro,并于天猫官方旗舰店开售,定价1299元。该产品定位为专业 AI 录音卡片,专为高频出差的商务人士与超级个体打造,通过“AI 办公+应急补能”的复合功能设计,进一步拓展了钉钉软硬一体化的服务边界。 硬件配置上,DingTalk A1Pro 机身厚度仅6.4mm,支持磁吸设计并配备触控屏幕。其核心搭载专业级 MEMS 指向性麦克风,拾音距离达10米。相较于2025年发布的初代产品,Pro 版显著强化了续航与多功能性:内置2980mAh 电池支持180小时连续录音及180天待机,且通过了新国标3C 认证,可作为应急充电宝为手机反向充电。 在系统协同方面,该硬件与钉钉工作流深度整合。录音内容经由 AI 听记处理后,可一键生成会议纪要、日程及待办事项,实现数据在钉钉工作台的无缝流转。针对 B 端需求,钉钉同步推出了企业版本,支持统一采购、设备管理及加密存储。此外,购机用户可获赠6个月专属权益,包含每月1500分钟的 AI 转写时长。
快手推出 KroWork:AI 桌面助手助你高效办公
快手正式发布了其最新产品 KroWork,一款面向非技术用户的 AI 桌面智能体。KroWork 允许用户通过自然语言指令,自主完成各类办公任务,包括文件处理、浏览器自动化及应用生成。这意味着用户可以将日常重复的工作流程转化为本地桌面应用,避免再次付费使用。更重要的是,所有操作都在安全的沙箱环境中执行,确保用户数据不会上传至云端,从而保证隐私安全。 KroWork 的设计初衷是降低软件开发的门槛,让那些不熟悉编程的人也能轻松创建属于自己的桌面工具。用户只需告诉 KroWork 所需的功能,它便能够自动规划步骤,并将结果展示给用户。比如,财务人员可以指示 KroWork “制作发票报销汇总工具”,KroWork 便会生成一个本地应用,能够自动归类发票、校验金额并生成汇总报表。这样的功能极大地提升了工作效率,让用户可以更专注于其他重要事务。 KroWork 的核心优势在于其将重复性工作固化为应用的能力。与其他 AI 产品不同,KroWork 不仅仅是提供一次性的服务,而是将工作流程转化为可以反复使用的本地应用。这样一来,用户只需点击 “运行”,便能轻松完成任务,且无须消耗任何积分或 tok
AI从实验室走向生活,科大讯飞多款黑科技亮相福州
4 月 28 日,第九届数字中国建设峰会在福州海峡国际会展中心正式拉开帷幕。作为国内数字化发展的风向标,本届峰会吸引了众多科技巨头参与。其中,科大讯飞携多项前沿人工智能展项重磅登场,成为展区内最吸睛的“流量高地”,生动诠释了AI技术如何从硬核“炫技”转化为触手可及的实用工具。 在本次展会上,人工智能的应用边界被进一步拓宽。科大讯飞展示的展品横跨了互动体验、办公创作、健康服务、教育及消费电子等多个维度。在办公领域,Loomy办公助手与讯飞智作展现了极高的创作效率;而智能体平台AstronClaw则揭示了未来人机协作的新形态。备受瞩目的具身智能通用机器人更是将AI与物理世界深度融合,标志着人工智能正在向更高阶的形态演进。 除了硬核的工业生产力,AI在民生领域的落地同样出彩。讯飞晓医AI健康助手通过技术手段为大众提供更便捷的医疗辅助建议;讯飞同窗AI黑板与AI学习机则深耕教育场景,利用数字化手段赋能教学互动。此外,最新款的讯飞AI眼镜也集中亮相,为用户提供了全新的视听交互体验。 纵观本次峰会的展项,一个显著的趋势是人工智能正加速脱离单纯的概念炒作,全面进入产业升级与日常生活的每一个角落。从单
#1千问APP首发灰测HappyHorse 可一键做TVB港风短片
千问APP首发灰测HappyHorse 可一键做TVB港风短片 HappyHorse在剧情类视频上具备独特优势,例如叙事能力上,只需一段简单描述,即可自动生成一段多镜头视频,并配合对应运镜与切镜转场;风格表现上,HappyHorse能精准理解并还原老式港片、老电影等多种风格。 内测时,创作者们已在千问APP的AI创作社区将HappyHorse“玩坏了”:例如,用央视老版三国电视剧风格生成“职场废话梗”,让军师劝戒将军“胃疼就多吃点老板画的大饼”;还有网友用《刑事侦缉档案》风格生成了刑警审讯小猫短片,判决“这个月的小鱼罐罐全部发给流浪猫”。 近期,千问APP还将上线“测一测”视频玩法,完成几道简单测试题,就能测出自己在短剧宇宙的“本命角色”;再上传照片,即可通过HappyHorse1.0生成本人“出演”的角色短剧片段。此外,千问将于4月28日启动“天马行空挑战赛”,邀请创作者共同体验。 作为阿里巴巴最新发布的多模态视频生成模型,Happy Horse1.0支持15秒多镜头叙事、多画幅适配及1080P超分输出,并在画面质感、叙事能力、人物表现、音画同步和风格多样性上表现突出,在全球AI圈引
#2OpenClaw发布新版本:DeepSeek V4Flash正式成为系统默认模型
OpenClaw发布新版本:DeepSeek V4Flash正式成为系统默认模型 近日,全球知名开源Agent框架OpenClaw发布v2026.4.24版本,宣布正式接入DeepSeek V4系列模型,并将其轻量化版本DeepSeek V4Flash设为系统默认大脑。作为拥有25万余GitHub星标的顶尖开发框架,OpenClaw此次“易主”标志着中国开源模型在全球Agent生态位中占据了核心主导权。 DeepSeek V4Pro凭借1.6万亿总参数及49B激活参数的MoE架构,稳居全球最大开源模型地位,而V4Flash则以284B总参数在保持极高推理速度的同时,实现了接近Pro版本的逻辑能力,两者均支持高达100万token的上下文窗口。 在功能演进方面,新版OpenClaw显著强化了多模态协作与长链路任务稳定性。通过集成Google Meet并支持实时语音通话,系统实现了从会议授权、实时参与到智能转写、笔记生成的全流程自动化,将AI会议助手从简单的记录工具升级为可独立调用的工作节点。 针对浏览器自动化场景,新版本引入坐标点击与多配置文件独立无头模式,有效解决了复杂网页控件识别难题
#3OpenAI系统提示词遭泄露,新模型GPT-5. 5 严禁讨论“哥布林”
OpenAI系统提示词遭泄露,新模型GPT-5. 5 严禁讨论“哥布林” 科技媒体Ars Technica于 4 月 30 日发布的一则报道引发了AI圈的广泛关注。在最新开源的Codex CLI代码中,OpenAI旗下GPT-5. 5 模型的系统提示词意外曝光,其中包含一条极为古怪的指令:严禁在对话中谈论“哥布林”及“小精灵”等幻想生物 这份长达 3500 多词的基础指令集显示,除非用户查询存在绝对明确的关联性,否则GPT-5. 5 明确禁止讨论哥布林、小精灵、浣熊、巨魔及鸽子等生物。令人费解的是,这一禁令在指令中重复出现了两次,其权重与“禁止执行破坏性命令”等常规准则并列。 技术专家分析认为,这并非某种营销噱头,而是针对特定技术漏洞的“补丁”。近期有大量用户反馈,GPT在处理无关话题时,会莫名其妙地在输出内容中反复提及哥布林。这种针对性的指令,极有可能是为了抑制新模型在生成过程中产生的不稳定性幻觉。 对比早期的模型文件可以发现,这种对特定生物的禁令是GPT-5...
#4别再套用旧指令!OpenAI 发布 GPT-5.5 提示词指南:越简单越好
别再套用旧指令!OpenAI 发布 GPT-5.5 提示词指南:越简单越好 随着人工智能技术的飞速演进,OpenAI 近期为其最新的 GPT-5.5 模型发布了全新的提示词(Prompt)官方指南。这份指南传达了一个核心信号:开发者必须摒弃过去针对旧模型编写的冗长指令,转向更加精简、以结果为导向的沟通方式。 官方建议开发者从零开始构建指令,仅保留目标产出、成功标准和必要约束。与其事无巨细地指挥模型“第一步做什么、第二步做什么”,不如直接告诉它“解决这个问题,成功标准是什么”,让模型利用其增强的推理效率自行寻找最优路径。 有趣的是,曾经在提示词社区引发争议的“角色定义”在 GPT-5.5 时代重新获得了官方认可。OpenAI 推荐了一套包含七个部分的提示词结构,并将“角色定义”置于首位,用于设定模型的身份背景和工作职能。 此外,为了降低流式输出时的感知延迟,指南还建议加入“开场白”机制,即在执行复杂任务前先发送一两句确认信息。这种针对 GPT-5.5 深度优化的策略,不仅能提升模型的逻辑准确性,还能显著改善最终用户的使用体验。 告别通用模型依赖,微软通过定制算法开启垂直领域 AI 助手新
#5韩国政府携手谷歌 DeepMind,共同推动国家科学 AI 研究中心的建立
韩国政府携手谷歌 DeepMind,共同推动国家科学 AI 研究中心的建立 近日,韩国政府与谷歌旗下的人工智能公司 DeepMind 签署了一项重要的合作备忘录,标志着双方将在人工智能(AI)领域展开深入合作。根据报道,韩国科技部与 DeepMind 的协议主要集中在 AI 联合研究、人才培养以及负责任地使用 AI 等方面。 此次合作的核心是即将在 5 月启动的国家科学 AI 研究中心。该研究中心的成立旨在推动韩国在生物、气象、气候等八大领域的技术突破,以增强其在全球 AI 领域的竞争力。这个项目被称为 “K-Moonshot”,是由韩国科技副总 理裴庆勋于今年 3 月启动的,目标是通过攻克国家级难题,提升韩国在 AI 技术上的国际地位,特别是在面对中美两国的竞争时。 此外,双方还将加强在生物科技、气象、气候和 AI 科学家等领域的合作。为了确保合作顺利进行,韩国政府与 DeepMind 计划成立工作组,定期召开视频会议,并每年举行一次线下会议,以保持沟通和协作。 这一合作不仅是为了促进科学研究,还将为韩国的 AI 人才培养提供更为广阔的平台,有助于塑造未来 AI 技术的发展方向。随着
内容创作专业级AI二创萌系IP“咕咕嘎嘎”:从流量爆款到实物变现的全流程路径18.4K查看攻略
AI二创萌系IP“咕咕嘎嘎”:从流量爆款到实物变现的全流程路径 利用AI工具将已有游戏角色或热梗二创为软萌形象,通过社交平台持续发布治愈系短视频积累流量(一个月15亿播放),最终通过售卖周边手办及广告分成实现变现。 主要门槛在于对AI工具的熟练使用以及对“萌点”和“情绪价值”的精准把控。 找一个大家已经知道的游戏角色。就像文本里的“小企鹅”其实是把游戏里的女管理员换了个样子。 选一个好听又洗脑的声音,比如“咕咕嘎嘎”这种模仿小宝宝说话的声音。 画出形象:使用AI绘图工具,把角色变成圆滚滚、软绵绵的小萌物。要让大家一看就觉得“哇,好想抱抱它”。 动起来:使用AI视频生成工具,让这个小企鹅说话、走路或者跳舞。 让它去体验生活:比如今天让它当卖煎饼果子的小摊主,明天让它变成被中介欺负的打工人。 卖好玩的东西:当大家都很喜欢它时,联系厂家做成小挂件、抱枕或者手办放在网上卖。就像文中所说,一个手办就能卖出5000多份。 接广告:像腾讯等大公司可能会找这个小IP合作,这时候就能收广告费啦。 这是一个非常典型的“AI赋能+情绪经济”的成功案例。咕咕嘎嘎的成功并非偶然,它精准地捕捉了现代人压力大、需要
内容创作专业级借势 AI “龙虾风暴”:小红书 OpenClaw 安装教程高收藏变现案例31.4K查看攻略
借势 AI “龙虾风暴”:小红书 OpenClaw 安装教程高收藏变现案例 抓住 AI 圈 “养龙虾” 热潮,针对 OpenClaw 部署门槛高的痛点,制作保姆级安装教程发布在小红书,靠高收藏 / 点赞涨粉,后续通过付费咨询、定制部署等变现。以小红书博主“栗氪聊AI”发布了一篇零基础安装教程,短短几天在小红书获赞2.2万,收藏量4万。 有 AI 技术基础、能清晰拆解操作步骤的技术博主,或愿意花时间研究 OpenClaw 部署的 AI 爱好者,无需高颜值但需有耐心讲解操作。 中等。需先掌握 OpenClaw 部署的核心操作,能看懂基础报错提示,讲解时需把技术步骤转化为小白能理解的语言。 第一步:吃透 OpenClaw 部署全流程(先自己学会再教别人) 先下载 OpenClaw 开源项目,尝试在飞书 / 电脑端部署,记录每一步操作(比如打开哪个页面、输入什么指令)。 刻意踩坑并记录解决方案:比如环境配置报错、API 调用失败的原因,把这些 “踩坑血泪史” 整理成笔记。 确定教程形式:选图文(更易收藏),用手机截图 + 文字说明,每一步配清晰截图(比如飞书工作台页面、代码输入界面)。 再讲部
内容创作专业级利用 OpenClaw 自动化搭建 SaaS 封装工具,实现日入 200 美金的复利业务53.6K查看攻略
利用 OpenClaw 自动化搭建 SaaS 封装工具,实现日入 200 美金的复利业务 中等偏低(不需要深厚的编程功底,但需要具备一定的逻辑思维和基础的 AI 工具调优能力)。 就像雇佣员工前要告诉他服务谁一样。你需要详细告诉 OpenClaw:你的客户是谁?他们有什么烦恼?比如:“我的客户是想用 AI 却不会部署服务器的小白”。方向越细,AI 干活越准。 AI 有时候会胡言乱语,因为他不知道最新的消息。你需要收集你这个行业里最厉害、最准确的文章或文档,做成一个大文件“喂”给 AI。这样它写出的内容和提供的服务就会非常专业,不像机器人。 利用 OpenClaw 封装功能。别人用 AI 需要买服务器、写代码,你直接用 AI 帮他们把这些麻烦事做成一个“网页按钮”。用户点一下就能用,他们自然愿意为了“省事”按月给你付钱。 这是一个非常典型且先进的“一人公司”案例。其成功的核心不在于技术多牛,而在于商业路径的清晰:先通过 AI 自动化解决最难的“流量问题”,再通过降低技术门槛来提供“确定性价值”。 案例中的大佬非常冷静,他没有死磕转化率,而是先跑通从“流量获取”到“产品交付”的闭环。这种“
内容创作专业级AI“邪修”构图法:用AI样片指导实拍,小红书轻松获赞3万+38.1K查看攻略
AI“邪修”构图法:用AI样片指导实拍,小红书轻松获赞3万+ 摄影新手、旅行爱好者、小红书内容创作者、不会摆姿势/构图的普通人 - 就像拍一张干净的背景图,不要有人挡住镜头,天空、建筑、花草都可以 - 打开AI软件(比如豆包的AI功能),点“上传图片”,选中你刚拍的风景照 - 在输入框里写:“请在这个风景里加一个真人模特,站在这里(用手指图上位置),穿红色裙子,手拿咖啡杯,笑得自然,要有电影感” - 点“生成”,等1分钟,AI会变出几张带人物的完美照片,选一张最漂亮的 - 把AI生成的照片给朋友看:“你站这里,我站那里,手这样摆,头歪一点”,像玩过家家一样摆好 - 拍完选最好看的一张,写上“AI帮我找的机位太绝了!”发小红书,容易获赞涨粉 告别通用模型依赖,微软通过定制算法开启垂直领域 AI 助手新范式 微软推出专为法律人士设计的AI工具“法律助手”,集成于Word环境,可自动审查合同、标记风险与义务,并支持跨版本比对,简化合同处理流程。 四大科技巨头2026年 AI 资本开支上调至7250亿美元,同比激增77% 谷歌、亚马逊、微软及Meta计划2026年投入7250亿美元于AI领域,
内容创作专业级跟豆包学穿搭:AI视频通话“翻车感”起号,零粉起号到万粉爆款玩法33.0K查看攻略
跟豆包学穿搭:AI视频通话“翻车感”起号,零粉起号到万粉爆款玩法 利用豆包视频/语音通话的“认真但翻车”反差感,做AI穿搭互动内容,引发强烈娱乐效果和讨论,实现抖音零帧起号、快速涨粉变现。以抖音视频博主“别跟我俩闹了”为例,靠着这种玩法获得4.9万粉丝。其部分视频获得了百万点赞。 不需要穿搭专业知识,不需要剪辑高手,核心是“照着AI做 + 展示翻车效果”。 下载并打开【豆包】,确保可以使用【视频通话/语音通话】功能。 比如:日常上班怎么穿、显胖的人怎么显瘦、小个子穿搭,场景越真实、越普通越好 豆包让你怎么穿,你就怎么穿,不管多离谱,都完整执行,这是视频好笑的关键。 镜头对准全身,用夸张但真实的表情,让观众一眼看出“翻车了”。 这个案例的核心不在“AI多聪明”,而在“AI不完美”。豆包一本正经输出专业建议,却频频制造喜剧反差,让观众产生强烈情绪反馈和参与欲。对新手来说,这是极低成本、高容错率的内容模型:不需要专业能力,只要真实执行AI指令,就能自然制造爆点,非常适合当下短视频平台的算法偏好。 告别通用模型依赖,微软通过定制算法开启垂直领域 AI 助手新范式 微软推出专为法律人士设计的AI