AI Digest 日报 · 2026/05/15

手机能接管 Codex,编程 Agent 不等人回桌前。

Codex 手机端远程控制、Claude Agent SDK 额度、SenseNova-U1、多模态浏览器操作实践和 Ramp 企业采用数据,把今天的重点推向同一件事:AI 的产品化正在从能力展示进入成本、边界和真实使用率的核算。

OpenAI 把 Codex 接进 ChatGPT 手机端,开发者可以在路上继续线程、批准动作、看 diff 和测试结果。Coding Agent 的关键入口,正在从桌面工作台延伸到随身审批和异步接管。

今日关键词
Codex Mobile 远程审批 Agent 成本 Claude SDK 多模态模型
01

OpenAI 将 Codex 远程控制接入 ChatGPT 手机端

OpenAI 在 2026 年 5 月 14 日的 ChatGPT release notes 中宣布,Codex remote access 已进入 ChatGPT 手机应用预览版。用户可以在 iOS 和 Android 上连接正在运行的 Codex 工作,从手机继续线程、回答 Codex 提出的问题、改变任务方向、批准动作、查看发现结果,并在已连接主机之间切换。

这条更新的重点,是把手机变成 Coding Agent 的远程控制面板,而非把代码库搬到移动端。Codex 仍在连接的 Mac 主机上运行,手机端加载现场上下文,包括项目上下文、审批、插件、截图、终端输出、diff 和测试结果。设置从主机上的 Codex App 开始,通过扫码接到 ChatGPT;远程访问期间,主机需要保持唤醒、在线并运行 Codex。

这让 Codex 的使用方式更像异步协作:Agent 可以继续在桌面环境里跑调查、改代码、执行测试,人不必一直守在键盘前。真正需要人的节点,比如批准命令、选择方向、复核输出、决定是否继续,就可以在手机上完成。

对工程团队来说,这种移动端接管会改变 Agent 工作流的节奏。长任务、CI 修复、线上问题排查和多线程改动,都更容易被拆成“机器持续推进、人随时决策”的循环。它也提醒我们:一旦 Agent 能离开桌面继续工作,权限、审批、日志和上下文展示会变成移动端体验的核心。

原文:OpenAI Help Center · ChatGPT Release Notes
02

Anthropic 调整 Claude Agent SDK 订阅用量规则

Anthropic 在 Claude 帮助中心说明,从 2026 年 6 月 15 日开始,Claude Agent SDK 和 claude -p 的用量将不再计入普通 Claude 订阅的使用限制。付费计划用户可以领取专门面向程序化调用的月度额度,覆盖 Agent SDK、命令行非交互式调用、Claude Code GitHub Actions,以及基于 Agent SDK 并通过 Claude 订阅认证的第三方应用。

这个变化把交互式使用和后台自动化调用分成两条账。Claude 聊天、Claude Code 常规使用和 Cowork 仍按原订阅限制走;自动化任务会消耗新的 Agent SDK credit。额度用完后,如果启用了额外用量,后续调用会按标准 API 费率计费;否则相关程序化使用会暂停。

新闻细节
01 · 后台调用需要单独预算 当 Agent 进入脚本、CI、数据整理和第三方工具,用量就会变成工程预算问题,而不只是个人订阅体验。
02 · 超额计费让边界更明确 额度、暂停和超额计费机制会迫使团队提前设定调用频率、重试策略、审批点和责任归属。
03 · 长期运行先要有账本 能长期跑的 Agent 需要可持续的成本模型。能力验证之后,下一步就是把失败重试、人工确认和预算上限设计进去。
原文:Claude Help Center · Use the Claude Agent SDK with your Claude plan
03

商汤发布 SenseNova-U1 原生多模态技术报告

商汤相关团队在 arXiv 发布 SenseNova-U1 技术报告,介绍一套名为 NEO-unify 的原生统一多模态范式。报告把图像理解、图像生成、编辑和跨模态任务放到同一个训练框架里,而不再把“看图”和“生图”拆成完全独立的模型管线。

论文给出两个主要变体:SenseNova-U1-8B-MoT 和 SenseNova-U1-A3B-MoT,后者采用混合专家结构,总参数约 30B、激活参数约 3B。报告强调统一建模、无 VAE 的像素级流匹配、联合自回归训练以及后训练流程,目标是在理解和生成之间减少任务切换损耗。

新闻细节
01 · 统一模型减少管线割裂 多模态应用过去常把识别、理解、编辑和生成分成不同服务。统一模型如果稳定,会让产品链路更短,工程集成也更直接。
02 · 小激活参数利于成本控制 A3B-MoT 的重点是总容量和单次激活成本之间的折中。这类结构如果验证充分,适合关注推理成本的多模态产品团队跟进。
03 · 仍要看真实产品可用性 技术报告说明了训练方法和评测结果,但生成质量、编辑稳定性、中文场景表现和部署成本仍需要在真实任务里复核。
原文:arXiv · SenseNova-U1: Unifying Multimodal Understanding and Generation with NEO-unify Architecture
04

Anthropic 发布 Claude 电脑与浏览器使用最佳实践

Anthropic 发布 Claude 电脑与浏览器使用最佳实践,面向正在构建 computer use、browser use 或自动化点击系统的团队。文章把问题落到截图分辨率、坐标返回、动作标注、任务拆解和安全门控等工程细节上,重点是让“会操作电脑”变成可复核、可控制的系统能力。

官方建议在发送截图前按模型能力缩放:Claude 4.6 系列长边上限为 1568 像素,Opus 4.7 可到 2576 像素;每次动作都会产生新图像并消耗 token,因此分辨率、裁剪范围和标注方式会直接影响成本与准确率。

新闻细节
01 · 点击可靠性来自可解释坐标 文章建议为点击生成可读描述,并在截图上标注点击位置。这样人和系统都能复核 Agent 为什么点这里。
02 · 分辨率是成本和准确率旋钮 高分辨率能保留细节,但每张图都会增加 token 消耗。产品需要按任务选择截图范围,避免默认发送原始全屏。
03 · 设备云控制也需要同类护栏 智能家居、客服后台和安装调试工具一旦引入视觉点击 Agent,也需要日志、人工确认、权限隔离和失败回退。
原文:Claude · Best practices for computer and browser use with Claude
05

Ramp AI Index 显示 Anthropic 企业采用率超过 OpenAI

Ramp 发布 2026 年 5 月 AI Index,称在其样本中,Anthropic 于 4 月首次超过 OpenAI,成为付费企业采用率最高的 AI 模型供应商。Ramp 给出的数字是:Anthropic 采用率升至 34.4%,OpenAI 降至 32.3%。

这组数据来自 Ramp 企业支出样本,不能直接等同于全市场份额,但它提供了一个有价值的早期信号:企业客户正在把 Claude 从尝试工具放进日常采购和报销体系。模型竞争的观察点因此不只剩参数、榜单和发布会,还包括谁能进入预算、合规、采购和岗位流程。

新闻细节
01 · 这是支出样本里的采用率 Ramp 指标反映其客户支出数据中的变化,更适合看趋势和企业采购方向,不宜直接推成全球市场份额。
02 · Claude 的企业叙事更清晰 近期 Claude 围绕 Agent SDK、Cowork、企业连接器和代码工作流持续补齐商业入口,这有助于采购侧形成明确用途。
03 · 领先幅度仍然很窄 34.4% 对 32.3% 是一个重要拐点,但差距不大。OpenAI 的消费者入口、开发者生态和企业产品仍可能快速改变格局。
原文:Ramp · AI Index May 2026