AI Digest 日报 · 2026/05/13

Google 想让鼠标指针，变成 AI 的手。

Google 的 AI pointer、Statewright 的状态机约束、Claude 的行业连接器和安全运营工具，都在把 AI 推向更贴近屏幕、流程和专业系统的位置。

Google DeepMind 展示了一组围绕鼠标指针的 AI 交互实验：用户可以用动作、语音和简短指令，让 Gemini 理解屏幕对象并执行下一步。今天的重点是这类系统级入口本身：AI 不只存在于独立聊天窗口，也可以嵌进用户正在操作的界面。

今日关键词

AI 指针系统入口状态机 Agent 行业插件安全运营

Google DeepMind 展示 AI 鼠标指针实验

Google DeepMind 这次展示的是一组围绕“鼠标指针”的 AI 交互实验。它没有把 AI 做成新的聊天窗口，而是从桌面上最基础的操作对象入手：用户移动指针、圈选对象、配合语音或简短文字，Gemini 就能理解屏幕上的目标，并给出对应动作。公开演示里，指针不再只是定位工具，而是承载上下文、意图和操作入口的界面元素。

这组实验覆盖了几种常见动作：通过手势或简写表达“处理这里”，让 AI 识别当前屏幕对象；在复杂界面里直接指向某块内容，请 Gemini 解释或操作；把语音意图和屏幕位置结合起来，减少重新描述上下文的步骤。它强调的是“就地交互”：用户不需要先打开另一个 AI 页面，再把当前界面发生的事情复述一遍。

这类设计还有明显边界。它目前更像研究和原型演示，并不等于一个已经普及到所有操作系统里的成熟产品；AI 是否能稳定理解屏幕对象、是否会误操作、系统如何确认高风险动作，都还需要产品层面的约束。但方向很清楚：AI 能力正在靠近用户正在看的界面，而不是只停留在文本对话框里。

对智能家居和企业工具来说，可以先把它理解为交互入口的提醒：很多 AI 功能未必从“问一句话”开始，而可能从 App 控件、设备面板、安装调试页面、摄像头时间轴或售后工作台里的一个对象开始。

原文：Google DeepMind · Reimagining the mouse pointer for the AI era

Statewright 用状态机约束 Agent 工作流

Statewright 是一个开源项目，目标是用可视化状态机约束 AI Agent 的工作过程。它把一次任务拆成不同阶段，例如规划、实现、测试、修复，并为每个阶段限定可用工具和下一步转移条件。这样做的目的，是避免 Agent 在还没完成规划时就开始乱改代码，或在测试阶段继续调用不该使用的工具。

项目说明里给出的核心机制，是把 Agent 工作流从一段长提示词改成一张状态图。每个节点代表一个阶段，每条边代表允许的流转，工具权限也跟着状态变化。Statewright 还展示了本地模型在 SWE-bench 子任务上的测试结果，用来说明约束式流程可能提升任务完成率，不过这类数字仍应视为项目演示，不宜当作通用结论。

新闻细节

01 · 它解决的是流程失控问题 Agent 做复杂任务时，经常会跳步骤、重复尝试、过早调用工具。Statewright 的思路是先限定“现在处在哪个阶段”，再决定可以做什么。

02 · 状态图让过程更容易观察 相比把所有规则写进一段提示词，状态图能让团队看到任务从规划到测试的路径，也更容易定位失败发生在哪一步。

03 · 适合先用在可验证任务 代码修复、测试失败处理、文档更新这类任务有明确完成标准，更适合用状态机约束。开放式创意任务未必需要这么强的流程框架。

原文：GitHub · statewright/statewright

Claude 通过 MCP 连接器接入专业工作流

Claude 面向专业行业的扩展，重点在于把模型接入真实工作软件，而不是只提供一个通用聊天入口。法律场景里，用户处理的是合同、邮件、Word 文档、条款比对、审阅意见和案件材料；如果 AI 不能访问这些系统，就只能停留在“帮我写一段文字”的层面。

Anthropic 当前公开的 MCP connector 文档说明了这种方向：Claude 可以通过连接器访问外部工具和数据源，让企业把已有系统接入模型工作流。对法律、财务、安全、客服等岗位来说，插件和连接器的价值在于保留原有工作软件，同时让 AI 在这些软件之间读取信息、生成草稿、比对内容或汇总结果。

新闻细节

01 · 连接器负责把模型接到系统上 MCP connector 的作用，是让 Claude 访问外部数据和工具。模型不必替代原有系统，而是在原有系统之上完成查询、生成和整理。

02 · 专业场景需要固定动作 合同审阅、条款比对、邮件起草、材料摘要都不是一次性聊天，它们有固定输入、输出格式和审批责任，因此更适合被封装成插件或技能。

03 · 权限和审计会跟着重要起来 一旦 AI 能读取合同、邮件和客户资料，企业就需要知道它访问了什么、输出了什么、由谁确认。连接能力和治理能力要一起设计。

原文：Anthropic Docs · MCP connector

Anthropic 安全团队用 Claude Code 辅助告警调查

Anthropic 安全相关材料展示了 Claude Code 在内部安全运营里的用法：安全团队把自然语言界面接到告警、日志、上下文信息和调查流程上，让分析师可以用问题驱动查询，而不是在多个系统里手动拼接线索。相关案例把平台称为 CLUE，用于告警初筛、上下文整理和调查辅助。

这类系统的工作方式通常分两层：第一层把告警、日志、用户、资产和历史处置记录整理到同一条调查链路里；第二层让模型帮助生成查询、归纳结果、给出初步判断或下一步建议。真正的安全处置仍需要人工确认，尤其是涉及账号权限、生产环境和客户数据的动作。

新闻细节

01 · 它面向的是安全分析流程 平台围绕真实告警工作展开：先看告警，再补上下文，再查日志，最后形成调查结论或处置建议，重点不在单纯回答安全知识。

02 · 自然语言查询降低取证成本 安全分析师可以描述要查的问题，由系统生成或执行查询，再把多处日志汇总回来。这能减少重复检索，但不取消复核。

03 · 这类工具必须记录访问和判断 安全平台会接触敏感日志和账号线索，因此需要记录谁发起查询、AI 读取了哪些数据、生成了什么结论，以及最终由谁确认。

原文：Anthropic · Claude Code