TOPIC 01
Claude Code 上 Computer Use:终端里直接操控 Mac 桌面
Anthropic 给 Claude Code 加了 computer use 能力——写完代码可以直接编译、启动应用、点击 UI、截图验证,整个闭环不离开终端。目前是 research preview,仅 macOS,需 Pro/Max 订阅。每个应用单独授权,终端窗口不会被截图,Esc 全局中断。官方推文 40K+ 赞。
我的看法:填补了 Claude Code 最明显的缺口——之前能写代码、跑命令,但涉及 GUI 操作就束手无策。"写代码→编译→测试→修 bug→再验证"串成完整闭环。限制不少:不支持 Linux/Windows,不能用非交互模式。对 Tanka 桌面端开发效率有直接影响。
TOPIC 02
OpenAI 把 Codex 插件打进 Claude Code
OpenAI 官方发布 codex-plugin-cc,在 Claude Code 里直接调用 Codex 做代码审查、对抗性审查、任务接管。三个核心命令:/codex:review /codex:adversarial-review /codex:rescue。OpenAI 主动把 Codex 送进 Anthropic 生态。
我的看法:竞争白热化的标志——不是你死我活,而是互相渗透。Claude Code + Codex 双引擎代码审查等于有了"第二意见"。但 review gate 可能导致两个 agent 循环调用烧额度,建议只开 review 不开 gate。
TOPIC 03
Qwen3.5-Omni:阿里原生全模态,视频直接写代码
阿里发布 Qwen3.5-Omni,215 项音视频任务超越 Gemini-3.1 Pro。最大亮点 "Audio-Visual Vibe Coding"——给它看界面视频直接生成代码,模型自发涌现的能力。支持 256K 上下文、113 种语言。每百万 token 输入不到 0.8 元。
我的看法:"看视频写代码"如果能稳定复用,对需求沟通场景是颠覆性的——客户拍操作视频就能出原型。建议关注 API 实际可用性。
TOPIC 04
CLI 大爆发:飞书、企微、Google 争相开源 Agent CLI
飞书开源 lark-cli、企业微信开源 wecom-cli、Google 开源 gws。所有想接入 Agent 的产品都在做 CLI。原因:CLI 自描述(AI 敲 --help 就知道怎么用),比 API 更适合 Agent,比 GUI 更高效。支持 dry-run、结构化输出、错误自动修复指引。
我的看法:CLI 是入口不是护城河,真正价值在 Agent 层。但对 V 来说确实降低了集成成本——飞书 CLI + Claude Code = 终端指挥 Agent 操作飞书。Tanka 如需用飞书/企微做内部工具,现在是最佳接入时机。