X 每日精华

629 条推文 · Following + ForYou
🔍 关键词热点 气泡大小 = 提及次数 · 颜色 = 互动热度 · 482 条推文
TOPIC 01

Claude Code 上 Computer Use:终端里直接操控 Mac 桌面

Anthropic 给 Claude Code 加了 computer use 能力——写完代码可以直接编译、启动应用、点击 UI、截图验证,整个闭环不离开终端。目前是 research preview,仅 macOS,需 Pro/Max 订阅。每个应用单独授权,终端窗口不会被截图,Esc 全局中断。官方推文 40K+ 赞。
我的看法:填补了 Claude Code 最明显的缺口——之前能写代码、跑命令,但涉及 GUI 操作就束手无策。"写代码→编译→测试→修 bug→再验证"串成完整闭环。限制不少:不支持 Linux/Windows,不能用非交互模式。对 Tanka 桌面端开发效率有直接影响。
TOPIC 02

OpenAI 把 Codex 插件打进 Claude Code

OpenAI 官方发布 codex-plugin-cc,在 Claude Code 里直接调用 Codex 做代码审查、对抗性审查、任务接管。三个核心命令:/codex:review /codex:adversarial-review /codex:rescue。OpenAI 主动把 Codex 送进 Anthropic 生态。
我的看法:竞争白热化的标志——不是你死我活,而是互相渗透。Claude Code + Codex 双引擎代码审查等于有了"第二意见"。但 review gate 可能导致两个 agent 循环调用烧额度,建议只开 review 不开 gate。
TOPIC 03

Qwen3.5-Omni:阿里原生全模态,视频直接写代码

阿里发布 Qwen3.5-Omni,215 项音视频任务超越 Gemini-3.1 Pro。最大亮点 "Audio-Visual Vibe Coding"——给它看界面视频直接生成代码,模型自发涌现的能力。支持 256K 上下文、113 种语言。每百万 token 输入不到 0.8 元。
我的看法:"看视频写代码"如果能稳定复用,对需求沟通场景是颠覆性的——客户拍操作视频就能出原型。建议关注 API 实际可用性。
TOPIC 04

CLI 大爆发:飞书、企微、Google 争相开源 Agent CLI

飞书开源 lark-cli、企业微信开源 wecom-cli、Google 开源 gws。所有想接入 Agent 的产品都在做 CLI。原因:CLI 自描述(AI 敲 --help 就知道怎么用),比 API 更适合 Agent,比 GUI 更高效。支持 dry-run、结构化输出、错误自动修复指引。
via dotey · op7418
我的看法:CLI 是入口不是护城河,真正价值在 Agent 层。但对 V 来说确实降低了集成成本——飞书 CLI + Claude Code = 终端指挥 Agent 操作飞书。Tanka 如需用飞书/企微做内部工具,现在是最佳接入时机。
  • Claude Code 用量暴增限流 + Auto Mode 上线 Enterprise — Claude Code 用量暴增限流 + Auto Mode 上线 Enterprise
  • Google Veo 3.1 自拍克隆生成 1080p 视频 — Google Veo 3.1 自拍克隆生成 1080p 视频
  • Claude Mythos 5.0 演示:90 分钟发现 Linux 内核 20 年漏洞 — Claude Mythos 5.0 演示:90 分钟发现 Linux 内核 20 年漏洞
  • Google 研究:推理模型自发内部辩论 — Google 研究:推理模型自发内部辩论,robust reasoning 是 social process
  • Cognition 工程师 3-6 个月前停止写代码 — Cognition 工程师 3-6 个月前停止写代码
  • Pretext:React 元老文本布局引擎 — Pretext:React 元老文本布局引擎,比 DOM 快 500 倍
  • Agent Watch — Apple Watch 控制 Claude Code
  • cc-connect — 连接 AI Agent 到 Slack/Telegram/Discord
  • Review Swarm — 4 Agent 并行代码审查,输出优先级清单
  • Qwen3.5-27B 蒸馏版 — 16GB 显卡可跑,HF 连续 3 周 #1
  • Gemini 一键导入 ChatGPT/Claude 记忆 — Gemini 一键导入 ChatGPT/Claude 记忆
  • Claude Code Computer Use 试用 — Tanka 桌面端/Electron 场景可试
  • 飞书 CLI 接入 — Agent 操作飞书,值得评估
  • Codex 插件审慎使用 — 只开 review 不开 gate
编码范式的终结
The best engineers don't choose an approach - they try everything and compare the results.
Russell Kaplan · Cognition
💭 当 AI 能并行执行所有方案时,"选择最佳方案"这个人类决策瓶颈被消除了。真正的竞争不是选择力,而是评估力。V 做技术决策时,与其花一周讨论方案 A vs B,不如让 CC 同时实现两个,跑完测试看数据。
AGI 的本质是 Harness
AGI will have a harness.
Harrison Chase · LangChain
💭 一句被大量转发的断言。模型能力是引擎,harness 是变速箱。光有引擎跑不了车。V 构建的整个 OpenClaw 体系本质上就是在造 harness——skill 编排、agent 调度、loop/hook/cron,这才是真正的价值所在。
智能不是单一维度
More operational knowledge means you need less intelligence to be competent.
François Chollet · Keras 之父
💭 Chollet 的洞察:coding agents 能验证自己的输出、模拟代码执行,"能力"确实增强了。但对智能的需求反而在降低——因为知识和工具补偿了推理。这对 AI 时代的人类同样适用:与其追求"更聪明",不如追求"信息更全面"。
注意力才是稀缺资源
盯着一个 AI 干活,一次只干一件事。
💭 人每次切换 Agent 都要重新拾起上下文,这是对精神的消耗。人是逃避痛苦的动物,一感到不适就开始逃避——最舒服的选择就是回答"继续",然后 AI 跑偏了也不知道。这个朴素的道理比任何 multi-agent 架构设计都重要。
连续性比速度更珍贵
AI 让速度越来越便宜,与此同时,连续性显得越来越珍贵。
💭 从湖南山村修车学徒到估值 10 亿公司,张雪 20 年在推同一堵墙。AI 时代所有人都在追求快,但"快不等于积累,很多快是高频归零"。真正升值的是用户关系、真实反馈、行业理解——那些能层层叠加的能力。
学会两周,精通一生
'You can learn anything in 2 weeks' only if you realize learning and mastering are two very different things.
💭 那个两周只是第一步。真正的精通是迭代过程——填补知识缺口、拓展理解,需要几个月。但第一步确实能超过大多数人。"大多数人高估了精通的门槛,低估了两周死磕的威力。"
信任的 Provenance
Wikipedia 限制 AI 写作,不是因为 AI 写得不准。是因为 AI 写的东西没有「作者」。
💭 每条 Wikipedia 编辑有人名、时间戳、来源——这条链断了,内容就失去可信度。AI 产品的信任问题本质上是 provenance 问题。这个洞察对任何构建 AI 内容系统的人都是核心挑战。
Harness > Model能力的瓶颈不在模型,在于如何编排和调度
并行试错取代选择AI 时代最优策略是同时跑多个方案再比较
注意力管理 > Agent 数量一次盯一个 AI 比同时管十个更高效
连续性 > 速度长期可叠加的能力远比短期迭代珍贵
Provenance 是信任基石没有来源链的内容将被质疑