五月第一周, Anthropic 在 Code w/ Claude 2026 上甩出本年度最大的算力交易: 跟 SpaceX/xAI 签下 Colossus 数据中心 300MW / $5B/yr 的独家容量, ARR 年化增速 8000%. 同期 Claude Mythos preview 被 Mozilla 拿去给 Firefox 找漏洞, 抓出"几百个"由 AI 生成、质量好到令人不安的报告 — Simon Willison 评 "suddenly the bugs are very good"; METR 那张"AI 任务长度翻番周期"的图也被 Mythos 直接顶破图表上限. 一周之内, "前沿 coding agent 实际能动手修真实生产代码的能力" 被两件事同时坐实, 不再是论文段位的故事.
OpenAI 这边走的是另一条剧本: 集中发了 GPT-5.5 Instant (ChatGPT 新默认 + system card), GPT-5.5-Cyber (面向防御方 Trusted Access), GPT-Realtime-2 / -Translate / -Whisper 三件套 SOTA 语音 API, 以及为大规模训练集群推开源的网络协议 MRC (Multipath Reliable Connection) (走 OCP). 同时一脚踩进商业化深水: ChatGPT 开始测试广告 + 自助 Ads Manager + CPC 竞价, 配合 Trusted Contact 安全功能与 PwC / Uber / Parloa / Singular Bank / Simplex 一连串企业落地案例. 这周 OpenAI 把"模型 + 商业化 + 基础设施 + 安全"四条线压在同一波 release window.
反方阵营声量也罕见地大: Gary Marcus 连发 "Autonomous Agents are a Shitshow" + "Agents and ROI" + "Misplaced panic over AI progress" (拆 METR 那张图); Ed Zitron 在 wheresyoured.at 双开火 "AI's Circular Psychosis" 和 "The AI Compute Demand Story Is A Lie" (称当下产能紧张不是真实需求, 是 hyperscaler 失衡); Joan Westenberg 写下"快 vs 合法之战"; Sean Goedecke 反向给出 "AI makes weak engineers less harmful" 的乐观视角. 安全侧 Canvas 数据外勒索 横扫全美 9000 所学校 / 275M 学生数据, 配合 ShinyHunters 持续突破大牌防线, 教育与企业供应链同时被点亮. 商业八卦: Y Combinator 持有 OpenAI 0.6% (Gruber 顺线挖出, 按 $852B 估值反推近 $5B), NYT 法庭文件曝 Google 持有 Anthropic 大块股权, 两家"中立"母 VC 一边被点名利益冲突.
Mozilla 拿到 Claude Mythos preview 后用它定位并修复 Firefox 数百个漏洞. Simon 引用原文最关键的一段是 "Suddenly, the bugs are very good" — 几个月前 AI 生成的安全报告多半是 known-bad slop, 现在质量从噪声跳到信号. Anthropic 同期在 Code w/ Claude keynote 直接展示这件事.
📌 推荐理由: AI security research 从 "演示能跑" 跨到 "能在工业级 codebase 持续产出真 CVE" 的临界点. 对所有维护开源项目的人, 这是一条要把 "AI 报告默认 dismiss" 策略改回 "默认认真审" 的信号; 对蓝队 / red team, 工具栈要重排.
Anthropic 跟 SpaceX/xAI 签下"占用 Colossus 全部容量"的合同, Latent Space 同周深度: 300MW / $5B/yr / ARR 增速 8000% 年化. Colossus 即 Musk 那座因燃气轮机污染许可被诟病的孟菲斯数据中心. Simon 称这是当天 keynote 之外最大新闻.
📌 推荐理由: AI 产能向少数几个 hyperscale site 集中的最新一步. 同时让 "Anthropic 的环保叙事" 与 "Colossus 的环境争议" 产生直接冲突, 后续社运 / 监管侧会持续发酵. 对独立厂商, 算力垄断进一步加深.
ChatGPT 的默认模型升级到 GPT-5.5 Instant, 主打 reduce hallucination + 个性化控制. 同步发了 system card. 配套 OpenAI 把 Codex 在自家内部安全运行 的细节 (sandboxing / approvals / network policies / agent-native telemetry) 也写成单独博客 — 跟 Anthropic 的 "harness 层 bug 复盘" 形成对照.
📌 推荐理由: 主线模型节奏没停. 5.5 Instant 即上即用, 比 5.5 thinking 更直接影响普通用户体感. Codex 安全运行那篇是少见的"前沿 lab 内部 agent harness 防护"参考资料, agent 系统开发者值得读.
OpenAI 把自研的 supercomputer 网络协议 MRC 通过 OCP (Open Compute Project) 开源, 解决大规模训练 fabric 的可靠性与性能问题. 一个高度软件化、走 multipath 的传输层, 替代部分 RDMA / RoCE 路径.
📌 推荐理由: AI infra 的"软件定义 fabric"信号. 大模型训练规模逼近物理 fabric 极限, 协议层一旦开源, 会改变 NVIDIA / Broadcom / Cisco 的话语权分配. 关注 systems / networking 的工程师值得跟一波.
Flask 作者 Armin 写一篇长文, 论证 "为什么我真的想让 local model 能用". 不是技术 review, 是关于"把试验门槛锁在 hosted API 后面, 普通开发者会被永久排除在 AI 实验之外"的论点. 反方对照: Reddit r/LocalLLaMA 同周热帖 "Hugging Face co-founder says Qwen 3.6 27B 飞机离线模式 ≈ Claude Code Opus" (1736 upvotes).
📌 推荐理由: 开源 / local 模型这周不是没新东西, 而是开始有"接近商用 hosted 体感"的真实证据. 这条搭 IBM Granite 4.1 / NVIDIA Star Elastic / Qwen 3.6 系列 release 一起读, 是本周开源侧的主线.
Anthropic 一年一度的主场, Simon 拿出多年开发者会议直播经验给出了最完整的现场记录. 除了 Mythos / Colossus, 还有 Claude Code 工具链更新、企业落地案例. 配套阅读: Simon 同日的 "Using Claude Code: The Unreasonable Effectiveness of HTML" — Anthropic 内部团队 Thariq Shihipar 提出让 Claude 输出 HTML 而不是 Markdown 作为标准 agent 输出格式的论证.
📌 推荐理由: 这是本周 AI 产品/agent 工程的事实底稿. Code w/ Claude 是 Anthropic 一年中影响 roadmap 最深的窗口, 直接关系 babata 自身 (跟 Claude Code 同源) 的能力边界.
Canvas (美国 K-12 / 高校广用的 LMS) 遭数据勒索, 275M 学生 / 教职工数据, 近 9000 所学校 受影响. 攻击者直接把 ransom note 改到登录页. Troy Hunt 同周 weekly update 把 ShinyHunters 持续高产单独点出 — 表面是"low-tech 青少年组织", 战果却持续突破大品牌, 杠杆比令传统 APT 都难看.
📌 推荐理由: 教育垂类 + 供应链双重指标事件. SaaS 服务一旦成为某个垂类的事实垄断, 它就是单点风险, ed-tech 这次被实打实地验证一次.
Zitron 论点: 当前 AI 行业"算力告急"叙事不是真实需求驱动, 是 hyperscaler 在堆产能、消化资本支出的副产品 — Anthropic 没钱付云账单, 只在别人也付钱时才付. 同期他还有 "AI's Circular Psychosis" 阐述同一逻辑. 一周里 Gary Marcus 也连发三篇 (Agents and ROI / Autonomous Agents are a Shitshow / Misplaced panic over AI progress).
📌 推荐理由: 这周反方阵营声量是过去半年最大, 跟 Anthropic 8000% ARR 的乐观叙事形成强对照. 不一定全对, 但所有做 AI infra / agent 业务规划的人都该读一遍当压力测试.
ClawHub 这一周仍是 skill 生态高频更新, 整体趋势两条线:
自演化 / harness 类 skill 是高下载量主力:
- self-improving-agent v3.0.21 (Captures learnings/errors/corrections) — 持续在 high downloads
- self-improving v1.2.16 (self-reflection + self-criticism + self-learning) — 同向
- proactive-agent v3.1.0 — 把 task-follower 转成 proactive
- ontology v1.0.4 — typed knowledge graph for structured agent memory
安全 / 审计 类强势:
- skill-vetter v1.0.0 — 三方 skill 安全 gate
- skillscan v1.1.6 — 新 skill 上线必跑
- publish-skill-vettr v2.0.3 — 静态分析安全扫描
新发布有意思的几个:
- meta-healing v0.1.2 / runtime-doctor v0.1.3 — 本地 OpenClaw runtime/config drift 诊断
- regenerative-intelligence v1.0.0 — energy-efficient harm-reducing memory
- ambient-stamina v1.0.1 — rest / sleep 智能调节
- novel-multi-agent-skill v1.0.0 — 多 agent 协作小说创作
- superwise-drift-detection-skill v1.0.0 — 表格 ML 模型特征漂移检测
- huo15-openclaw-enhance v6.5.7 — "subagent 累加 + 预测式提醒" 上下文守护
- base-stable-arb-radar v0.1.3 — Base 链稳定币套利 (read-only)
- iris-pro v1.0.1 — Gmail inbox intelligence
- video-editing-ai-tool v1.0.0 — 3 min 屏幕录像 → 10 min 视频
- ai-diabetes-coach v1.0.4 — 糖尿病康复 (中文)
- local-knowledge-retrieval v3.0.5 — local-first 文档搜索 (PPT/PDF)
热门趋势上 14h 前一批官方 skill (sonos / gog / github / weather / whisper / notion / obsidian / gemini / mcporter) 集中上架, 说明 ClawHub 在补齐主流系统集成入口.
| 指标 | 值 |
|---|---|
| RSS 文章数 | 179 |
| 社区热帖 | 36 (HN 2 + GitHub 12 + Reddit 22) |
| ClawHub 新发布 | 20+ |
| 必读精选 | 8 |
| 全部精选 | 120+ |
| 覆盖窗口 | 168 小时 (May 4 - May 10) |
| RSS 源 | 103 / 107 成功 |
| 原始抓取量 | 4595 |