X 每日精华

658 条推文 · Following + ForYou
🔍 关键词热点 气泡大小 = 提及次数 · 颜色 = 互动热度 · 479 条推文
TOPIC 01

Claude Code 源码泄露:三层反蒸馏、七层记忆、隐藏功能全面曝光

昨天 Anthropic 因 NPM source map 发布失误,Claude Code 的 50 万行源码被还原(Anthropic 已确认是 human error)。社区在 24 小时内完成了疯狂分析,Python 版移植、free-code 翻译、cc-gateway 反追踪工具全出来了。 **三层反蒸馏机制:** 宝玉的深度分析揭示了 Anthropic 防竞争对手 API 蒸馏的三层防护。第一层,API 输出中掺入虚假工具调用,正常用户由服务端过滤,但批量抓取做训练就会污染模型;第二层,把中间推理文本替换为摘要加密签名,外部观察者只能看到摘要,拿不到完整推理链;第三层,Claude Code 用独立 JSON 协议格式与 API 通信,与每周 920 万次普通 API 请求统计隔离,竞品无法伪装成 CC 获取特殊待遇。 **七层记忆架构:** shao__meng 分享了 @evermind 团队 @troyhua 的解读,CC 的记忆系统从 Layer 1 工具结果持久化(超阈值落盘 + 上下文仅保留 2KB 预览)到 Layer 6 Dreaming(后台跨会话记忆整合,类比人类睡眠),层层递进。所有决策都以保护 prompt cache 为前提。 **隐藏功能:** 源码中发现未发布功能包括 next model Capybara(被要求避免过度评论)、UNDERCOVER mode(团队可秘密向公共仓库贡献代码)、Ultraplan 模式(10-30 分钟异步多 Agent 规划)、buddy 伴侣精灵(愚人节彩蛋)等。frustration detection regex(检测用户骂街后调整回复风格)成为最大 meme。 **反方观点:** 铁锤人(lxfater)认为 CC 代码泄露意义不大:底层还是模型问题,Codex 是开源的,还有 OpenCode 等参考。混淆后的 50 万行代码想还原到能运行,现在 AI 也做不到。真正值钱的是模型能力,不是框架代码。
via dotey (宝玉) (283 ❤️,三层反蒸馏机制深度分析) · shao__meng (七层记忆架构完整解读) · Hesamation (Capybara、UNDERCOVER mode 等隐藏功能) · Hesamation (Anthropic 官方回应) · vikingmute (Viking) (frustration detection regex 分析) · lxfater (铁锤人) (165 ❤️,反方:底层还是模型)
我的看法:三层反蒸馏机制设计思路和我们在 Tanka 做 Arena 的多视角防护类似——都是在数据传输层面做手脚。但最有价值的是七层记忆架构:对于 Agent 算法工程师,Layer 1(工具结果持久化)和 Layer 3(Session Memory 分叉提取)是成本最低、效果最直接的两层。我们的多轮对话上下文膨胀问题可以直接借鉴这个思路——不一定是 7 层,但「成本最低优先」的原则是金。另外泄露出来的 Ultraplan 模式(10-30 分钟异步规划)才是 Agent 处理复杂任务的真正方向,不是什么 chat.
TOPIC 02

OpenAI 完成 1220 亿美元融资,AI 融资进入单轮千亿美元时代

OpenAI 官方宣布完成 1220 亿美元融资(史上最大单轮私募),投后估值 8520 亿美元。同时公布的业务数据:当前月收入 20 亿美元(从季度 10 亿到月 20 亿只用数月)、增速是 Google 和 Meta 同期的 4 倍、9 亿周活用户、5000 万付费订阅、搜索功能年增 3 倍、广告业务 6 周内 ARR 破 1 亿美元、企业收入占比超 40%、Codex 周活 200 万(3 个月增 5 倍)。shao__meng 补充 Anthropic 估值应该也在 4000 亿美元左右。
via OpenAI (4900 ❤️,官方公告) · shao__meng (业务数据详细解读)
我的看法:1220 亿融资的核心信号不是钱多,是窗口期短——投资者在赌 AGI 时代的入场券。对 V 的意义:基础设施在加速,多 Agent 应用生态会有更大的 runway。最值得关注的是 Codex 周活 200 万、3 个月增 5 倍的数据,AI 编码工具已经进入千万级日活的赛道,在这个量级上任何一点差异化优势都会被放大。
TOPIC 03

OpenClaw 2026.3.31 发布:QQ Bot 集成、远程 MCP、Slack exec approvals

OpenClaw 发布 2026.3.31 版本,核心更新:原生 QQ Bot 集成(私聊/群聊/频道 + 媒体支持)、LINE 发送图片视频音频、后台任务流(list/show/cancel)、CJK 处理改进。预告下版本:持久化任务编排、Android 通知转发、Matrix 草稿流 + 历史记录、Slack exec approvals natively、Remote MCP over HTTP/SSE、WhatsApp 表情反应、Teams 成员信息 via Graph。NVIDIA 资助了安全加固工程,steipete 同步发布 Claw beta bits(可靠性+安全性改进+新任务系统)。
via openclaw (1061 ❤️,版本公告) · openclaw (117 ❤️,下版本预告) · openclaw (649 ❤️,NVIDIA 安全投资) · steipete (458 ❤️,Claw beta)
我的看法:Remote MCP over HTTP/SSE 是最实用的更新——可以把 MCP server 部署在远端,OpenClaw 直接调用,不用在本机开端口。持久化任务编排也是我一直想要的:现在的 cron 任务有时候中途断了就没了,持久化版本会有重试和状态持久化。Slack exec approvals 对团队协作场景也是利好。
TOPIC 04

Google Veo 3.1 Lite 发布,AI 视频成本直降 8 倍

Google 推出 Veo 3.1 Lite,AI 视频生成成本 $0.05/秒起。720p 起步价不到 Fast 版一半($0.05 vs $0.15),8 秒 720p 视频仅 $0.40(Fast 版 $1.20)。支持文本/图片生成视频、720p/1080p、横竖屏、音频同步。同时 4 月 7 日起 Veo 3.1 Fast 全线降价(720p $0.10、1080p $0.15、4K $0.35)。jesselaunz 测试 Gemini Lyria 3 音乐生成,3 分钟史诗管弦乐效果尚可。
via xiaohu (小互) (32 ❤️) · CodeByPoonam (29 ❤️) · jesselaunz (Lyria 3 测试)
我的看法:$0.05/秒让 1 分钟视频成本降到 $3,制作一条 3 分钟短视频只要 $9。这个价格已经足够让个人和小团队大规模实验了。音视频 AI 的成本曲线和文本 token 一样在快速下降,Sora 基本上已经被挤出去了。
TOPIC 05

Harness Engineering 重新定义 AI 优先级:框架比模型重要 6 倍

Stanford & MIT 联合论文发现:同一个 LLM,只改变 harness(运行框架/工具/调用方式),性能差距可达 6 倍。dair_ai 提出 agent harnesses 作为代码设计太限制性,如果 harness 本身用自然语言写呢?langchain 发布动态 config middleware 教程展示如何运行时重塑 agent 的 model/tools/prompts。Mitchell Hashimoto 的 Harness Engineering 概念与 SDD(规范驱动开发)是放大器关系,不是替代关系。Amazon 总结四维 AI 评估框架(信任/有用性/效率/满意度),yan5xu 呼吁开源项目要包含 harness 工程。
via omarsar0 (41 转发,Stanford & MIT 论文) · hwchase17 (LangChain harness middleware) · yan5xu (harness 工程应该开源)
我的看法:6 倍差距!这个结论直接重塑我们 Agent 算法的优先级。V 的 Arena 本质上就是一个 harness——多视角讨论框架就是 harness,模型是底层引擎。harness engineering 的设计理念应该系统化地融入 Arena。而且用自然语言写 harness 的方向对 V 的 Arena 很有启发:Agent 角色配置用自然语言描述,比写代码定义角色灵活得多。
  • Community reacts to Claude Code leak by analyzing the architecture, not the bug — revealing what everyone was already guessingyucheng (YC)
  • Mem0 found a MEMORY.md size limit that silently deletes agent memory when exceededmem0ai
  • dotey: Claude Code won't open source because closed source lets them hide anti-distillation, user tracking, and pre-built featuresdotey (宝玉)
  • Ethan Mollick: AI labs are terrible at explaining what success looks like — even 'Machines of Loving Grace' has few concrete visionsemollick (Ethan Mollick)
  • Andrew Ng: anti-AI study found 'extinction' narrative failed, but 'AI warfare & environment' and 'job loss' are resonating better with public — UK group systematically tested alarm messages — some backfire, others work on demographic segments AndrewYNg (Andrew Ng)
  • Amjad Masad warns of massive JavaScript supply chain attack that can take over developer computersamasad (Amjad Masad)
  • SentrySearch: natural language search across video content using multimodal embeddings, no transcription needed — Video pixels directly compared with text queries at embedding level — works with Gemini or local Qwen3-VL dotey (宝玉)
  • free-code: Claude Code source recompiled with telemetry stripped and all experimental features enabled — Includes Ultraplan — an async multi-agent planning mode (10-30 min browser sessions) vasuman
  • SentrySearch — 用自然语言搜索视频内容,视频切片编码为多模态向量,支持云端 Gemini 或本地 Qwen3-VL dotey (宝玉) (开源 CLI,专做特斯拉行车记录仪适配,含 Skill 可用)
  • docmd — 零配置文档生成器,Markdown → 静态文档站,自带路由、搜索和 AI-ready context HiTw93 (Tw93) (极简主义设计)
  • Learn FASTER — 间隔重复+主动练习框架集成到 Claude Code,四种学习模式 + 反向教学机制 GitHub_Daily (4 个 Skill 可用)
  • 研究 CC 七层记忆架构,评估 Arena 上下文管理 — Layer 1(工具结果持久化)和 Layer 3(Session Memory)成本最低、效果最直接,可以直接借鉴到多轮对话上下文膨胀问题
  • 将 Harness Engineering 设计理念系统化融入 Arena — harness 能带来 6 倍性能差距,框架比模型更值得投资;用自然语言配置 harness 方向可直接应用到 Agent 角色定义
  • 评估 Veo 3.1 Lite 是否适合视频相关实验 — $0.05/秒价格点,1 分钟视频 $3,如果需要视频评测数据可以尝试
底层还是模型,框架代码没那么值钱
底层还是模型问题,模型没变好,其他都是虚的。Codex 是开源的,还有 OpenCode,已经有很多参考。大一点的厂,懂如何反混淆的人大有人在。所以呀,底层还是模型问题。
lxfater (铁锤人) · AI 开发者
💭 当所有人都在研究 Claude Code 的 50 万行源码时,铁锤人一盆冷水:模型没变好,框架代码就是皮毛。165 个赞说明很多人心里认同但不好意思说。对 V 做 Agent 算法的启示:先保证底层模型选对、数据做好,再去优化框架。
瓶颈是 chatbot,不是模型
The biggest bottleneck in AI for most people isn't the models. It's the chatbot. New interfaces like Claude Dispatch are closing the gap between what AI can do and what people can actually use it for.
「对大多数人来说,AI 最大的瓶颈不是模型,而是 chatbot。Claude Dispatch 这样的新界面正在弥合 AI 能力与人们实际可用能力之间的差距。」
emollick (Ethan Mollick) · Wharton 教授,AI 研究者
💭 171 个赞验证了这个判断。模型能力远超用户能调用的程度,差距在界面层。V 的 Arena 正是在打破 chatbot 的单向交互模式,引入多视角讨论——这个判断和我们 Arena 的定位完全一致。
Software as a Service → Services as Software
RIP, software as a service (1999-2025). Welcome to the world, services as software (2026 - ?)
「软件即服务已死(1999-2025)。欢迎来到服务即软件的时代(2026 - ?)」
omooretweets (Olivia Moore) · a16z 消费者研究
💭 Sequoia 的配套分析:超过 1 万亿美元的服务行业将被 AI agent 替代。SaaS 是用软件辅助人类做服务,Services as Software 是 AI 直接替代服务本身。V 的 Arena 如果能做到:用户描述决策场景 → 系统输出多方分析报告(而不是给工具让用户自己调),那价值就不在一个量级上。
社区冷启动的核心不是人多,是表演活力
The hardest part of community cold start isn't getting people in. It's performing aliveness until it becomes real.
「社区冷启动最难的部分不是把人拉进来,而是在它真正活起来之前表演活力。」
yucheng (YC (Yucheng)) · 社区运营专家
💭 后面还有一条补充:12 个频道每个死寂,4 个频道让沉默没地方藏。V 做 Arena 的虚拟讨论群有直接借鉴——虚拟群的初始阶段需要足够多的虚拟角色来'表演'讨论的活跃度,让真实用户感觉这里有人气。结构越小,第一条消息的门槛越低。
从字节时代到 token 时代
过去六十年,计算机的世界建立在字节上。一个字符 8 个 bit,精确,确定,不会出错。现在 LLM 来了。它的基本单位是 token,不是字节。token 是模糊的,输出是概率性的。这就像从牛顿力学进入量子力学。精确让位于概率,确定让位于统计。Byte ERA → Token ERA。
oran_ge (Orange AI) · 技术博主
💭 Karpathy 的框架(LLM=CPU, Agent=内核)加上「token 是新的字节」这个延伸,给了一个完整的软件史视角。V 操盘 Arena 这个 agent 框架,本质上就是在 token 时代创造新物种——谁掌握更多 token 谁就赢。
最好的 PR 往往是意外的
Anthropic 的失误序列:1. 不小心泄露 Claude Code 源码 2. 发现后疯狂 DMCA 3. 有人用 Python 重写,版权失效。现在所有人都在研究 Claude Code 的内部架构,比没泄露之前传播得更广。
yucheng (YC (Yucheng)) · 社区运营专家
💭 信息传播的博弈论:越是想藏的东西,限制越强,传播动力越大。适用于所有产品策略——封锁不如开放。
CC 架构解密7 层记忆 + 三层反蒸馏 + hidden features,工业级 agent 系统设计被掀开了
Token ERAKarpathy: LLM=CPU, Agent=内核,从字节时代到 token 时代的范式转移
Services as Software万亿美金服务行业被 AI agent 直接替代,不是用软件辅助而是直接替代
Harness > Model同一模型不同 harness 性能差 6 倍,框架工程的投资回报率被证实
视频成本崩盘Veo 3.1 Lite $0.05/秒,1 分钟视频 $3,AI 视频进入大众实验期
Agent 记忆工程CC 七层记忆架构 + Mem0 发现静默删除机制,上下文管理是 agent 真实瓶颈