X 每日精华

共 619 条推文 (Following: 568, For You: 51)

Codex Mobile 把 IDE 装进 ChatGPT App, 月增速 180%, 重度用户大批离开 Claude Code; OpenAI 同步把 ChatGPT 与 Codex 拍进同一个团队, Greg Brockman 亲管产品战略。Anthropic 一边在企业市占率上反超 OpenAI、一边给订阅用户补发 agent 额度——这场仗的焦点已经不在模型, 而在「谁是开发者默认工作台」。

ChatGPT Finances 接入 Plaid 旗下 12000+ 金融机构, 让 ChatGPT 从「给建议」变成「替你办事」; Anthropic 同周推出 Claude for Small Business, 15 个预制工作流直插 QuickBooks、PayPal、HubSpot——一场针对 44% 美国 GDP 的 SMB 渗透同步开启。

X 算法开源 把整条推荐流水线 (含 slop score) 摊到 GitHub; 与此同时 Anthropic 一份 2028 年报告递到国会, 主张收紧对华算力管制——平台与模型的下半场, 已经是政治议程。

飞书 CLI 一个月破万 star, 国内首个万星办公套件; 这条线和 Anthropic SMB、PinMe、Higgsfield Supercomputer 共享同一个判断——AI 时代的 SaaS 不再靠 UI 竞争, 而是看「能不能被 Agent 一句话调起来」。

独立观察: Nous Research 发布 Lighthouse Attention, 512K 上下文实测 17× 加速且不依赖任何自写 sparse kernel, 长上下文又往「开箱即用」近了一格。

翻开看漫画
comic 「谁先把开发者的工作台抢到手里, 谁就先收到下一张支票.」 ← 返回
0 / 7 解锁
#01
Codex 进了口袋
#02
AI 走进银行账户
#03
44% GDP 渗透战
#04
推荐黑盒拆封
#05
Anthropic 的双面
#06
CLI 成为新前端
#07
长上下文又松一格
We used to walk around with open computers so the agents wouldn't stop running
「我们以前抱着开着的电脑到处走, 就为了别让 agent 停下来」
He just spent a year building scaffolding for his agent harness. Now release a new model update that makes all of it obsolete.
「他刚花了一年时间为他的 agent harness 搭脚手架。现在出一个新模型更新, 把这一切全干掉。」
@levie
How do people even do AI hackathons these days you're just sitting around waiting for the agents half of the time?
「AI 黑客松现在到底怎么搞? 一半时间都在干等 agent。」
突然意识到, 好好花点时间去读、去理解代码、手动编程, 已变成一件有些奢侈的事了。
亲身经历, 教人用 AI, 最终问题就会演变为如何订阅上 Claude/Codex, 再进一步就是如何解决网络问题。
Codex is very good, but it is still a very 'developer coded' interface for an everything app. And it continues the somewhat annoying AI perspective that non-coders are just not as competent and need stuff hidden from them.
「Codex 很好, 但它仍然是一个开发者口味的 everything app 入口。它延续了那种让人有点烦的 AI 视角——把非程序员当成能力不够、需要被屏蔽细节的人。」
翻开看漫画
comic 「新工种: 别让 agent 停。」 ← 返回
把偏见看成在生物约束下被优化的捷径
Most documented psychological biases are not irrational, they are highly optimized, energy-efficient shortcuts meant for a biological substrate operating under strict real-time physical constraints and a limited caloric budget.
「大多数被记录下来的心理偏见并不是「不理性」, 它们是为生物基质量身定制的、高度优化的、节能的捷径——这种基质要在严格的实时物理约束和有限的卡路里预算下工作。」
François Chollet · Keras 之父
💭 这条对你判断 agent 的失败模式特别有用: 当你下次看到 Codex / Claude Code 卡在某个看似不理性的循环上, 不要直接归因于「模型笨」, 而是问——它在什么约束下做了这个 trade-off? 偏见在人身上是给定的卡路里预算, 在 agent 身上是 token / 上下文窗口 / 工具数量预算。理解了这个映射, 你写 prompt 和 SKILL.md 的方式会从「禁止它做 X」转成「重新分配它的预算」。
翻开看漫画
comic 「它不是笨, 是在你给的预算下太聪明了。」 ← 返回
纪律不再是护城河, taste 才是
discipline used to be the moat... the people who would grind through the production work won. that moat is GONE. taste is the moat now: knowing what's worth making, what angle works, what to keep, what to kill.
「纪律曾经是护城河——肯死磕生产环节的人赢。那条护城河已经没了。Taste 才是新的护城河: 知道什么值得做、什么角度有效、什么留下来、什么砍掉。」
EXM7777 · Machina, 365 天从 0 到 10 万粉的独立创作者
💭 把这条带进你今天的决策里: 你正在用毅力扛的那些工作 (清数据、写测试用例、整理文档、剪辑视频), 有多少其实 agent 能 100x 做完? 然后你能用省下的时间去做什么只有你能做的事 (选题、判断、拍板)? 如果你的 PM / 工程 / 创作工作里, 别人和你的差别仍然在「执行强度」, 那这条警钟就是给你的。
翻开看漫画
comic 「谷登堡来过一次了。这次它穿着 agent 的衣服。」 ← 返回
存在是动词, AI 还没踏进动词
西方哲学几千年都把存在当名词处理, 仿佛事物已经在那里等着被认出来。要把这个翻过来: 存在不是名词, 是动词。AI 跑在图灵机里, 处理的是已经被定下来的真值, 再快也只是在名词的层面上扑腾; 可能性不是它能开出来的东西。
李继刚 · 引述赵汀阳《人工智能的神话或悲歌》
💭 下次当你听到「AI 已经在做 X」这种判断, 试着追问一层: 它是在「识别 X」(名词层), 还是在「让 X 之外的东西可能发生」(动词层)? 这条区分用在产品判断上极锋利: 一个 agent 写得出 100 种续写, 但它没法说「不」——而你能。这意味着所有 agent-first 产品里, 「让用户在 agent 输出前能干预可能性空间」才是稀缺设计, 不是「让 agent 给出更多选项」。
翻开看漫画
comic 「AI 写得出 100 种续写,写不出一个「不」—— 而第 101 种可能,只在那个「不」之后才长出来。」 ← 返回
博客死于「来自某团队」而非具名个人
Blogs die when they come from 'the ____ team' instead of named individuals. With great ownership comes great accountability.
「博客一旦署名变成「某某团队」而不是具体某个人, 它就开始死了。大的署名权伴随大的责任。」
swyx · Latent Space 主理人
💭 这条放在 Agent 协作时代特别值得反复读: 当 PR、报告、issue、技术博客越来越多由 agent 主导起草, 谁是那个具名负责的人? 没有具名责任的内容会变成「公司声明腔」, 失去张力和锋芒。同样的逻辑也适用于你内部用 agent 写的 design doc 和 weekly report——保留一个具名的「最终决定权」, 是抵抗 agent 内容均质化的最后一道防线。
翻开看漫画
comic 「Stan Lee 改一个字, 顺手救了博客的命。署名, 就是那枚还在跳的心电。」 ← 返回
  • Toto 2.0 — 开源时序预测模型, 含 4M 到 2.5B 五个尺寸, 在 BOOM / GIFT-Eval / TIME 三个权威基准上排名第一, Scaling Law 有效。 Gorden_Sun (适合做需求预测、容量规划、监控异常检测——把 LLM 不擅长的「数列推断」这一类任务交出去)
  • Supertonic — On-device TTS, 31 种语言, ONNX 跨平台, 无需 GPU, 速度比 ElevenLabs 快, 树莓派也能跑, 100% 开源。 akshay_pachaar (私有部署 / 边缘场景 / 不想把声音数据上传到云的可选方案)
  • PinMe — 把前端 / 后端 / 数据库 / Email / LLM API 打包成一个 npx 安装的 skill, 在 Claude Code / Codex 里一句话起一个全栈 Web 应用。 GitHub_Daily (把 Vercel + Supabase + Resend + LLM SDK 这堆碎件压成单一接口——Agent-first 全栈范式的代表作)