X 每日精华 | 2026-03-27

722 条推文 · 24.0h 跨度

🔥 今日看点

Claude Mythos 泄露:Anthropic CMS 配置失误曝光史上最强模型,网络安全能力远超一切
Chollet 投下炸弹:AGI 会自己做 Harness,否则就不是 AGI。Elon 回复 True
钉钉 CLI 开源:国内首个面向 AI Agent 开源全产品能力的国民级应用
RLHF 正在破坏 AI 安全:对齐后模型丧失不确定性表达能力
Google Translate 耳机实时翻译登陆 iOS,任意耳机可用 70+ 语言

📰 精选资讯

━━━━━━━━━━

Chollet: AGI 会自己做 Harness

AI观点

只要还需要人类工程师为每个新问题手工搭建 harness,AI 就不是通用的。Elon 回复 True。直接挑战当前 agent 生态叙事。

━━━━━━━━━━

钉钉 CLI 开源

开发工具

一行命令调用钉钉全部产品能力,首批 10 项,原生支持 Claude Code 和 OpenClaw,结构化 JSON + Agent Skills + dry-run。

━━━━━━━━━━

RLHF 破坏 AI 安全功能

AI安全

DPO 对齐使模型在 40-79% 事实问题上丧失不确定性表达,单聚类率从基座 1% 飙到 28.5%,采样安全检测完全失效。

━━━━━━━━━━

OpenAI 一周砍三产品

行业动态

Sora 关停(日推理成本$15M)、Instant Checkout 废弃(仅12家商户)、成人聊天搁置。IPO 前大扫除,估值目标 $8300 亿。

━━━━━━━━━━

Codex Plugins 正式发布

开发工具

Skills+Apps+MCP 打包分发,内置 Slack/Figma/Notion 插件,CLI 一键安装。同时重置所有用户额度。

━━━━━━━━━━
━━━━━━━━━━

Gemini 3.1 Flash Live

AI模型

实时语音模型,延迟 0.96s,128K 上下文,90+ 语言,专为语音 Agent 设计。

━━━━━━━━━━
━━━━━━━━━━

💡 智慧提取

AGI 会自己搭 Harness,否则不是 AGI — Chollet 提醒我们 harness 是桥梁不是终点

感觉最可靠的模型,恰恰最可能悄悄犯错 — RLHF 对齐破坏不确定性表达

软件从静态变弹性 — Sam Altman: 未来软件按需生成,为你量身定制

脚本管事实,Agent 管思考 — Elvis Zoe: 确定性控制流 + 认知 agent = 可靠

自进化是未来 12 个月关键词 — 中关村圆桌:算力→可持续token→生态→自进化

🛠️ 工具发现

ByteRover Memory Plugin — OpenClaw 三层记忆架构,检索准确率 92.2%,Git-like 状态化
Cline Kanban — 可视化管理 CLI Agent 任务,Worktree 隔离+依赖链
clone-website skill — 一命令克隆网站样式,Chrome MCP + 并行 sub agent
DingTalk CLI — 钉钉开源 CLI,Agent Native 接口,10 项核心能力