Claude Mythos 泄露:Anthropic 史上最强模型曝光
AI模型CMS 配置失误泄露近 3000 份文件。Claude Mythos(代号 Capybara)是 Opus 之上的第四档,在编程/推理/网安上大幅超越 Opus 4.6。Anthropic 选择先向安全防御机构开放。
CMS 配置失误泄露近 3000 份文件。Claude Mythos(代号 Capybara)是 Opus 之上的第四档,在编程/推理/网安上大幅超越 Opus 4.6。Anthropic 选择先向安全防御机构开放。
只要还需要人类工程师为每个新问题手工搭建 harness,AI 就不是通用的。Elon 回复 True。直接挑战当前 agent 生态叙事。
一行命令调用钉钉全部产品能力,首批 10 项,原生支持 Claude Code 和 OpenClaw,结构化 JSON + Agent Skills + dry-run。
DPO 对齐使模型在 40-79% 事实问题上丧失不确定性表达,单聚类率从基座 1% 飙到 28.5%,采样安全检测完全失效。
Sora 关停(日推理成本$15M)、Instant Checkout 废弃(仅12家商户)、成人聊天搁置。IPO 前大扫除,估值目标 $8300 亿。
Skills+Apps+MCP 打包分发,内置 Slack/Figma/Notion 插件,CLI 一键安装。同时重置所有用户额度。
登陆 iOS,任意耳机可用,70+ 语言,基于 Gemini AI,非逐字翻译而是语义理解。
实时语音模型,延迟 0.96s,128K 上下文,90+ 语言,专为语音 Agent 设计。
Bloomberg 报道苹果计划让 Siri 路由请求到 ChatGPT/Gemini/Claude 等第三方 AI 聊天机器人。
杨植麟主持,张鹏/罗福莉/夏立雪/黄超讨论 OpenClaw、自进化、可持续 token、算力瓶颈。
AGI 会自己搭 Harness,否则不是 AGI — Chollet 提醒我们 harness 是桥梁不是终点
感觉最可靠的模型,恰恰最可能悄悄犯错 — RLHF 对齐破坏不确定性表达
软件从静态变弹性 — Sam Altman: 未来软件按需生成,为你量身定制
脚本管事实,Agent 管思考 — Elvis Zoe: 确定性控制流 + 认知 agent = 可靠
自进化是未来 12 个月关键词 — 中关村圆桌:算力→可持续token→生态→自进化