AI 资讯 · 每日简报

2026-03-27 · 669 条推文 · 16.7h 跨度

📌 今日看点

GPT-5.4 Turbo-128K 登顶 Arena (1508 Elo)
Qwen3-VL 235B 发布
nano-bench 2.0: 低成本 agent 测试 ($1.50/35min)

📰 精选资讯

💡 智慧提取

非头部团队崛起:开源模型开始超越闭源头部
关系比较 > 直接询问:prompt 技巧新发现
药丸测试:用微型 benchmark 快速评估模型
边缘 AI:本地小模型正在成为主流

🔧 工具发现

nano-bench 2.0 — 低成本高频 agent 测试框架