📌 今日看点
GPT-5.4 Turbo-128K 登顶 Arena (1508 Elo)
Qwen3-VL 235B 发布
nano-bench 2.0: 低成本 agent 测试 ($1.50/35min)
📰 精选资讯
模型
OpenAI 新模型在 Arena 排行榜上以 1508 Elo 登顶
模型
阿里发布 Qwen3 视觉语言模型,235B 参数
💡 智慧提取
非头部团队崛起:开源模型开始超越闭源头部
关系比较 > 直接询问:prompt 技巧新发现
药丸测试:用微型 benchmark 快速评估模型
边缘 AI:本地小模型正在成为主流