AI 简报 · 2026-06-19

AI Radar 简报 · 2026-06-19

涵盖 AI精选 · 热点动态 · AI简报 · 论文速递


🔥 AI精选

来源:AIHOT · 精选热点

日期 标题 来源 分类
06-18 Claude Code 支持 Artifacts:PR 走查、仪表盘、发布清单等可生成实时可分享交互网页 Claude Blog 产品
06-18 Claude Enterprise 推出企业托管 MCP 连接器授权:Okta 配置后员工自动获授权,零接触设置 Claude Blog 产品
06-18 Anthropic Project Fetch 第二阶段:Claude Opus 4.7 无人类协助完成所有任务,速度比最快人类团队快 20 倍 Anthropic 研究
06-18 OpenAI 通过 RL 实现广泛持久的有益特质对齐:诚实、可纠正性、公平性在对抗性微调下仍难被逆转 OpenAI Alignment 研究
06-18 MosaicLeaks:深度研究智能体在混合私有/公开检索时频繁泄露私有信息;PA-DR 训练将泄露率从 34% 降至 10% HuggingFace 安全
06-19 Nature 两篇研究:MIRA 急诊诊断准确率 88.9% 超越专科医生(78.1%),Google AMIE 慢病治疗计划适切率 95% 大幅超越全科医生(72%) The Decoder 医疗
06-18 AI 员工 Viktor 进驻 Microsoft Teams:无需学习、无需提示词,年化收入已达 2000 万美元 X: Rohan Paul 产品
06-18 ChatGPT Enterprise 推出用量分析与支出控制:按时间/用户/产品/模型追踪 Codex+ChatGPT 信用消耗 OpenAI 产品
06-19 DeepSeek 研究员开源 AutoResearch:AI 智能体首次完全自主在 285B 模型上完成完整 RL 研究闭环(零人工干预) X: 阿易 AI Notes 研究
06-18 FERC 命令六大电网运营商为 AI 数据中心提供快速并网通道;部分地区批发电价五年涨 267% TechCrunch 基础设施

📡 热点动态

来源:AIHOT · 全量热点(近 1 天)


📋 AI简报

来源:AI Digest· 2026-06-19

2026-06-19


📄 论文速递

来源:AI Brief

重点关注

循环架构想把”加深计算”做成可调旋钮,结果发现只能加两层

LoopCoder-v2(Parallel Loop Transformer):并行循环靠位置偏移和共享 KV 滑窗注意力摊平串行成本,7B 模型从 18T tokens 预训练。反直觉结论:两次循环全面提升(SWE-bench Verified 43.0→64.4),三次及以上反而退化——有效精炼集中在第二次,后续更新越来越小+震荡,而位置偏移带来的错配成本固定不变。”Only Loop Once”标题其实最优是两次循环,值得注意。

让 agent 写代码容易,让它交出一个能玩的游戏才是真考验

GameCraft-Bench:Godot 引擎里 140 个任务、15 类游戏,不靠读代码打分,而是真正运行游戏并回放玩家操作录像,用多模态评委判断”这游戏到底能不能玩”。结果:agent 往往能实现可见的玩法机制,但在内容完整度、视觉反馈是否生效、整体呈现是否连贯上集体掉链子。

老师该在哪一层介入小模型的训练?

ZPPO:把老师放进 prompt 而不是 policy gradient 里——难题上构造”正确答案与错误答案混排”让学生分辨,或把学生多次错误 rollout 聚合暴露共同失败模式,配 replay buffer 直到准确率过半才”毕业”。0.8B~9B 四个学生规模(27B 老师),31 个 benchmark 稳定超过蒸馏和 GRPO。

统一多模态该解耦还是该共享,同一周给出了相反答案

UniAR 与上周 UniDDT 押相反赌注:UniDDT 主张解耦(理解/生成各走各通路),UniAR 主张共享(离散视觉 tokenizer 同时服务两端)。UniAR 靠免查表位运算量化(lookup-free bitwise quantization)保住语义和细节,压短视觉序列提速,图像生成/编辑达 SOTA 且理解不掉队。统一多模态路线之争仍未收敛。

也值得关注


Leave a Comment