AI 简报 · 2026-06-12

AI Radar 简报 · 2026-06-12

涵盖 AI精选 · 热点动态 · AI简报 · 论文速递


🔥 AI精选

来源:AIHOT · 精选热点

日期 标题 来源 分类
06-11 OpenAI 宣布收购云端持久化运行环境公司 Ona,让 Codex Agent 从”会话”走向”常驻进程” OpenAI 行业
06-11 Anthropic 与 DXC 达成全球联盟:培训数万名 Claude 认证 FDE 工程师,引入银行/航空/保险关键系统 Anthropic 企业
06-11 Anthropic 启动 Claude Corps:1000 名研究员年薪 8.5 万美元匹配美国非营利组织,初始投入 1.5 亿美元 Anthropic 行业
06-11 Prometheus 融资 120 亿美元、估值 410 亿美元,定位”人工通用工程师”,贝佐斯支持,成立仅 7 个月无任何产品 X: Kim 行业
06-11 Cursor 推出 Auto-review:分类器智能体在工具调用前审查动作风险,高风险阻止并返回解释给父智能体 Cursor Blog 产品
06-11 Runway 与 Lionsgate 扩大战略合作:Lionsgate 入股 Runway,联合创作新 IP 并推出短剧系列 Runway 行业
06-11 全自主无人机首次在实战中击毙人类士兵——自主武器系统里程碑,亦是危险信号 HN/New Scientist 安全
06-11 Anthropic CEO 达里奥:AI 造成大规模岗位流失是技术固有属性,呼吁薪资保障与全民基本收入研究 IT之家 行业
06-12 Spec 驱动开发(SDD)三个 Skills:/write-product-spec → /write-tech-spec → /validate-changes-match-specs 完整闭环 X: 邵猛 技巧
06-12 Codex 推出浏览器开发者模式(CDP):可调试 JS 性能、检查控制台、网络流量和页面状态 X: OpenAI Devs 产品

📡 热点动态

来源:AIHOT · 全量热点(近 1 天)


📋 AI简报

来源:AI Digest· 2026-06-12

2026-06-12


📄 论文速递

来源:AI Brief

重点关注

把理解、生成、编辑塞进一个模型,赌注押在 tokenizer 上

ARM 框架:用”语义判别+语言对齐+忠实重建”三目标联合监督训出离散视觉 tokenizer,让图像理解/生成/编辑在同一 next-token 框架里共享表示。7B 模型上加 RL 后出现跨任务互相增益(生成和编辑能力互促),暗示三件事在共享同一套能力而非各管各的。关键未知量:tokenizer 能否同时扛住三件事,需看全文强度对比。

把骨架和 mask 全砍掉,角色动画端到端能行吗?

SCAIL-2:不用骨架描述动作、不用 mask 描述背景,直接把 driving video 整段拼进输入序列做 in-context conditioning。去掉每一层中间件理论上保留更多细节,团队自建 MotionPair-60K 数据集支撑训练。当天 37 个 upvote,已放出代码和权重。真正的工程考点是对未见过 driving 序列的泛化能力。

RL 给 token 打分时,哪个 token 真正决定了答案?

FlowTracer:把推理过程建成有向无环图,用 attention 权重作边容量,只保留流到答案区域的影响并强制局部流量守恒,在图上提取信息主干再用流量吞吐给 token 打信用分。和 RLVR 奖励颗粒度问题不同——这是更上游的”信用怎么沿信息流回传”问题。已被 ICML 接收。

把一整段证据压成一个 token,RAG 成本账被重算

Latent Memory:用小压缩模型把每条多模态证据蒸馏成单个高维 latent token,检索和生成都在潜空间完成。在 7 个文本 QA 和多模态 QA 上与主流 RAG 打平,但生成端 token 消耗降至原来 1/3 至 1/10。真正的落地关键是压缩比与精度的兑换曲线,需看全文确认。

画面越来越逼真,但世界模型可能根本不懂物理

WorldOlympiad:用物理忠实性、几何一致性、交互保真度三条赛道考视频世界模型——物理用 MLLM 裁判,几何用高斯泼溅重建 3D 结构,交互看长序列动作指令稳定性。在 SOTA 模型上跑出大窟窿:”画面好看”和”真懂世界”之间有一条没人量过的鸿沟。阿里出品,带代码。

也值得关注


Leave a Comment