AI Radar 简报 · 2026-06-18

涵盖 AI精选 · 热点动态 · AI简报 · 论文速递

🔥 AI精选

来源：AIHOT · 精选热点

日期	标题	来源	分类
06-18	Noam Shazeer 离开 Google 加入 OpenAI（谷歌 270 亿美元请回来的 AI 传奇）	X: Yuchen Jin	行业
06-17	OpenAI 泄露财务文件：2025 年营收 130 亿但净亏损 385 亿（原始亏损 603 亿），Q1 现金消耗 37 亿	HN/Ars Technica	行业
06-17	Anthropic 与 DeepMind CEO 在 G7 闭门会议呼吁建立美国主导 AI 联盟，以模型与芯片访问权将中国排除在外	X: Kim	政策
06-18	苹果 Xcode 27 深度集成 AI 智能体：自然语言修 Bug、跨文件修改代码库，支持 Anthropic/OpenAI/Google 第三方模型	IT之家	产品
06-17	Claude Design 重大更新：跨项目统一设计系统，与 Claude Code 双向同步，发布首周用户超 100 万	Claude Blog	产品
06-17	Vercel 开源 AI 智能体框架 Eve：”智能体即目录”，内置持久执行、沙箱、人机审批，内部 Vertex 自动解决 92% 工单	MarkTechPost	产品
06-17	Google 发布 ARD（Agentic Resource Discovery）开放规范：AI 工具/技能/智能体在 Web 上的发布、发现与验证标准	Google Developers	标准
06-17	NVIDIA GEAR 实验室发布 ENPIRE：8个 Codex 智能体控制 8 台机器人自主完成物理实验，支持通宵无人运行	X: Jim Fan	研究
06-17	Claude Platform 全面推出 Workload Identity Federation：短生命期凭证替代静态 API 密钥，完整审计日志	Claude Blog	安全
06-17	Google 医学 AI AMIE 登上 Nature：复杂慢病管理追平全科医生，指南一致性显著更高	Google Blog	研究

📡 热点动态

来源：AIHOT · 全量热点（近 1 天）

06-18 LoopCoder-v2：2次循环最佳，将 SWE-bench Verified 从 43.0 提升至 64.4；3次、4次循环反而性能下降 — X: Rohan Paul
第二次循环进行有意义精炼，后续循环主要添加重复和噪声——”测试时计算越多越好”的假设被实验推翻。
06-18 微软 Copilot 高危漏洞 SearchLeak（CVE-2026-42824）：三阶段攻击可将 2FA 验证码、邮件、会议详情外传 — IT之家
恶意参数嵌入合法 URL，Copilot AI 引擎解读为搜索指令后将敏感数据通过必应 CDN 图片 URL 外传；微软已发布补丁。
06-18 G7 峰会 AI 午餐：Sam Altman 与 Dario Amodei 同席；美国限制盟友获取 Fable/Mythos，AI 从技术竞赛变为国家权力游戏 — X: Berry Xia
一边用出口管制卡住前沿模型扩散，一边让 CEO 与盟友谈合作——未来焦点从模型能力转向控制权之争。
06-18 谷歌前研究员 Noam Shazeer 正式宣布加入 OpenAI，称”对谷歌团队深感自豪” — X: Noam Brown
“转会”消息由 Noam Brown 侧面确认，Gemini 团队被誉为”残酷的消息”——顶级人才流动加速 OpenAI vs Google 格局演变。
06-18 Kimi K2.7 Code vs Claude Fable 5 落地页对比：Kimi 总成本低 94%，GPT-5.5 评分接近，性价比突出 — X: 邵猛
单页成本：Kimi 4 美分 vs Fable 1.09 美元（约 27 倍差）；结合高质量视觉参考 MCP Server 后，开源模型已可支撑批量落地页生产工作流。
06-18 上交所发布指引：AI 大模型企业可适用科创板第五套上市标准，要求有大模型产品已上线并实现规模化应用 — IT之家
为尚未形成稳定收入的优质 AI 大模型企业开辟上市通道，中国 AI 公司资本市场路径正式明确。
06-18 WWDC26：苹果用 4 台 Mac Studio 本地运行 Kimi K2.6（1 万亿参数），使用 RDMA over Thunderbolt 技术 — IT之家
苹果将本地大模型运行能力推向消费级演示，4 台 Mac Studio 联网跑万亿参数模型成为 WWDC 标志性展示。
06-18 库克：AI 热潮导致存储芯片价格涨四倍，iPhone 涨价”不可避免”，iPhone 18 Pro 或需增价 270 美元 — IT之家
AI 算力军备竞赛的成本正在传导至消费电子终端，摩根士丹利预测今年美国智能手机和 PC 价格将上涨 15%。
06-18 Claude Design 与 Claude Code 双向同步：/design-sync 拉取设计到代码库，/design 推回画布继续编辑 — X: 小互
设计系统可通过 GitHub 仓库、Figma 文件或品牌规范三种方式导入；生成时调用真实组件并自查是否偏离设计系统，自动修正。
06-18 Gemini 3.5 Pro 即将发布：视觉更强、多模态推理升级，搭载更严格安全过滤器，定价预计更高 — X: Berry Xia
Gemini 3.1 Pro 产品页已标注”3.5 Pro 即将推出”；Noam Shazeer 加入 OpenAI 的消息让 Google 面临双重压力。
06-17 Google 99 美元 Gemini 智能音箱发售：多步指令、连续对话、10 种声音；高级功能需月费 10 美元 | TechCrunch
Google 以 Gemini 重塑智能家居音箱品类，向 Amazon Echo 和 Apple HomePod 发起直接挑战。
06-17 阿里云发布 HappyOyster 1.0：一句话生成可实时交互的数字世界，支持”实时导演”和”世界探索”两种玩法 — IT之家
开放式世界模型，生成过程中持续接收用户指令并实时响应，支持自由漫游、物理交互等，保持长程一致性。
06-17 中国加紧筹建世界人工智能合作组织，拟总部设上海，作为美国主导 AI 联盟的平行多边框架 — IT之家
与 Anthropic/DeepMind CEO G7 呼吁将中国排除在外同周推进，AI 全球治理的”两阵营”格局快速成形。
06-17 Wolfram 语言与 Mathematica Version 15 发布：每个笔记本内置 AI 助手，支持从 AI 环境中直接调用 Wolfram 技术 — Hacker News
38 年历史的计算工具迎来 AI 原生升级，同时新增符号音乐、大规模时间序列等核心功能，CUDA 内核支持 GPU 计算。
06-17 Cloudflare One Stack 发布：AI 智能体可直接调用的 Zero Trust 配置技能文件，内含从 Zscaler/Palo Alto 迁移指南 — Cloudflare Blog
将数万小时客户经验提炼为 Skill，让智能体自动完成云环境评估、网络拓扑生成和安全排障，降低企业 Zero Trust 部署门槛。

📋 AI简报

来源：AI Digest· 2026-06-18

2026-06-18

经审计、被金融时报独立核对：OpenAI 2025 年净亏损 385 亿美元，原始总净亏损 603 亿 — 这是第一次有了经过审计的版本。营收不是没涨（130 亿），问题在于研发和算力开销涨得更猛——研发成本 191 亿含向微软支付 105 亿，推理计算 75 亿。393 亿净亏损经少数股东分摊后压到 385 亿，但原始窟窿是 603 亿。
AI 化学家改进了制药的关键反应，医疗 AI 在慢病管理上追平全科医生 — OpenAI+Molecule.one 的 AI 化学家用 GPT-5.4 改进了药物合成中一个长期难做的关键反应；Google AMIE 慢病管理研究登上 Nature，在指南一致性和计划精确性上得分显著高于全科医生。两项成果对应同一个前提：可靠的领域评测正在成为验证 AI 科研能力的标配。
只有 16% 的美国人相信 AI 让社会变好，但接近一半每天或偶尔使用 AI 聊天机器人 — 皮尤研究中心最新调查：40% 认为 AI 带来负面影响，67% 不相信政府会真正监管，59% 不信企业能安全开发——一边越来越离不开，一边越来越不安；近三分之二认为 AI 发展太快了。

📄 论文速递

来源：AI Brief

重点关注

删文本省下的 token 钱，可能被 cache 失效吃回去

TokenPilot 揭示反直觉权衡：无约束地压缩/删除上下文会改写 prompt 的前缀布局，导致 prefix cache 失效，被重算的费用反而高于节省的 token 成本——真正的优化需同时考虑”文本稀疏度 vs cache 连续性”两个维度。方案：摄入时做”摄入感知压缩”稳定 prefix；局部用”生命周期感知淘汰”，只在任务相关性真正过期且按批次保守节奏触发时才卸载。

挑 reward 最高的数据蒸馏小模型，可能正在帮倒忙

ICML 论文：用更强 Oracle 模型精修/合成的推理轨迹 reward 分更高，但喂给小模型后效果反而不如小模型自生成+拒绝采样的轨迹——根因是 Oracle 在修复逻辑时把表达风格推离了小模型的”母语”分布，分布漂移的学习成本盖过了逻辑变好的收益。方案：Style-Aligned Refinement，保留 Oracle 逻辑修复，维持小模型原生表达轨迹。

统一理解与生成，UniDDT 押注的是”解耦”而非共享通路

把视觉理解和图像生成塞进同一模型的老问题：理解要抽象语义，生成要像素细节，共享一条通路两头不讨好。UniDDT 结构上拆开：噪声 ViT 编码器+LLM 统一语义编码，独立扩散解码器分离”扩散解码”和”文本解码”——方向从”大一统单通路”退回”分而治之”，值得关注。

for Science：做仿真代理模型该让网络学什么？

两相流喷雾仿真代理模型：不编码全部流场，只编码 AMR（自适应网格）密度场（即”求解器把分辨率集中在哪里”）作为紧凑代理，再用轻量第二阶段补回其余变量。推理速度比 Basilisk CFD 快 6 万倍+。可借鉴的不是速度数字，而是：当物理状态太复杂，求解器自己暴露的”该在哪里精算”的结构可能比原始流场更适合学习。

也值得关注

VinQA 让文档 QA 的答案把视觉元素交错进来 — 现有文档 QA 只吐纯文本，浪费表格/图表/照片；交错式回答更贴近真实文档形态
往残差流里同时叠加两个语义对立的引导向量会发生什么 — 研究 steering 的”对撞”，以往激活引导只注入单一方向
给年度总量、同比增速等聚合预测配上可靠的不确定性区间 — 用块自助+交叉验证残差的多步分裂 conformal 方法

AI 简报 · 2026-06-18

AI Radar 简报 · 2026-06-18

🔥 AI精选

📡 热点动态

📋 AI简报

2026-06-18

📄 论文速递

重点关注

也值得关注

Leave a Comment Cancel reply