AI Radar 简报 · 2026-06-18
涵盖 AI精选 · 热点动态 · AI简报 · 论文速递
🔥 AI精选
来源:AIHOT · 精选热点
| 日期 | 标题 | 来源 | 分类 |
|---|---|---|---|
| 06-18 | Noam Shazeer 离开 Google 加入 OpenAI(谷歌 270 亿美元请回来的 AI 传奇) | X: Yuchen Jin | 行业 |
| 06-17 | OpenAI 泄露财务文件:2025 年营收 130 亿但净亏损 385 亿(原始亏损 603 亿),Q1 现金消耗 37 亿 | HN/Ars Technica | 行业 |
| 06-17 | Anthropic 与 DeepMind CEO 在 G7 闭门会议呼吁建立美国主导 AI 联盟,以模型与芯片访问权将中国排除在外 | X: Kim | 政策 |
| 06-18 | 苹果 Xcode 27 深度集成 AI 智能体:自然语言修 Bug、跨文件修改代码库,支持 Anthropic/OpenAI/Google 第三方模型 | IT之家 | 产品 |
| 06-17 | Claude Design 重大更新:跨项目统一设计系统,与 Claude Code 双向同步,发布首周用户超 100 万 | Claude Blog | 产品 |
| 06-17 | Vercel 开源 AI 智能体框架 Eve:”智能体即目录”,内置持久执行、沙箱、人机审批,内部 Vertex 自动解决 92% 工单 | MarkTechPost | 产品 |
| 06-17 | Google 发布 ARD(Agentic Resource Discovery)开放规范:AI 工具/技能/智能体在 Web 上的发布、发现与验证标准 | Google Developers | 标准 |
| 06-17 | NVIDIA GEAR 实验室发布 ENPIRE:8个 Codex 智能体控制 8 台机器人自主完成物理实验,支持通宵无人运行 | X: Jim Fan | 研究 |
| 06-17 | Claude Platform 全面推出 Workload Identity Federation:短生命期凭证替代静态 API 密钥,完整审计日志 | Claude Blog | 安全 |
| 06-17 | Google 医学 AI AMIE 登上 Nature:复杂慢病管理追平全科医生,指南一致性显著更高 | Google Blog | 研究 |
📡 热点动态
来源:AIHOT · 全量热点(近 1 天)
-
06-18 LoopCoder-v2:2次循环最佳,将 SWE-bench Verified 从 43.0 提升至 64.4;3次、4次循环反而性能下降 —
X: Rohan Paul
第二次循环进行有意义精炼,后续循环主要添加重复和噪声——”测试时计算越多越好”的假设被实验推翻。 -
06-18 微软 Copilot 高危漏洞 SearchLeak(CVE-2026-42824):三阶段攻击可将 2FA 验证码、邮件、会议详情外传 —
IT之家
恶意参数嵌入合法 URL,Copilot AI 引擎解读为搜索指令后将敏感数据通过必应 CDN 图片 URL 外传;微软已发布补丁。 -
06-18 G7 峰会 AI 午餐:Sam Altman 与 Dario Amodei 同席;美国限制盟友获取 Fable/Mythos,AI 从技术竞赛变为国家权力游戏 —
X: Berry Xia
一边用出口管制卡住前沿模型扩散,一边让 CEO 与盟友谈合作——未来焦点从模型能力转向控制权之争。 -
06-18 谷歌前研究员 Noam Shazeer 正式宣布加入 OpenAI,称”对谷歌团队深感自豪” —
X: Noam Brown
“转会”消息由 Noam Brown 侧面确认,Gemini 团队被誉为”残酷的消息”——顶级人才流动加速 OpenAI vs Google 格局演变。 -
06-18 Kimi K2.7 Code vs Claude Fable 5 落地页对比:Kimi 总成本低 94%,GPT-5.5 评分接近,性价比突出 —
X: 邵猛
单页成本:Kimi 4 美分 vs Fable 1.09 美元(约 27 倍差);结合高质量视觉参考 MCP Server 后,开源模型已可支撑批量落地页生产工作流。 -
06-18 上交所发布指引:AI 大模型企业可适用科创板第五套上市标准,要求有大模型产品已上线并实现规模化应用 —
IT之家
为尚未形成稳定收入的优质 AI 大模型企业开辟上市通道,中国 AI 公司资本市场路径正式明确。 -
06-18 WWDC26:苹果用 4 台 Mac Studio 本地运行 Kimi K2.6(1 万亿参数),使用 RDMA over Thunderbolt 技术 —
IT之家
苹果将本地大模型运行能力推向消费级演示,4 台 Mac Studio 联网跑万亿参数模型成为 WWDC 标志性展示。 -
06-18 库克:AI 热潮导致存储芯片价格涨四倍,iPhone 涨价”不可避免”,iPhone 18 Pro 或需增价 270 美元 —
IT之家
AI 算力军备竞赛的成本正在传导至消费电子终端,摩根士丹利预测今年美国智能手机和 PC 价格将上涨 15%。 -
06-18 Claude Design 与 Claude Code 双向同步:/design-sync 拉取设计到代码库,/design 推回画布继续编辑 —
X: 小互
设计系统可通过 GitHub 仓库、Figma 文件或品牌规范三种方式导入;生成时调用真实组件并自查是否偏离设计系统,自动修正。 -
06-18 Gemini 3.5 Pro 即将发布:视觉更强、多模态推理升级,搭载更严格安全过滤器,定价预计更高 —
X: Berry Xia
Gemini 3.1 Pro 产品页已标注”3.5 Pro 即将推出”;Noam Shazeer 加入 OpenAI 的消息让 Google 面临双重压力。 -
06-17 Google 99 美元 Gemini 智能音箱发售:多步指令、连续对话、10 种声音;高级功能需月费 10 美元 |
TechCrunch
Google 以 Gemini 重塑智能家居音箱品类,向 Amazon Echo 和 Apple HomePod 发起直接挑战。 -
06-17 阿里云发布 HappyOyster 1.0:一句话生成可实时交互的数字世界,支持”实时导演”和”世界探索”两种玩法 —
IT之家
开放式世界模型,生成过程中持续接收用户指令并实时响应,支持自由漫游、物理交互等,保持长程一致性。 -
06-17 中国加紧筹建世界人工智能合作组织,拟总部设上海,作为美国主导 AI 联盟的平行多边框架 —
IT之家
与 Anthropic/DeepMind CEO G7 呼吁将中国排除在外同周推进,AI 全球治理的”两阵营”格局快速成形。 -
06-17 Wolfram 语言与 Mathematica Version 15 发布:每个笔记本内置 AI 助手,支持从 AI 环境中直接调用 Wolfram 技术 —
Hacker News
38 年历史的计算工具迎来 AI 原生升级,同时新增符号音乐、大规模时间序列等核心功能,CUDA 内核支持 GPU 计算。 -
06-17 Cloudflare One Stack 发布:AI 智能体可直接调用的 Zero Trust 配置技能文件,内含从 Zscaler/Palo Alto 迁移指南 —
Cloudflare Blog
将数万小时客户经验提炼为 Skill,让智能体自动完成云环境评估、网络拓扑生成和安全排障,降低企业 Zero Trust 部署门槛。
📋 AI简报
来源:AI Digest· 2026-06-18
2026-06-18
-
经审计、被金融时报独立核对:OpenAI 2025 年净亏损 385 亿美元,原始总净亏损 603 亿 — 这是第一次有了经过审计的版本。营收不是没涨(130 亿),问题在于研发和算力开销涨得更猛——研发成本 191 亿含向微软支付 105 亿,推理计算 75 亿。393 亿净亏损经少数股东分摊后压到 385 亿,但原始窟窿是 603 亿。
-
AI 化学家改进了制药的关键反应,医疗 AI 在慢病管理上追平全科医生 — OpenAI+Molecule.one 的 AI 化学家用 GPT-5.4 改进了药物合成中一个长期难做的关键反应;Google AMIE 慢病管理研究登上 Nature,在指南一致性和计划精确性上得分显著高于全科医生。两项成果对应同一个前提:可靠的领域评测正在成为验证 AI 科研能力的标配。
-
只有 16% 的美国人相信 AI 让社会变好,但接近一半每天或偶尔使用 AI 聊天机器人 — 皮尤研究中心最新调查:40% 认为 AI 带来负面影响,67% 不相信政府会真正监管,59% 不信企业能安全开发——一边越来越离不开,一边越来越不安;近三分之二认为 AI 发展太快了。
📄 论文速递
来源:AI Brief
重点关注
删文本省下的 token 钱,可能被 cache 失效吃回去
TokenPilot 揭示反直觉权衡:无约束地压缩/删除上下文会改写 prompt 的前缀布局,导致 prefix cache 失效,被重算的费用反而高于节省的 token 成本——真正的优化需同时考虑”文本稀疏度 vs cache 连续性”两个维度。方案:摄入时做”摄入感知压缩”稳定 prefix;局部用”生命周期感知淘汰”,只在任务相关性真正过期且按批次保守节奏触发时才卸载。
ICML 论文:用更强 Oracle 模型精修/合成的推理轨迹 reward 分更高,但喂给小模型后效果反而不如小模型自生成+拒绝采样的轨迹——根因是 Oracle 在修复逻辑时把表达风格推离了小模型的”母语”分布,分布漂移的学习成本盖过了逻辑变好的收益。方案:Style-Aligned Refinement,保留 Oracle 逻辑修复,维持小模型原生表达轨迹。
把视觉理解和图像生成塞进同一模型的老问题:理解要抽象语义,生成要像素细节,共享一条通路两头不讨好。UniDDT 结构上拆开:噪声 ViT 编码器+LLM 统一语义编码,独立扩散解码器分离”扩散解码”和”文本解码”——方向从”大一统单通路”退回”分而治之”,值得关注。
两相流喷雾仿真代理模型:不编码全部流场,只编码 AMR(自适应网格)密度场(即”求解器把分辨率集中在哪里”)作为紧凑代理,再用轻量第二阶段补回其余变量。推理速度比 Basilisk CFD 快 6 万倍+。可借鉴的不是速度数字,而是:当物理状态太复杂,求解器自己暴露的”该在哪里精算”的结构可能比原始流场更适合学习。
也值得关注
- VinQA 让文档 QA 的答案把视觉元素交错进来 — 现有文档 QA 只吐纯文本,浪费表格/图表/照片;交错式回答更贴近真实文档形态
- 往残差流里同时叠加两个语义对立的引导向量会发生什么 — 研究 steering 的”对撞”,以往激活引导只注入单一方向
- 给年度总量、同比增速等聚合预测配上可靠的不确定性区间 — 用块自助+交叉验证残差的多步分裂 conformal 方法