AI 简报 · 2026-06-09

AI Radar 简报 · 2026-06-09

涵盖 AI简报 · 论文速递


📋 AI简报

来源:AI Digest· 2026-06-09

2026-06-09

  • 「Chat已死」,保密递交上市草案的同一周,OpenAI 要把 ChatGPT 改成更赚钱的入口 — OpenAI 确认已保密向 SEC 递交 S-1 草案,同期曝出内部”Chat 已死”说法:聊天框将被改造为导向高毛利产品(Codex、企业服务)的入口,靠聊天本身变现这条路走到了头。奥特曼参与的虹膜身份验证公司 Tools for Humanity 同周被曝营收乏力、缩减人手,为上市做的财务重整正在溢出到关联生意。

  • 标榜端侧自研的苹果,新一代 Siri 的大脑建在了谷歌的 Gemini 上 — WWDC 2026 上,苹果承认全新 Apple Intelligence 架构建立在与谷歌联合开发的基础模型之上,内核用的正是 Gemini 家族技术。两年前高调预告”更聪明的 Siri”却迟迟未兑现,这次靠竞争对手的模型终于端出——苹果自研端侧隐私叙事出现裂缝。去年因虚假宣传 AI 功能花了 2.5 亿美元和解,今年演示明显收敛。

  • 做设计用 Claude 的时间超过 Figma,一位 Jane Street 设计师的工作流被彻底改写 — 该设计师以前写规格文档→做 Figma 稿→和工程师评审,现在直接把方案写成一段话交给 Claude,跑通基本功能后在真实代码库里迭代原型——”真实代码库里的原型几乎处处胜过静态设计稿”;现在用 Claude 时间已超过 Figma。另:开发者在官方仓库集中请求 Linux 桌面版 Claude,因 Linux 无桌面版导致插件调试必须切操作系统。


📄 论文速递

来源:AI Brief

重点关注

换个机械臂,整套技能就得从头练

RECENT 框架:把机器人技能写成可执行代码,语义意图(控制结构)保持不动,只对”执行绑定”做局部重构。换了夹爪或环境后,小模型(sLM)不必重新学习整套策略,只需改动因本体/环境变化的那几行——相当于”重新接线”而非”重新训练”。在多种机器人本体动态环境里,RECENT 追平了大模型版的任务表现。核心价值:可部署可迭代,不是刷 SOTA。

让模型先修图,再答题

Robust-U1:三段式流程——SFT 初步重建 → 像素级(SSIM)+ 语义级(CLIP)双重奖励 RL 对齐质量 → 同时看原始损坏图和恢复图推理。把视觉鲁棒性变成可观察的中间产物,但代价是推理链路变重,重建质量差时反而可能误导后续判断。

模型「看见」了两种答案,却只说得出一种

用稀疏自编码器探针研究 VLM 歧义处理:69 张双稳态图(鸭兔、老少头)中 72% 在视觉端同时激活了两种解读特征——模型确实”看见”了两个答案,但承诺(说出哪个)发生在更下游的语言端。干预不对称:对偏向明显的图在 CLIP 第 22 层因果操控能翻转 33% 描述,但对本就五五开的图则翻不动。清醒剂:特征探针告诉你信息在哪,不等于能从那里改写输出。

从多份带噪观测里反解物理量,集合建模的借鉴价值

专攻远距离被动 LWIR 高光谱成像的大气补偿难题:用轻量 set-based 深度框架把同一场景不同距离的多次辐射测量作为无序集合联合处理,反解透过率、大气程辐射和共享下行光谱。可借鉴的建模姿态:把”多次带噪观测”当无序集合联合处理,而非逐条硬算。目前仅在 MODTRAN 仿真数据验证,距真实部署仍有距离。

也值得关注


Leave a Comment