AI Radar 简报 · 2026-06-10
涵盖 AI精选 · 热点动态 · AI简报 · 论文速递
🔥 AI精选
来源:AIHOT · 精选热点
| 日期 | 标题 | 来源 | 分类 |
|---|---|---|---|
| 06-09 | Claude Fable 5 与 Claude Mythos 5 正式发布,几乎所有基准 SOTA | Anthropic | 模型 |
| 06-09 | Claude Managed Agents 新增定时运行(cron)与 Vault 环境变量存储功能 | Claude Blog | 产品 |
| 06-09 | Anthropic 350亿美元芯片租赁交易:谷歌为五个数据中心提供财务担保 | Bloomberg | 行业 |
| 06-09 | Apollo + Blackstone 联手 350 亿美元 AI 融资交易,可能重塑 AI 基础设施融资模式 | Bloomberg | 金融 |
| 06-09 | OpenRouter 推出 Advisor 工具:低成本模型处理日常、关键时刻调用强模型 | OpenRouter | 产品 |
| 06-10 | 华为云发布全球首个端到端具身 AI 开发平台 CloudRobo,覆盖从数据到部署全生命周期 | X: 华为云 | 产品 |
| 06-10 | 摩尔线程开源 MusaCoder 9B/27B,首个基于国产 GPU 全链路训练的代码模型,KernelBench 超越 Claude Opus | IT之家 | 模型 |
| 06-09 | Magnetar Capital 180亿美元对冲基金将以数百 AI 智能体替代分析师,人类仅负责审批交易 | X: Rohan Paul | 行业 |
| 06-10 | 欧盟动用紧急权力:临时措施要求 Meta 向第三方 AI 助手免费开放 WhatsApp | IT之家 | 监管 |
| 06-09 | Claude Fable 发布:Ethan Mollick 评”自 o3 以来最大飞跃”,像素级还原 McKinsey 报告、SpaceX S-1、宝可梦游戏 | One Useful Thing | 测评 |
📡 热点动态
来源:AIHOT · 全量热点(近 1 天)
-
06-10 Fable 5 系统提示词(约12万字符)遭 Pliny 曝光,内含模型层级(Fable/Mythos 共享底层参数)及产品生态完整描述 —
X: Kim
Fable 5 是通用安全版附加双重用途安全措施;Mythos 5 仅限批准组织使用且不含这些安全限制,两者共享同一底层模型参数。 -
06-10 Claude Fable 5:自我纠正循环 + 共享文件系统记忆是两大核心杠杆,Parameter Golf 效率高 6 倍,可一次迁移 50 万行代码 —
X: 阿易 AI Notes
内部验证方法:写 rubric(目标+量化评分+沙箱)让模型自主改代码跑测试;独立上下文验证代理可使准确率翻倍。 -
06-10 Fable 5 实测:three.js 3D 世界渲染堪比《上古卷轴》预告片,Remotion 视频生成表现惊艳 —
X: Deedy Das
开发者评”自 o3 以来 AI 模型质量最大飞跃”,许多任务需要超过 2 小时深度思考,像素级还原复杂设计文档。 -
06-10 Claude Code 团队 Thariq 分享 10 条建议:用 /goal + Workflows 并行任务,将 Claude Fable 5 视为运行数小时的自检工程师 —
X: Rohan Paul
核心转变:从”检查 Claude 是否做对”转向”检查它是否在做正确的工作”;Thariq 本人用 Fable 5 剪辑了整段视频。 -
06-10 小米 MiMo-V2.5-Pro UltraSpeed:单 8 卡节点万亿参数 MoE 推理达 1000 token/s(峰值 2140),已降价 99% —
公众号: 卡尔的AI沃茨
接入 Claude Code 开启 UltraCode 模式后,12 个 Agent 11 分钟完成项目升级报告;3 分钟生成含特效 3D 网页。 -
06-10 Text-To-Lottie:Agent Skill + 本地预览 Harness,让 Codex/Claude Code/Cursor 生成标准 Lottie 动画并实时验收 —
X: 邵猛
基于 Skottie 渲染引擎、Vite 热重载闭环;支持颜色/尺寸 Slots 调节;适合 Motion Graphics、SVG→Lottie、数据可视化场景。 -
06-10 谷歌 DeepMind 经济学家伊马斯:尚未发现 AI 造成白领岗位大规模消失,跟风裁员可能适得其反 —
IT之家
AI 更多是接手部分任务提升生产力,让员工专注机器无法完成的工作;岗位冲击”尚未真正出现”。 -
06-10 工信部《”人工智能+信息通信”创新发展实施意见》:构建城域毫秒级低时延入算能力,推进 5G-A/6G 与 AI 融合 —
IT之家
要求加速 400Gbps/800Gbps 骨干网建设,攻关空口智能化、网络高等级自智、智能体互联网等核心技术。 -
06-10 Super Micro 计划股权融资 70 亿美元用于 AI 服务器组件采购,满足激增的 AI 基础设施需求 —
Bloomberg
AI 硬件供应链融资规模持续扩张,Super Micro 为 AI 数据中心建设加大产能布局。 -
06-09 GitHub Copilot CLI 新增自定义 AI 智能体,将一次性终端提示转化为可重复、可审查工作流 —
GitHub Blog
Copilot CLI 理解开发者技术栈和团队工作流,将提示词标准化为团队级可复用的自动化流程。 -
06-09 Cursor Evals 新增每模型成本、输出 token 和步骤图表,评估 AI 编程助手 ROI 更直观 —
X: Eric Zakariasson
多模型对比变得可视化,帮助团队做出更具数据支撑的模型选择决策。 -
06-09 OpenAI Responses API 网页搜索新增图片结果,可构建展示商品、地点、视觉参考的应用 —
X: OpenAI Developers
图文混合搜索能力对电商、旅游、内容发现类应用开放,多模态 AI 搜索集成门槛进一步降低。 -
06-09 NotebookLM 笔记本功能在欧洲 Gemini App 100% 上线,可直接访问个人笔记本并以对话为新来源 —
X: NotebookLM
先向 AI Ultra/Pro/Plus 订阅者开放,数周内扩展至移动端、更多欧洲国家及免费用户。 -
06-10 AgentsView 为 Claude Fable 5 支持自定义价格,工具追踪本地编码智能体 token 使用情况 —
Simon Willison
Fable 5 尚未被收录进 AgentsView 定价数据库,作者用 Fable 逆向工程找到添加自定义价格的方法。 -
06-09 IBM CEO:AI 不会必然导致员工减少;量子计算投资 100 亿美元,联邦 Albany 芯片厂承诺 10 亿美元 —
Bloomberg
IBM 在 AI 就业影响上持与谷歌 DeepMind 经济学家相似的保守立场,同时押注量子计算与公私合营制造。
📋 AI简报
来源:AI Digest· 2026-06-10
2026-06-10
-
OpenAI 官博讲 Codex 如何”无限制”排查难题;亚马逊内部把自家 AI 编程工具叫做”Sloppenheimer” — Nextdoor 工程师用 Codex 解决难以复现的疑难问题,把精力重放回产品;而亚马逊员工在 Slack 开吐槽频道,给内部 AI 编程工具起了谐音”AI 废料”+”奥本海默”的绰号——厂商叙事与用户实感的落差。
-
首次下载量低于 200 万的开发者,苹果云端 AI 接口不收钱了;谷歌 Gemini 3.5 语音实时翻译同步免费进入 Meet — 苹果用免费调用留住独立开发者生态,谷歌用内置翻译功能咬住用户习惯。直接卖 AI 能力越来越难盈利,两家都在争下一轮分发权——谁先铺成默认选项谁赢。
-
法庭上原告律师和被告律师都让 AI 代笔,法官当庭取消庭审、把所有人踢出案子 — 双方诉状引用了查无此案的判例和从未存在的先例,法官直接终止庭审。两个 AI 互相对线,输的是整个司法程序。研究指出 AI 在基准测试高分但难以转化为专业场景可靠产出,法庭翻车正是这道裂缝的现场。
📄 论文速递
来源:AI Brief
重点关注
CoVEBench 多点视频编辑基准:416条源视频、626条多点编辑指令、9990个细粒度 checklist 项,用 MLLM 逐条判分。结论:模型处理多个操作时频繁漏掉某些编辑或违反”保持不变”约束。最先崩的是动作和机位这类需要跨帧一致性的编辑——改镜头时主体连贯性常常带塌。做视频编辑产品的团队值得关注。
MemoPilot:用多轮 GRPO 直接训练”记忆更新”这个动作,让冻结 LLM 在不改权重的情况下越用越准。验证场景是石头剪刀布和德州扑克(Elo 领先 DeepSeek-V3.2),但游戏环境反馈结构干净,能否迁移至搜索/coding 等长程任务需要后续验证。
STAR:将路由重新表述为子空间学习问题,在线性投影路由之外加入用 Hebbian 算法持续跟踪输入主结构的演化子空间,让路由决策直接对齐输入主导方向。核心洞察:路由质量是专家分工的上游瓶颈,值得训练 MoE 的团队重视。
用 conformal 预测在生成过程中实时计算多步推理图的整体不确定性,达到阈值就停止往下推,给”这条推理链可信”上用户可指定的覆盖率保证——把幻觉控制从”调到看着还行”变成有统计保证的推断。针对医疗、金融、法务等高风险场景有直接意义。
也值得关注
- 让 query 参与状态演化本身 — 线性注意力的 Q-Delta:query 不再只管读出,参与 KV 演化过程,是对 KV 关联范式的一次松绑
- 照 schema 直接转的图,未必是 GNN 想要的图 — 关系数据库→图的转换陷阱,建图环节的重要提醒
- encoder 和 decoder 更新不对称,统一聚合会崩 — 医学分割联邦 LoRA 按编解码结构差异分别聚合
- 合成数据从拟真度改判精确满足结论 — 不比对真实分布的拟真度,要求在无源数据下精确满足声明式分析结论
- 八叉树缓存光泽材质辐射,奔实时渲染去 — OctaOctree 用八叉树组织 neural radiosity 缓存,应对高频出射辐射建模难题