Anthropic 获 350 亿美元芯片融资,谷歌推出 Agentic RAG 框架
Anthropic 获 350 亿美元芯片融资,谷歌推出 Agentic RAG 框架
Riverflow 2.5 可控评分图像模型发布 / SpaceX 与 Google 达成百亿云计算协议 / PixelDiT 入选 CVPR2026 最佳论文决赛
01模型发布/更新
Riverflow 2.5:可控制评分标准的图像模型 X:OpenRouter
在 OpenRouter 上线的 Riverflow 2.5 是首个具有独立评分标准的图像模型,用户可控制该标准以引导其思维和编辑,并具备可控的推理努力,可在速度与质量之间进行权衡。该模型免费开放至 6 月 9 日。
查看原文 →02产品发布/更新
谷歌推出基于 Gemini Enterprise Agent Platform 的 Agentic RAG 框架 Google Research
Google Research 推出跨语料库检索框架,作为 Agentic RAG。该多智能体工作流将复杂企业查询分解为子任务,通过规划、重写和路由,迭代搜索多个数据源直至获得充分上下文。与标准 RAG 相比,在事实性数据集上准确率最高提升 34%,在多个领域特定内部数据集上也实现了更好的接地与推理准确性。
查看原文 →智能体协作应如同事般对话和手势 X:Michael Truell
与 AI 智能体协作应感觉像与同事协作一样。你应能"与它们交谈"——不仅通过文本聊天,还能一起对着屏幕做手势、实时对话等,实现更自然的人机交互。
查看原文 →Google Colab CLI 发布 Google Developers Blog
Google 推出 Colab 命令行界面(CLI),允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时,实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本,并检索工件日志或模型,可直接集成到标准终端环境,被 Claude Code 等 AI 智能体调用以管理复杂机器学习流水线。
查看原文 →ChatGPT 网页版支持从写作块发送邮件 X:ChatGPT
现在你可以在网页版 ChatGPT 中直接从写作块发送邮件,草拟、调整、发送一气呵成,无需离开当前对话界面,极大提升了邮件处理效率。
查看原文 →Google AI 本周产品更新:Nano Banana 2、Co-Scientist、dreambeans、Gemma 4 等 X:Google AI
Google AI 本周发布多项更新:Nano Banana 2 及 Pro 正式 GA;Co-Scientist 多智能体系统面向科研自动生成优化新假设;Labs 推出 dreambeans 个性化话题集;Gemma 4 12B 统一无编码器多模态模型可完全离线运行于笔记本;Gemma 4 系列引入 QAT 降低内存需求;Magenta RealTime 2 开源实时音乐模型,支持 MIDI 键盘、文本提示和手势演奏。
查看原文 →Gemini Live 支持实时创建编辑图像 X:Gemini
用户现可直接在 Gemini Live 中创建和编辑图像。无论是测试房间装饰、解决数学问题,还是制作可分享的梗图,所有操作都实时完成。只需打开 Gemini 应用,点击 Live 按钮,共享摄像头,告诉 Gemini 你想看到的即可。
查看原文 →03行业动态
Apollo 敲定 350 亿美元债务融资,为 Anthropic 采购 AI 芯片 Bloomberg
Apollo Global Management 和 Blackstone 已为 Anthropic 敲定 350 亿美元融资方案,用于扩充其 AI 基础设施。这是人工智能竞赛中最新的一笔巨额交易,凸显了头部 AI 公司对算力基础设施的极度渴求。
查看原文 →SpaceX 与 Google 达成云计算新协议 X:Rohan Paul
SpaceX 披露了一份与 Google 的新云服务协议。Google 将每月向 SpaceX 支付 9.2 亿美元(约合每年 110 亿美元),用于 xAI 数据中心的计算能力。这再次表明,AI 算力正成为一种战略性商品,能为庞大 GPU 集群提供资金与运营的公司将获得巨大杠杆优势。
查看原文 →五角大楼正运营着一个针对拉丁美洲的人工智能宣传机器 Hacker News
据 The Intercept 报道,美国五角大楼正在运营一个针对拉丁美洲的 AI 宣传机器,利用 AI 技术生成并传播宣传内容。该消息在 Hacker News 上引发广泛关注,获得超 100 点热度。
查看原文 →AI 热推高美国计算基建 GDP 占比翻倍 X:Epoch AI
AI 热潮使计算基础设施占美国 GDP 比重翻倍。2026 年第一季度,与 AI 相关的数据中心建设、计算硬件和网络设备投资约占美国 GDP 的 0.8%,推动整个计算基础设施占 GDP 比重达到约 1.5%。
查看原文 →OpenAI 前 CTO 称若 Altman 未回归公司可能已"瓦解" Bloomberg
Mira Murati 表示,如果 Sam Altman 在 2023 年被短暂罢免后没有回归 CEO 职位,OpenAI 很可能已经"瓦解"。这是她对那场硅谷最激烈的董事会斗争的最清晰描述。
查看原文 →04论文研究
PixelDiT 入选 CVPR2026 最佳论文决赛 X:NVIDIA AI
来自 NVIDIA Research 的 PixelDiT 入选 CVPR2026 最佳论文决赛。在大多数图像生成模型中,预训练自编码器会在扩散前压缩图像导致质量损失累积。PixelDiT 作为像素扩散变换器,完全去掉了该步骤,是单阶段模型,直接在像素空间端到端学习扩散过程。
查看原文 →Arena 发布真实世界 AI 智能体排行榜 Agent Arena X:Rohan Paul
Arena 推出基于真实用户任务的智能体排行榜,评估模型在代码编写等实际工作中的表现。排行榜基于 30 万+任务、200 万+工具调用和 4000 万行代码,综合任务成功、错误恢复等信号。前三名:GPT-5.5 High(+10.7%)、Claude Opus 4.7 Thinking(+9.5%)、GPT-5.4 High(+8.9%)。
查看原文 →微软 Project Mosaic:micro-LED 光学互连技术 X:Microsoft Research
微软 Azure CTO 在 Build 2026 上介绍 Project Mosaic,这是微软剑桥研究院的实验性光学互连技术,采用 micro-LED 实现低功耗、高速数据传输。高级研究员现场演示单个 LED 调制形成字母,证明概念具备实时响应能力。
查看原文 →Anthropic:让 Claude 成为化学家 Anthropic Research
Anthropic 与顶尖化学家合作,测试 Claude 在 NMR 谱图分析上的表现。首个白皮书对比了 Claude Opus 4.7 等版本与专业软件的正向预测和反向结构解析能力。所有化合物选自模型训练截止日期后发布的预印本,以避免选择偏差。
查看原文 →Meta SAM 3D 获 CVPR26 最佳论文荣誉提名 X:AI at Meta
Meta SAM 3D 团队在 CVPR26 获得最佳论文荣誉提名,凸显了他们在推动计算机视觉边界方面的杰出工作。
查看原文 →05技巧与观点
用 Qwen2.5-3B 构建多智能体经济体:工程报告 Hugging Face Blog
开发者用 Qwen2.5-3B 构建了五人森林生物多智能体经济体。3B 模型在 100% 调用中输出有效 JSON,但经济判断能力弱。通过设计稀缺性和优化提示词提升决策质量。15 轮模拟中财富基尼系数从 0.14 扩至 0.38。项目展示了小模型可靠格式化与不可靠推理之间的工程填补。
查看原文 →Claude 是否增加了 rsync 中的错误? Hacker News
一篇 Hacker News 热门帖子提出了 Claude 是否导致 rsync 工具中 bug 增加的问题,并附有详细的数据分析链接,引发社区对 AI 辅助编程质量的热议。
查看原文 →Suno Voices 使用指南:6 个技巧打造高质量人声录制 Suno Blog
Suno Voices 面向 Web 付费用户开放。提升人声质量的 6 个技巧:在安静环境录音;先练习歌词再正式录制;不必追求完美保留情感;录音时长超 1 分钟;将人声匹配到合适流派;敢于尝试不同风格。这些技巧旨在帮助用户获得更个性化、表现力更强的声音效果。
查看原文 →结语
从 Anthropic 拿下 350 亿美元芯片融资到 SpaceX 与 Google 的百亿算力协议,AI 基础设施的军备竞赛已进入白热化阶段。而在应用层,无论是谷歌的 Agentic RAG 还是 Riverflow 2.5 的可控图像生成,都在昭示着 AI 从"被动响应"向"主动规划与可控推理"的演进。CVPR 2026 的各项荣誉则再次证明了底层视觉与架构创新的持续活力。在这个算力即战略、智能体即生产力的时代,技术迭代的速度正不断超越我们的想象。