模型混战升级，智能体时代来临：Grok、Ideogram发新，黄纳对话揭示未来

7天前作者：Covsun & Bob 浏览量：26

AI 日报

模型混战升级，智能体时代来临：Grok、Ideogram发新，黄纳对话揭示未来

从语音克隆到水资源消耗，AI行业多元图景全景扫描

2026年6月4日 · AIHOT 随趣科技整理

今日AI领域动态密集。**模型层面**，Grok Imagine 1.5与Ideogram v4.0带来视觉生成新能力，Miso One以开源姿态挑战语音合成；**应用层面**，Grok模型上线Cloudflare，NVIDIA与微软联手展望智能体未来，Perplexity将其AI搜索带入Windows桌面；**行业层面**，联合国警示AI环境成本，Suno巨额融资，而微软与OpenAI的竞争态势已然明朗。

01 模型发布/更新

Grok Imagine 1.5 预览版发布

X：cb_doge

Grok Imagine 1.5 预览版已发布，即日起可在 API 中体验。SpaceXAI 正在发力。

查看原文 →

Ideogram v4.0 发布：2K 分辨率和 JSON 提示支持

X：Krea AI

介绍 Ideogram v4.0。原生 2K 分辨率，出色的文字渲染，支持 JSON 提示词。立即在 Krea 中体验。

查看原文 →

Miso One 开源语音模型：8B 参数、110ms 延迟、一次语音克隆

X：Kim

Miso One 正式发布，一个 8B 参数的开源权重语音模型（TTS），旨在模拟真实人类朗读的温暖与节奏。它支持一次语音克隆（只需短样本），推理延迟仅 110ms。模型权重已开源至 GitHub，无需 API 即可自托管，音频数据不离开本地。API 访问即将推出。

查看原文 →

02 产品发布/更新

Grok模型登陆Cloudflare AI Gateway

X：xAI

在 @Cloudflare 的 AI Gateway 上尝试 Grok 模型！

查看原文 →

OpenClaw 2026.6.1发布：新增Windows节点与技能工坊

X：OpenClaw

OpenClaw 2026.6.1 已上线。新增原生 Windows 节点主机、用于自主学习型智能体的技能工坊、工作板编排，并支持 MiniMax M3。

查看原文 →

黄仁勋与纳德拉共议智能体AI时代

X：NVIDIA

智能体AI时代来了。从台北，黄仁勋与@satyanadella共同出席#MSBuild，展示NVIDIA与@Microsoft如何携手构建，从Windows设备到规模化AI工厂。

查看原文 →

Replit上线SEO Agent助应用被发现

X：Replit

发布应用只是开始。Replit推出SEO Agent，它会为你运行一次扫描，并建议修复措施，帮助你的应用在网页搜索和AI搜索中被发现。

查看原文 →

OpenShell v0.0.55 发布：新增 Vertex AI 推理支持

X：NVIDIA AI

OpenShell v0.0.55发布。新增 Google Vertex AI 推理提供者，基于配置文件的策略可见性，网关中更好的 Podman 检测，恢复 GPU procfs 基准行为等更新。

查看原文 →

xAI Grok语音模型上线Vapi平台

X：xAI

试试 Vapi 上最自然的TTS和性价比最高的STT API。来自 xAI 的Grok STT和Grok TTS现已在企业语音AI平台Vapi上线。

查看原文 →

Perplexity Personal Computer 登陆 Windows

X：Perplexity

Personal Computer 即将登陆 Windows。它将在你的机器上运行，并协调你每天使用的应用和文件。首先向付费 Max 和 Enterprise Max 订阅用户推送。

查看原文 →

Meta 面向 WhatsApp Business 的 AI 智能体现已全球上线

TechCrunch：AI

Meta 为 WhatsApp Business 打造的 AI 智能体面向全球商家开放，将按照模型 token 使用量向企业收费。

查看原文 →

03 行业动态

联合国报告：2030年AI数据中心水电消耗将翻倍

IT之家

联合国报告指出，受AI需求驱动，预计到2030年，数据中心年耗电量将翻倍至945太瓦时（AI占40%），耗水增至9.3万亿升，碳排放升至3.99亿吨。报告警告若忽视环境成本，AI落地还将加剧土地紧张与电子废弃物问题。

查看原文 →

Suno完成4亿美元D轮融资

X：Suno

Suno 完成 4 亿美元 D 轮融资，估值 54 亿美元。其使命是让更多人能体验制作音乐的乐趣。

查看原文 →

微软与OpenAI分道扬镳——如今双方准备正面交锋

The Verge

微软与OpenAI的合作关系已彻底破裂，双方进入正面竞争态势。前DeepMind高管、现任微软AI主管Mustafa Suleyman明确表示，微软现在必须从头证明自己能独立完成所有必需的任务。

查看原文 →

04 论文研究

微软研究：装瓶厂AI从聊天到决策

X：Microsoft Research

一份在中西部装瓶厂进行的三个月试点显示，当AI超越聊天进入决策领域时会发生什么——约束条件变化、风险真实、答案必须可靠。

查看原文 →

NVIDIA Research 在 CVPR 2026 发表三篇论文：规模化训练实现抓取、自动驾驶与智能体泛化

NVIDIA AI Blog

NVIDIA Research 在 CVPR 2026 上发表三篇论文，展示规模化训练带来的泛化能力。包括零样本抓取基础模型GraspGen-X、用紧凑潜在表示实现更快自动驾驶推理的LCDrive，以及基于Isaac GR00T架构训练具身智能体的NitroGen。

查看原文 →

05 技巧与观点

优步每月 1，500 美元的 AI 使用上限为 AI 工具定价提供参考

Hacker News 热门

优步将 AI 工具每月使用上限定为 1500 美元，这一做法为行业 AI 工具定价提供了有价值的参考信号。

查看原文 →

世界模型的功能分类

X：Fei-Fei Li (World Labs)

World Labs团队与李飞飞发文，梳理“世界模型”这一被滥用的术语。对比语言模型学习文本统计，世界模型学习空间与时间统计。基于POMDP框架，将当前系统分为渲染器、规划器等类别，着重于概念分层。

查看原文 →

洪水韧性新篇章：Google 开源水文建模框架

Google Research：Blog

Google Research 在 GitHub 开源了其水文建模框架，这是一个基于 PyTorch 的 Python 包，采用与 Flood Hub 河段洪水预报相同的模型架构和训练数据。该框架旨在让各国气象水文部门在保留数据完全控制权的同时，整合基于 AI 的洪水预报。

查看原文 →

Anthropic 用 Claude 赋能自助数据分析

Claude：Blog

Anthropic 使用 Claude 自动化了 95% 的业务分析查询，整体准确率约 95%。其关键在于构建智能体分析栈，通过数据基础层、维护验证流程和技能分别解决概念-实体歧义、数据过时和检索失败三大错误来源。

查看原文 →

结语

从激烈的模型竞争到具体的产业应用，从对环境影响的严肃思考到资本市场的热情追捧，今日的AI新闻再次勾勒出这个领域复杂而充满活力的全景图。无论是巨头间的分合博弈，还是开源社区的持续创新，都在推动着技术边界不断拓展。唯一确定的是，变化与竞争将是未来很长一段时间的主旋律。

文章资讯

模型混战升级，智能体时代来临：Grok、Ideogram发新，黄纳对话揭示未来

01 模型发布/更新

Grok Imagine 1.5 预览版发布

Ideogram v4.0 发布：2K 分辨率和 JSON 提示支持

Miso One 开源语音模型：8B 参数、110ms 延迟、一次语音克隆

02 产品发布/更新

Grok模型登陆Cloudflare AI Gateway

OpenClaw 2026.6.1发布：新增Windows节点与技能工坊

黄仁勋与纳德拉共议智能体AI时代

Replit上线SEO Agent助应用被发现

OpenShell v0.0.55 发布：新增 Vertex AI 推理支持

xAI Grok语音模型上线Vapi平台

Perplexity Personal Computer 登陆 Windows

Meta 面向 WhatsApp Business 的 AI 智能体现已全球上线

03 行业动态

联合国报告：2030年AI数据中心水电消耗将翻倍

Suno完成4亿美元D轮融资

微软与OpenAI分道扬镳——如今双方准备正面交锋

04 论文研究

微软研究：装瓶厂AI从聊天到决策

NVIDIA Research 在 CVPR 2026 发表三篇论文：规模化训练实现抓取、自动驾驶与智能体泛化

05 技巧与观点

优步每月 1，500 美元的 AI 使用上限为 AI 工具定价提供参考

世界模型的功能分类

洪水韧性新篇章：Google 开源水文建模框架

Anthropic 用 Claude 赋能自助数据分析

结语