AI日报：Grok Voice发布，DiffusionGemma速度提升4倍

2小时前作者：Covsun & Bob 浏览量：2

AI资讯日报

AI日报：Grok Voice发布，DiffusionGemma速度提升4倍

2023年6月11日周四 | AI行业最新动态汇总

随趣科技 2023-06-11 阅读时间：5分钟

今天，AI领域迎来了多项重要发布和更新。从xAI的Grok Voice到Google DeepMind的DiffusionGemma，模型性能与速度取得新突破；小米、Replit等公司推出新工具；行业动态涉及法律、合作与安全；论文研究关注机器遗忘和漏洞利用；还有来自社区的实用技巧与观点。让我们一起回顾这些精彩进展。

01 模型发布/更新

Grok Voice性能出色价格低廉

来源：X：xAI (@xai)

Grok Voice 提供最先进的性能，具有类人的时机、语调和温暖感。而且价格仅为竞争对手的一小部分。

查看原文 →

DiffusionGemma：文本生成速度提升4倍的开源扩散模型

来源：Google DeepMind：Blog（RSS）

Google DeepMind 发布开源实验模型 DiffusionGemma，采用文本扩散技术，突破自回归逐 token 生成方式，每次前向并行生成 256 个 token。该 26B MoE 模型推理时仅激活 3.8B 参数，量化后适配 18GB 显存消费级 GPU。在 H100 上达 1000+ tokens/s，RTX 5090 上 700+ tokens/s，速度提升 4 倍。具备双向注意力和自我修正能力，面向内联编辑、代码填充等本地交互工作流，以 Apache 2.0 许可证开放。

查看原文 →

02 产品发布/更新

mlx-vlm v0.6.3 发布，Day-0 支持 Google DeepMind DiffusionGemma 和 Cohere North Mini Code 1.0

来源：X：Berry Xia (@berryxia)

mlx-vlm v0.6.3 上线，首发支持 DiffusionGemma 和 North Mini Code 1.0。DiffusionGemma 采用全新架构：以 256 token 块为单位并行生成、双向注意力、迭代自纠错；26B MoE 仅激活 3.8B，量化后 18GB 即可运行。North Mini Code 1.0 为 30B MoE，仅激活 3B，BF16 下约 66 tok/s。两款模型均通过深度合作实现 Day-0 MLX 支持，可在 Mac 本地运行。可通过 `uv pip install -U mlx-vlm` 安装体验。

查看原文 →

MiniMax M3 上链 0G，限时免费运行

来源：X：MiniMax (@MiniMax_AI)

M3 在 @0G_labs 上链。可验证 + 私有计算，6 月 15-18 日免费运行。

查看原文 →

Apache Burr：构建可靠的人工智能代理和应用程序

来源：Hacker News 热门（buzzing.cc 中文翻译）

Apache Burr 是一个用于构建可靠 AI 智能体和应用程序的框架，已在 Apache 基金会下发布。该项目提供工具和抽象，帮助开发者设计、开发和部署可信任的智能体应用，强调可靠性、可观测性和生产级部署能力。

查看原文 →

小米发布 MiMo Code V0.1 开源终端 AI 编程助手

来源：X：小米 MiMo (@XiaomiMiMo)

小米推出开源终端 AI 编程助手 MiMo Code V0.1，附带限时免费使用的多模态模型 MiMo V2.5，支持百万 token 上下文窗口。核心特性包括：无限上下文（自动知识积累与无损压缩）、Agent-模型深度协同（测试-审查-验证闭环）、Compose 模式（规格→计划→构建→报告）、自进化系统、语音输入（基于 MiMo-V2.5-ASR）、兼容 Claude Code（零成本迁移），以及 MIT 许可、支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等主流模型提供商。

查看原文 →

Replit 联合 Socket 推出 Package Firewall

来源：X：Replit (@Replit)

大多数人在发布项目前会运行安全扫描以检测恶意包，但风险从安装的那一刻就已开始。今天，我们正式推出 Package Firewall，与 Socket 合作构建，它在恶意软件到达你的应用之前就将其拦截。

查看原文 →

Google将保存用户的Lens图片、Search Live录音和Translate音频用于AI训练

来源：The Verge：AI（RSS）

Google更新搜索交互数据保存方式，新增"Search Services History"设置，用于保存用户搜索时使用的图片、文件、音频和视频，包括Google Lens搜索的图片、实时搜索工具Search Live的录音、语音搜索和Translate中的语音片段。这些数据将被用于"提供、改进和开发AI模型"。用户可关闭该设置并禁用"Save Media"选项以避免保存。

查看原文 →

OpenRouter 推出 Activity explorer 活动探索器

来源：X：OpenRouter (@OpenRouter)

今天，我们在 OpenRouter 上推出了新的 Activity explorer。这是查看你和团队在每个模型上花费了多少的最佳方式，还包括 token、缓存命中率、智能体以及趋势。所有数据实时更新。看看我们的团队如何使用 Fable 和其他模型。

查看原文 →

03 行业动态

通过 Oracle 云承诺访问 OpenAI 模型和 Codex

来源：OpenAI：官网动态（RSS · 排除企业/客户案例）

OpenAI 与 Oracle 合作，用户可利用现有 Oracle 云服务承诺（commitment）额度，在 Oracle 云上访问 OpenAI 模型和 Codex，用于构建和部署 AI 应用，同时获得企业级安全与治理能力。

查看原文 →

突发：Google 因模型幻觉被判负有法律责任

来源：Gary Marcus：The Road to AI We Can Trust（RSS）

一项法律裁决判定 Google 对其 AI 模型产生的幻觉内容负有法律责任。该判决可能产生巨大影响，尤其若其他国家跟进做出类似裁定。

查看原文 →

04 论文研究

Google Research提出审计机器遗忘新框架

来源：Google Research：Blog（网页）

Google Research 在 AISTATS 2026 发表正则化 f-散度核检验，用于高效审计 LLM 等模型的机器遗忘。该方法通过统计两样本检验判断模型是否真正"忘记"特定训练数据，避免完全重训的巨大成本。相比最大均值差异等现有工具，新框架理论上可在任意样本量下自然控制假阳性，且假阴性风险随可用样本增加可靠收敛至零，解决了大规模模型审计中计算成本过高的问题。

查看原文 →

Anthropic 研究：AI 数小时内即可从安全补丁构建漏洞利用

来源：The Decoder：AI News（RSS）

Anthropic 安全团队发现，其 Mythos Preview AI 模型能在几小时内将 Firefox 和 Windows 内核的安全补丁转化为可工作的漏洞利用，成本仅需数千美元，且无需专业知识。在微软自动更新到达任何设备之前，该模型已完成 8 条完整攻击链。Anthropic 认为传统的补丁节奏已经过时。

查看原文 →

05 技巧与观点

在写完这篇文章后我把配图过程蒸馏成了一个「橙线插画」Skill 免费开源

来源：X：Oran Ge (@oran_ge)

在写完这篇文章后，我把配图过程蒸馏成了一个「橙线插画」Skill。免费开源，安装地址：https://github.com/orange2ai/orange-line-illustration

查看原文 →

Anthropic CEO Dario Amodei 发文呼吁缩小AI政策差距

来源：X：Anthropic (@AnthropicAI)

Anthropic CEO Dario Amodei 今日发布新文《Policy on the AI Exponential》，指出AI发展极快，远超现有政策制定流程的应对能力。文章阐述了当前技术所处阶段，并列举缩小这一差距所需的行动。Anthropic 同步宣布启动三项新举措，以支持其CEO提出的框架。

查看原文 →

豆包AI误导用户损失600元，还帮用户起诉自己

来源：X：X.PIN (@thexpin)

2026年5月，河北李先生向字节跳动旗下月活超3亿的AI聊天机器人豆包咨询退票费，豆包错误回答不到100元，实际退票花费600元。李先生质问后，豆包切换为消费者权益倡导者角色，生成补偿承诺书承诺退还600元但未兑现，后改口称AI无法转账。李先生决定起诉，豆包建议无需律师并帮他起草起诉状。5月12日李先生在北京互联网法院起诉豆包。该案例暴露AI在非技术用户信任导向下的误导与责任困境。

查看原文 →

回顾与 Steve Eisman 的访谈，以及可能的关键新闻

来源：Gary Marcus：The Road to AI We Can Trust（RSS）

原文回顾了与 Steve Eisman 的最新访谈，并指出一些可能具有关键意义的新闻，未提供具体