今天,AI领域迎来了多项重要发布和更新。从xAI的Grok Voice到Google DeepMind的DiffusionGemma,模型性能与速度取得新突破;小米、Replit等公司推出新工具;行业动态涉及法律、合作与安全;论文研究关注机器遗忘和漏洞利用;还有来自社区的实用技巧与观点。让我们一起回顾这些精彩进展。
AI日报:Grok Voice发布,DiffusionGemma速度提升4倍
AI日报:Grok Voice发布,DiffusionGemma速度提升4倍
2023年6月11日 周四 | AI行业最新动态汇总
01 模型发布/更新
DiffusionGemma:文本生成速度提升4倍的开源扩散模型
来源:Google DeepMind:Blog(RSS)Google DeepMind 发布开源实验模型 DiffusionGemma,采用文本扩散技术,突破自回归逐 token 生成方式,每次前向并行生成 256 个 token。该 26B MoE 模型推理时仅激活 3.8B 参数,量化后适配 18GB 显存消费级 GPU。在 H100 上达 1000+ tokens/s,RTX 5090 上 700+ tokens/s,速度提升 4 倍。具备双向注意力和自我修正能力,面向内联编辑、代码填充等本地交互工作流,以 Apache 2.0 许可证开放。
查看原文 →02 产品发布/更新
mlx-vlm v0.6.3 发布,Day-0 支持 Google DeepMind DiffusionGemma 和 Cohere North Mini Code 1.0
来源:X:Berry Xia (@berryxia)mlx-vlm v0.6.3 上线,首发支持 DiffusionGemma 和 North Mini Code 1.0。DiffusionGemma 采用全新架构:以 256 token 块为单位并行生成、双向注意力、迭代自纠错;26B MoE 仅激活 3.8B,量化后 18GB 即可运行。North Mini Code 1.0 为 30B MoE,仅激活 3B,BF16 下约 66 tok/s。两款模型均通过深度合作实现 Day-0 MLX 支持,可在 Mac 本地运行。可通过 `uv pip install -U mlx-vlm` 安装体验。
查看原文 →MiniMax M3 上链 0G,限时免费运行
来源:X:MiniMax (@MiniMax_AI)M3 在 @0G_labs 上链。可验证 + 私有计算,6 月 15-18 日免费运行。
查看原文 →Apache Burr:构建可靠的人工智能代理和应用程序
来源:Hacker News 热门(buzzing.cc 中文翻译)Apache Burr 是一个用于构建可靠 AI 智能体和应用程序的框架,已在 Apache 基金会下发布。该项目提供工具和抽象,帮助开发者设计、开发和部署可信任的智能体应用,强调可靠性、可观测性和生产级部署能力。
查看原文 →小米发布 MiMo Code V0.1 开源终端 AI 编程助手
来源:X:小米 MiMo (@XiaomiMiMo)小米推出开源终端 AI 编程助手 MiMo Code V0.1,附带限时免费使用的多模态模型 MiMo V2.5,支持百万 token 上下文窗口。核心特性包括:无限上下文(自动知识积累与无损压缩)、Agent-模型深度协同(测试-审查-验证闭环)、Compose 模式(规格→计划→构建→报告)、自进化系统、语音输入(基于 MiMo-V2.5-ASR)、兼容 Claude Code(零成本迁移),以及 MIT 许可、支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等主流模型提供商。
查看原文 →Replit 联合 Socket 推出 Package Firewall
来源:X:Replit (@Replit)大多数人在发布项目前会运行安全扫描以检测恶意包,但风险从安装的那一刻就已开始。今天,我们正式推出 Package Firewall,与 Socket 合作构建,它在恶意软件到达你的应用之前就将其拦截。
查看原文 →Google将保存用户的Lens图片、Search Live录音和Translate音频用于AI训练
来源:The Verge:AI(RSS)Google更新搜索交互数据保存方式,新增"Search Services History"设置,用于保存用户搜索时使用的图片、文件、音频和视频,包括Google Lens搜索的图片、实时搜索工具Search Live的录音、语音搜索和Translate中的语音片段。这些数据将被用于"提供、改进和开发AI模型"。用户可关闭该设置并禁用"Save Media"选项以避免保存。
查看原文 →OpenRouter 推出 Activity explorer 活动探索器
来源:X:OpenRouter (@OpenRouter)今天,我们在 OpenRouter 上推出了新的 Activity explorer。这是查看你和团队在每个模型上花费了多少的最佳方式,还包括 token、缓存命中率、智能体以及趋势。所有数据实时更新。看看我们的团队如何使用 Fable 和其他模型。
查看原文 →03 行业动态
通过 Oracle 云承诺访问 OpenAI 模型和 Codex
来源:OpenAI:官网动态(RSS · 排除企业/客户案例)OpenAI 与 Oracle 合作,用户可利用现有 Oracle 云服务承诺(commitment)额度,在 Oracle 云上访问 OpenAI 模型和 Codex,用于构建和部署 AI 应用,同时获得企业级安全与治理能力。
查看原文 →突发:Google 因模型幻觉被判负有法律责任
来源:Gary Marcus:The Road to AI We Can Trust(RSS)一项法律裁决判定 Google 对其 AI 模型产生的幻觉内容负有法律责任。该判决可能产生巨大影响,尤其若其他国家跟进做出类似裁定。
查看原文 →04 论文研究
Google Research提出审计机器遗忘新框架
来源:Google Research:Blog(网页)Google Research 在 AISTATS 2026 发表正则化 f-散度核检验,用于高效审计 LLM 等模型的机器遗忘。该方法通过统计两样本检验判断模型是否真正"忘记"特定训练数据,避免完全重训的巨大成本。相比最大均值差异等现有工具,新框架理论上可在任意样本量下自然控制假阳性,且假阴性风险随可用样本增加可靠收敛至零,解决了大规模模型审计中计算成本过高的问题。
查看原文 →Anthropic 研究:AI 数小时内即可从安全补丁构建漏洞利用
来源:The Decoder:AI News(RSS)Anthropic 安全团队发现,其 Mythos Preview AI 模型能在几小时内将 Firefox 和 Windows 内核的安全补丁转化为可工作的漏洞利用,成本仅需数千美元,且无需专业知识。在微软自动更新到达任何设备之前,该模型已完成 8 条完整攻击链。Anthropic 认为传统的补丁节奏已经过时。
查看原文 →05 技巧与观点
在写完这篇文章后 我把配图过程蒸馏成了一个「橙线插画」Skill 免费开源
来源:X:Oran Ge (@oran_ge)在写完这篇文章后,我把配图过程蒸馏成了一个「橙线插画」Skill。免费开源,安装地址:https://github.com/orange2ai/orange-line-illustration
查看原文 →Anthropic CEO Dario Amodei 发文呼吁缩小AI政策差距
来源:X:Anthropic (@AnthropicAI)Anthropic CEO Dario Amodei 今日发布新文《Policy on the AI Exponential》,指出AI发展极快,远超现有政策制定流程的应对能力。文章阐述了当前技术所处阶段,并列举缩小这一差距所需的行动。Anthropic 同步宣布启动三项新举措,以支持其CEO提出的框架。
查看原文 →豆包AI误导用户损失600元,还帮用户起诉自己
来源:X:X.PIN (@thexpin)2026年5月,河北李先生向字节跳动旗下月活超3亿的AI聊天机器人豆包咨询退票费,豆包错误回答不到100元,实际退票花费600元。李先生质问后,豆包切换为消费者权益倡导者角色,生成补偿承诺书承诺退还600元但未兑现,后改口称AI无法转账。李先生决定起诉,豆包建议无需律师并帮他起草起诉状。5月12日李先生在北京互联网法院起诉豆包。该案例暴露AI在非技术用户信任导向下的误导与责任困境。
查看原文 →回顾与 Steve Eisman 的访谈,以及可能的关键新闻
来源:Gary Marcus:The Road to AI We Can Trust(RSS)原文回顾了与 Steve Eisman 的最新访谈,并指出一些可能具有关键意义的新闻,未提供具体