今天的AI行业依旧热闹非凡:从底层模型到上层应用,从创业融资到巨头博弈,信息密度极高。模型能力方面,Cartesia一举拿下实时语音转写与合成两项第一,成为新晋“双冠王”。产品应用上,Copilot Cowork、Midjourney、小米MiMo Claw均推出重要更新,AI正深度融入各类工作流。行业格局则持续演变,Anthropic的企业订阅市场份额历史性超越OpenAI,而SpaceX、DeepSeek的大额融资/收购案凸显资本对AI赛道的持续押注。此外,微软向AWS求援、美国政府封禁Fable模型等事件,也折射出AI发展面临的算力与监管挑战。以下是今日精选资讯。
AI 日报:实时语音模型登顶,Copilot Cowork全球可用,Anthropic企业份额首超OpenAI
AI 日报:实时语音模型登顶,Copilot Cowork全球可用,Anthropic企业份额首超OpenAI
Cartesia成为唯一同时拥有听与说模型榜首的提供商;小米发布MiMo Claw正式版;SpaceX以600亿美元收购AI编程公司Cursor。
01模型发布/更新
Cartesia 发布 Sonic 3.5 与 Ink 2 实时语音模型
来源:X:Testing CatalogCartesia 推出 Sonic 3.5 和 Ink 2 两个模型,作为单一实时语音栈,分别负责文本转语音和语音转文本。Ink 2 在 Artificial Analysis 的流式语音转文字排行榜上排名第一;Sonic 3.5 在实时文本转语音中位列榜首,首音频延迟约 82ms。Cartesia 成为目前唯一同时拥有 #1 听与说模型的提供商。
查看原文 →02产品发布/更新
Midjourney V8.1 推出 Draft mode 草稿模式与新功能预览
来源:Midjourney:UpdatesMidjourney V8.1 的 Draft mode 草稿模式每次生成24张低分辨率低质量图片。用户可对任意图片点击 “Vary”,将其渲染为全质量、全分辨率版本。草稿任务消耗的快速小时数减半。
查看原文 →Copilot Cowork 全球正式可用,支持多模型
来源:X:Satya NadellaCopilot Cowork 现已全球正式可用,并支持多模型。每个组织都可以让长期运行的智能体处理复杂的多步骤任务,基于组织独特知识和专有技术。
查看原文 →小米 MiMo Claw 正式版发布:旗舰模型+金山办公,全新订阅服务上线
来源:公众号:小米 MiMo小米推出云端轻量化 Claw 类产品 MiMo Claw 正式版,搭载 MiMo-V2.5-Pro 旗舰模型。该模型原生兼容 MCP 工具调用协议,内置百万级超长上下文,支持单会话千次以上连续工具调用。联动金山办公生态,提供 Word、Excel、PPT、PDF 等格式的 AI 生成、预览与在线编辑一站式服务。免费用户每日体验时长升级至4小时,并推出分层订阅服务。
查看原文 →Google Cloud 推出 OKF v0.1:供应商中立的 Markdown 规范,为 AI 智能体提供结构化上下文
来源:MarkTechPostGoogle Cloud 发布 Open Knowledge Format (OKF) v0.1,一种供应商中立的 Markdown 规范,为 AI 智能体提供结构化上下文知识。OKF 将知识表示为带 YAML 前置元数据的 markdown 文件目录,旨在解决组织内部知识碎片化问题,无需专有服务即可跨系统互操作。
查看原文 →03行业动态
Anthropic 5月企业AI订阅份额首超OpenAI,特朗普政府禁令反促采用量创新高
来源:TechCrunch:AIAnthropic 5月企业AI订阅市场份额达41%,首次超越OpenAI(39.5%)。公司刚完成650亿美元融资、估值9650亿美元,并因首次盈利季度秘密提交IPO。特朗普政府要求其禁止非美国人访问最新模型,反而推动企业采用量创纪录。
查看原文 →微软考虑为 Copilot Cowork 集成 DeepSeek V4
来源:X:Kim (@kimmonismus)微软正考虑为 Copilot Cowork 提供微软托管的 DeepSeek V4 版本,作为更便宜的模型选项。由于用户每周执行数百项任务导致成本激增,Copilot Cowork 将放弃无限定价,转向按使用量计费。
查看原文 →Fable 遭美国政府封禁,TechCrunch 质疑真正原因并非模型越狱
来源:Hacker News 热门美国政府对 Anthropic 的模型 Fable 实施封禁,但 TechCrunch 发文质疑,实际原因可能并非此前认为的“模型越狱”问题。该文章在 Hacker News 引发讨论。
查看原文 →美国司法部援引国家安全为xAI未经许可的燃气轮机辩护
来源:The Decoder:AI News美国司法部在一份驳回诉讼的动议中称,xAI的聊天机器人Grok对军事行动至关重要,以此为其在密西西比州设施运行未经许可的燃气轮机辩护。国防部官员表示,Grok是支持军事任务的四款AI模型之一。
查看原文 →SpaceX 以 600 亿美元股票收购 AI 编程公司 Cursor
来源:TechCrunch:AISpaceX 在历史性 IPO 数天后,同意以 600 亿美元股票收购 AI 编程初创公司 Cursor,旨在帮助其围绕 xAI 构建的 AI 部门追赶主要 AI 实验室。此前 Cursor 估值已达 500 亿美元。交易预计于今年第三季度完成。
查看原文 →DeepSeek 完成首轮外部融资,估值超 500 亿美元
来源:The Decoder:AI News中国 AI 初创公司 DeepSeek 完成首轮外部融资,募资超 74 亿美元,估值超 500 亿美元。投资结构特殊,创始人梁文锋个人投入约 200 亿元,腾讯和宁德时代为主要外部投资者。梁文锋表示将继续开源。
查看原文 →微软旗下GitHub遭遇AI算力短缺,转而向AWS寻求支持
来源:Hacker News 热门微软旗下GitHub面临AI算力短缺,微软因此转向亚马逊AWS寻求计算资源支持。原文标题为“Microsoft turns to AWS as GitHub faces AI capacity crunch”。
查看原文 →04论文研究
Anthropic:智能体编码中专业知识回报持续存在
来源:Anthropic:ResearchAnthropic 基于约40万次 Claude Code 交互会话分析发现:人类主导规划决策,Claude 主导执行决策。领域专业知识越强,模型每次指令完成的工作量越多。七个月间调试会话占比下降近一半,使用转向端到端智能体任务。
查看原文 →公开聊天数据能否预测真实世界AI失调?
来源:OpenAI:Alignment 研究博客OpenAI利用WildChat公开数据集模拟模型部署,预测多个GPT模型在真实生产环境中的不良行为率。研究发现公开数据集作为外部审计工具具有可行性,但对技术性和智能体型失调的预测精度有所下降。
查看原文 →05技巧与观点
baoyu-design 本地动画视频导出功能更新
来源:X:宝玉 (@dotey)baoyu-design(本地运行 Claude Design 的 Skill)新增动画视频导出功能。其采用无头 Chromium 逐帧截图 + ffmpeg 编码,以 2 倍 DPR 截图再缩回 1080p,保证细节清晰。项目已开源(MIT),获 1.2K star。
查看原文 →人工智能是否已经让自助类非虚构书籍销声匿迹了?
来源:Hacker News 热门2026年Q1美国成人非虚构书籍销量同比下降9%,自助类下跌26.3%。一位畅销书作者数据显示,其书的销量自2022年起连续大幅下滑,2026年年化跌幅达-57%。作者认为,AI大模型能提供更快、更便宜、更个性化的建议,正在系统性取代自助类书籍的“指令传递”价值。
查看原文 →OpenAI 的领先优势正在快速缩小
来源:Gary Marcus:The Road to AI We Can Trust评论认为 OpenAI 正面临多重危机:缺乏护城河导致市场领先地位下滑;最大投资者微软持续疏远;亏损速度远超预期,年亏损额以 8 倍增长。华盛顿方面和 Elon Musk 成为其潜在的外部变量。
查看原文 →Meta 解散工程部门引发热议
来源:Hacker News 热门6月16日,一篇题为“Why is Meta destroying its engineering organization?”的博客文章出现在 Hacker News,引发业界广泛讨论。具体原因和后续影响尚未明确。
查看原文 →WorkBuddy日活飙升至行业第二的3-4倍,非技术用户涌入
来源:公众号:数字生命卡兹克WorkBuddy日活用户数已达行业第二名的3-4倍,用户不再限于开发者,大量HR、运营、行政等非技术岗位也在使用。其企业版和项目功能进一步扩展了Agent办公场景。腾讯云认为这可能是十年一遇的机遇。
查看原文 →✦结语
今日资讯显示,AI竞争已全面进入深水区:技术层面追求极致性能与多模态统一;应用层面则在加速企业级落地和争夺用户时间;而资本与监管力量正在深度重塑行业格局。从Cartesia的语音模型登顶,到Anthropic在企业市场的逆袭,再到SpaceX的巨额收购,我们看到的是一个技术、产品、资本、地缘政治相互交织的复杂生态。未来几天,这些动态或将引发更多连锁反应。