下一代解码、多模态开源与裁员暗涌
下一代解码、多模态开源与裁员暗涌
DFlash 投机解码刷新效率记录,MiniMax M3 开源模型表现抢眼,苹果 SIRI 承认“推倒重来”
本日 AI 资讯围绕效率革新、开源生态与行业震荡三大主线展开。在模型侧,DFlash 投机解码技术将推理吞吐量推向新高,MiniMax 开源 M3 模型在多项基准上登顶;产品侧,Meta 将 AI 能力深度整合进社交核心场景;而五角大楼与 Anthropic 的决裂,以及持续蔓延的 AI 裁员浪潮,则揭示了技术应用背后的伦理博弈与社会冲击。
01 模型发布/更新
下一代投机解码:DFlash 与 Spec V2
来源:LMSYS Blog(Chatbot Arena 团队)Z Lab、Modal 与 SGLang 团队联合发布 DFlash 投机解码模型和 SGLang 的默认 Spec V2 引擎。DFlash 采用块扩散+KV 注入并行生成整块 draft token,在 Qwen 3.5 397B-A17B(BF16)的 HumanEval 数据集上、并发 1 时吞吐量达到基线的 4.3 倍。
查看原文 →MiniMax 开源 M3 模型权重及 MSA 技术论文
来源:公众号:MiniMax(稀宇科技)MiniMax 开源了 428B 总参数、23B 激活参数的 M3 模型权重,并同步发布 MSA(MiniMax Sparse Attention)技术论文,该架构显著降低长上下文计算成本。M3 是首个从预训练阶段就进行多模态交错混合训练的开源模型。发布两周后,M3 在 Artificial Analysis 综合智能指数、GDPval-AA 排行榜均获开源模型第一,输出速度已提升至约 80 TPS。
查看原文 →02 产品发布/更新
Meta 在 Facebook 上线"AI Mode",基于平台公开信息合成答案
来源:TechCrunch:AIMeta 宣布在 Facebook 推出“AI Mode”搜索功能,利用 Meta AI 从公开帖子(含群组和 Reels)提取信息并合成答案,用户可用自然语言提问获得摘要。同时新增视频拼贴剪辑、过渡效果及 AI 照片预设,体育迷可在 Stories 中点击“AI Edit”虚拟穿上队服。
查看原文 →OpenRouter新增免费模型gpt-oss-20b和Gemma4 26B
来源:X:OpenRouter (@OpenRouter)OpenRouter 上新增免费容量,由 @eigenlabs 的 Darkbloom 提供:gpt-oss-20b 和 Gemma 4 26B。今天就开始使用这些模型吧!
查看原文 →6倍速!Kimi K2.7 Code 高速版已上线
来源:公众号:月之暗面(Kimi)Kimi K2.7 Code 高速版上线,与普通版为同一模型,输出速度约 5-6 倍,常规编程场景约 180 Token/s,短上下文可达 260 Token/s。API 定价为普通版 2 倍。Kimi Code Plan 用户可通过「抢先体验计划」使用,用量消耗为普通版 3 倍。
查看原文 →Flash-KMeans:IO感知的精确K-Means,在GPU上比FAISS快200倍以上
来源:MarkTechPostUC Berkeley与UT Austin团队开源Flash-KMeans(Apache 2.0),精确实现标准Lloyd's k-Means,通过重构GPU数据流而非改变数学或近似来提速。在NVIDIA H200上,端到端速度比FAISS快200×以上。其FlashAssign核避免物化完整N×K距离矩阵,将IO复杂度从O(NK)降至O(Nd+Kd)。
查看原文 →03 行业动态
五角大楼将大部分日常AI工作流从Anthropic转移,目标9月前完全切断
来源:X:阿易 AI Notes五角大楼宣布已将超2/3日常AI工作流从Anthropic转移,目标9月前清零。起因是年初五角大楼要求Anthropic签署协议允许Claude用于大规模监控和全自动武器,CEO Dario Amodei以模型不可靠为由拒绝。五角大楼将其列为“供应链风险”,起诉未果。OpenAI调整立场获得订单。
查看原文 →Nvidia 加入 AI 债务热潮,发行 200 亿美元债券
来源:The Decoder:AI NewsNvidia 计划通过自 2021 年以来的首次债券发行筹集至少 200 亿美元,消息援引知情人士透露。此举标志着 Nvidia 加入 AI 领域的债务融资热潮。
查看原文 →Salesforce以36亿美元收购AI客服平台Fin
来源:TechCrunch:AISalesforce宣布以36亿美元收购AI客服平台Fin(前身为Intercom)。Fin提供可跨实时聊天、WhatsApp、短信、电话、Slack等多渠道解决客户问题的AI智能体。Salesforce计划利用Fin的技术和团队增强其企业级Agentforce平台,允许企业构建自定义AI智能体以自动化任务。
查看原文 →04 技巧与观点
项目负责人揭秘为何苹果 AI 版 Siri 姗姗来迟:推倒重来,彻底重构
来源:IT之家苹果AI版Siri迟迟未上线,项目负责人迈克·罗克韦尔在WWDC技术分享会上透露,去年团队曾做出在原有Siri基础上小幅改良的可运行版本,但因无法达到产品愿景,最终选择推倒重来,完整从零重构系统,依托全新大模型搭建。重构后的Siri拥有独立应用程序,原生支持多模态交互。
查看原文 →GitHub Copilot CLI 初学者指南:常用斜杠命令概览
来源:GitHub BlogGitHub Copilot CLI 为初学者提供了常用斜杠命令的概述,帮助用户通过命令控制终端中的 AI 智能体。
查看原文 →Skydio CEO Adam Bry:硅谷不应为无人机使用画红线
来源:The Verge:AISkydio是美国最大的无人机制造商,主攻公共安全、军事、能源、基建巡检等企业市场。CEO Adam Bry表示,特朗普政府去年底禁止中国产无人机后,Skydio产品成为主要替代方案。公司认为无人机正从工具转向自主基础设施——通过机库、远程操控和软件整合实现规模化应用,AI在其中扮演关键角色。
查看原文 →AI裁员浪潮成为火药桶
来源:TechCrunch:AI今年科技公司已累计裁员约15万人,日均974人,速度比去年快44%;上月裁员近4万创两年新高,AI连续三个月被列为裁员首要原因。与此同时,AI芯片商Cerebras上市首日市值达670亿美元,SpaceX上市市值2.1万亿美元,Anthropic和OpenAI估值均约1万亿美元。民调显示65%选民认为中产阶级生活遥不可及。
查看原文 →结语
从追求极致推理效率的DFlash,到构建开放多模态基石的M3,再到Siri“破而后立”的决心,技术创新始终在加速。然而,五角大楼的决裂与持续的裁员潮,也如同一面镜子,映照出技术狂飙突进下,商业、伦理与社会责任的复杂交织。如何平衡创新与安全,将成为下一阶段AI发展的关键命题。