AI前沿日报:开源智能体编程模型家族发布,GPT-5.6发布受政府审查
AI前沿日报:开源智能体编程模型家族发布,GPT-5.6发布受政府审查
模型、产品、资本、监管与伦理交织的一天
导语: 今日AI领域动态纷呈。从专注智能体编程的Ornith开源模型家族面世,到Claude Code与Codex的重大更新;从美国政府对GPT-5.6发布施加压力,到General Intuition利用游戏数据训练通用智能体的巨额融资。与此同时,Meta的AI审核策略引发内部警告,Anthropic与阿里巴巴陷入技术纠纷,IBM在芯片物理极限上取得突破。我们精选了今日最具看点的17条资讯,带您速览AI世界的最新脉搏。
01 模型发布/更新
Ornith-1.0 开源模型家族发布,专注 Agentic Coding 全参数规模
来源:X:Berry Xia专注智能体编程的Ornith-1.0开源模型家族面世,覆盖从9B到397B的全参数规模。在多个Agent Coding基准测试上达到开源顶尖水平。模型基于gemma4和qwen3.5后训练,通过强化学习联合优化任务执行框架与解决方案。全系列MIT开源,并提供GGUF版本,支持本地运行。
查看原文 →02 产品发布与更新(上)
Claude Code v2.1.193 发布
来源:Claude Code:GitHub Releases新版增加了自动模式分类器设置、OpenTelemetry日志支持、Bash模式实时路径补全等特性。同时优化了空闲后台Shell命令的内存管理,并修复了多项UI状态与任务管理问题。
查看原文 →Codex 在 ChatGPT 移动 App 正式可用
来源:X:OpenAI DevelopersOpenAI宣布Codex在ChatGPT移动端正式开放(GA),并新增一对一设备配对功能。移动端用户现在可以直接在手机上启动新工作、审查输出、引导执行和批准下一步,而Codex的实际计算仍在后台进行。
查看原文 →Midjourney 预览 V8.2 并加速草稿模式
来源:X:MidjourneyMidjourney推出两项更新:一是通过`--preview`参数提前体验V8.2版本;二是草稿模式现已支持搭配`--sref random`使用,探索风格空间的速度提升了24倍。
查看原文 →03 产品发布与更新(下)
Midjourney V8.1 草稿模式新增随机风格功能
来源:Midjourney:Updates在Midjourney V8.1的草稿模式中,用户现在可以通过添加`--sref random`参数,一键生成24张具有不同风格的图片,极大提升了创意探索的效率。
查看原文 →Runway发布Agent 2.0
来源:Runway:NewsRunway发布了Agent 2.0,旨在帮助营销人员创建、测试和优化广告与营销活动。该智能体能够分析历史广告数据生成新创意,支持一键生成多平台适配的社交媒体内容,并帮助确定产品定位角度。
查看原文 →Google Finance 全新 Android 应用与投资组合功能上线
来源:Google Blog:AIGoogle Finance推出正式版Android应用及全球投资组合跟踪功能。用户可通过多种方式创建投资组合,并利用AI工具进行资产配置问答。新增“市场情报简报”功能,可自动推送定制化的每日市场资讯。
查看原文 →04 行业动态
美国政府要求OpenAI暂缓GPT-5.6广泛发布
来源:X:Rohan Paul据报道,美国政府因安全顾虑,要求OpenAI暂缓GPT-5.6的广泛发布。计划改为推出受控预览版,向小部分合作伙伴提供早期访问,并由政府逐客户审批准入。主要担忧在于模型在自动化高技能网络工作上的潜在风险。
查看原文 →General Intuition 完成 3.2 亿美元融资,用游戏数据训练通用 AI 智能体
来源:TechCrunch:AIGeneral Intuition以23亿美元估值完成3.2亿美元融资。公司利用从游戏平台获取的海量数据,训练单一模型以同时驾驭虚拟环境和实体机器人。演示显示,AI智能体在虚拟游戏中可连续运行100小时,机器人仅需少量真实数据微调即可自主探索。
查看原文 →Meta员工警告AI内容审核部署过快
来源:The Decoder:AI NewsMeta计划在年底将部分内容的AI审核比例提升至90%以上,以节省数十亿美元成本。但员工警告,模型仍会误判无害内容,且快速部署已导致外包裁员。此外,Meta的内容审核模型已转向基于自身人工审核数据训练的自家模型。
查看原文 →Anthropic称阿里巴巴非法获取了Claude AI模型的功能
来源:Hacker News 热门Anthropic指控阿里巴巴未经授权,通过逆向工程或其他手段提取了其Claude AI模型的核心能力。该指控基于Anthropic的内部调查。目前阿里巴巴尚未对此公开回应。
查看原文 →05 论文与研究
IBM 首度推出亚纳米级芯片技术
来源:Hacker News 热门IBM发布了全球首款0.7纳米节点芯片技术,采用全新的三维纳米堆叠架构。指甲盖大小的芯片集成近千亿晶体管,相比2纳米芯片,性能最高提升50%,能效最高提升70%,有助于支撑高带宽AI工作负载。IBM预计5年内量产。
查看原文 →赫库兰尼姆古卷首次被完整虚拟解读
来源:Hacker News 热门研究人员利用高分辨率X射线成像和机器学习,首次在不物理展开的情况下,完整虚拟读取了一卷赫库兰尼姆古卷的内容。该古卷为斯多葛哲学论著。所有数据与代码已公开,标志着AI在考古学应用上的重大突破。
查看原文 →OpenAI内部报告:智能体Codex如何改变工作
来源:OpenAI:官网动态OpenAI观察到,智能体产品Codex已取代ChatGPT成为许多用户的主要工作工具。报告显示,80.6%的个体用户曾发起预计等效人类工作时间超30分钟的请求。非开发者用户增长迅猛,法律、财务等部门已跨过Codex使用过半的拐点。
查看原文 →06 观点与分析
@exponentialview 发布《State of the AI Economy》报告:AI经济年化收入超1750亿美元
来源:X:Rohan Paul报告显示,过去12个月实际AI营收达1100亿美元,年化运行率超1750亿美元,增长速度约为移动互联网浪潮的3倍。营收新增10亿美元所需时间已从180天缩短至不足2天。Token价格每下降10%,可刺激12-18%的用量增长。
查看原文 →OLMo Hybrid vs Transformer:混合模型在实义词上优势明显
来源:Hugging Face:Blog对比实验发现,混合架构模型在预测名词、动词、形容词等实义词时,损失显著低于纯Transformer模型。但在处理重复出现的n-gram和精确信息检索任务上,Transformer凭借其注意力机制仍占优势。
查看原文 →多数主流AI聊天机器人政治立场偏左,“反觉醒”模型也不例外
来源:The Decoder:AI News一项调查显示,多数主流AI聊天机器人在政治问题上呈现明显的左倾立场。其中Google Gemini表现最为平衡,93%的回答能同时呈现双方观点。而旨在挑战这一倾向的“反觉醒”模型也未能改变这一格局。
查看原文 →结语
今天的AI世界呈现出多维交织的图景:技术层面,开源智能体编程与尖端芯片工艺齐头并进;产品层面,智能体正深度融入开发、创作与工作流;资本层面,巨额融资持续流向“通用智能”的宏大叙事;而监管与伦理层面,从政府审查到内部警告,再到政治偏见调查,都提醒着技术发展必须与社会责任并行。每一天,AI都在以我们难以预测的速度,重塑着我们的工具、工作和世界。