AI 日报 | Harness-1 发布;ChatGPT 转型超级应用;苹果秘密转向 AI
今日AI速递:从智能体到超级应用,从硬件突破到产业融合
Harness-1 检索子智能体刷新纪录;OpenAI 透露 ChatGPT 向 Agent 平台转型计划;NVIDIA 与 SK Hynix、斗山达成重磅合作。
01 模型前沿
Harness-1:基于强化学习训练的有状态搜索20B检索子智能体
来源:MarkTechPostUIUC与Chroma联合推出Harness-1,一个20B参数的检索子智能体。它通过强化学习在一个有状态搜索框架中训练,该框架维护候选池、重要性标注集、证据图和验证记录。Harness-1在8个基准测试上达到0.730平均curated recall,比下一个最佳开源子智能体高出11.4个百分点,仅落后于Opus-4.6。模型权重和框架代码均已公开。
查看原文 →02 产品与服务
Her · हेर - Claude Code 会话分析工具
来源:Hugging Face:BlogHer是专为Claude Code设计的会话分析工具。它使用Nemotron-Mini-4B-Instruct模型(在Hugging Face ZeroGPU上运行)重建交互历史,标记高风险操作,分析token消耗、工具使用情况,并结合最佳实践给出改进建议。内置Homebrew、npm等主流CLI工具数据库,支持单会话与跨会话分析,评估引擎完全确定,不调用第三方AI API。
查看原文 →NVIDIA 在韩国发布 RTX Spark 超芯片
来源:NVIDIA AI BlogNVIDIA CEO Jensen Huang在韩国正式介绍RTX Spark超芯片。该芯片集成30年技术,可在Windows笔记本上实现全天续航,并以1440p分辨率、超过100fps运行AAA游戏,支持DLSS 4.5 Ray Reconstruction等全套RTX技术。KRAFTON、NC与Riot Games等游戏厂商正合作将旗下游戏适配RTX Spark,已有超过100家开发商采纳。
查看原文 →Opus 4.8 缓存命中率与有效价格可实时查看
来源:X:OpenRouter用户现在可以从OpenRouter的Pricing标签查看Opus 4.8的实时缓存命中率和历史流量数据,帮助开发者更清晰地了解不同模型提供商在缓存效率和成本上的差异。
查看原文 →03 产业与政策
Nvidia 与 SK Hynix 签署多年协议,共同开发下一代 AI 存储芯片
来源:Bloomberg:TechnologyNvidia与SK Hynix达成合作,将共同设计面向AI应用的未来几代存储芯片。此举巩固了SK Hynix在高端半导体领域的领先地位,并为AI算力的持续提升提供关键的存储支持。
查看原文 →英伟达与斗山集团合作推进物理AI及AI工厂基础设施
来源:NVIDIA AI Blog合作覆盖斗山机器人、山猫、能源及电子材料四大板块。斗山机器人将集成Isaac Sim、Cosmos等推进Agentic Robot OS;山猫计划用于建筑、园林设备;斗山能源评估为AI工厂供电;斗山电子材料为英伟达MGX生态供应高性能铜箔基板。
查看原文 →ChatGPT 要变 AgentGPT 了?OpenAI 正筹备最大规模改版
来源:X:宝玉OpenAI正筹备从聊天机器人转向超级应用/Agent平台,整合编程工具Codex、图像生成及第三方应用。高管称“聊天已死”,目标成为跨平台个人AI助手。改版预计未来几周上线。商业压力下,ChatGPT有9亿周活用户但未盈利,企业客户贡献约40%收入。竞争对手Anthropic估值已达9650亿美元。
查看原文 →特朗普政府与OpenAI讨论通过公共财富基金入股AI初创公司
来源:X:Rohan Paul据FT报道,方案是AI企业捐赠小部分股权至该基金,基金通过账户或分红将收益返还美国公民。这旨在让公民分享AI增长红利,并回应选民对失业和企业控制的担忧,同时为AI公司争取华盛顿在基建和监管上的支持。
查看原文 →OpenAI 仍推进超级应用计划
来源:TechCrunch:AI尽管前路挑战重重,OpenAI一位高级员工重申“聊天已死”的同时,公司仍在继续推进其超级应用计划,试图将ChatGPT打造为一个更强大的Agent平台。
查看原文 →04 观点与实践
“Slop、生产力,以及为何AI驱动的世界进展甚微”
来源:Gary MarcusAI学者Gary Marcus援引图表,认为其精准提炼了AI技术目前在生产力层面提升有限的观点,对当前AI发展的实际影响提出了质疑。
查看原文 →苹果秘密会议内幕:它终于认真对待AI
来源:Bloomberg:Technology据报道,苹果在一次内部秘密会议后,决定将AI作为核心战略。这场会议促使公司全面转向AI领域,相关重大进展预计将在WWDC 2026上公布。
查看原文 →Symbolica 2.0:适用于 Python 和 Rust 的可编程符号系统
来源:Hacker News 热门Symbolica 2.0发布,支持Python和Rust语言,为符号计算和形式化验证领域提供了新的工具选择,在开发者社区引起关注。
查看原文 →“我在田里雇了一名工程师,它叫 Codex” -- 北海道一个西兰花农的 8 个真实 AI 用法
来源:X:阿易 AI Notes日本北海道农民富安弘毅用ChatGPT和Codex解决农场实际问题,涵盖病害识别、卫星监测、远程控制温室、开发管理机器人、设计数据库等8个用法。他认为AI让传统昂贵的自动化变得低成本可及,“如同身边有一位超级工程师”。
查看原文 →Harness 工程:在智能体优先的世界中运用 Codex
来源:Hacker News 热门来自OpenAI官方的文章,探讨了在智能体(Agent)优先的开发范式下,如何有效利用OpenAI Codex进行工程实践。
查看原文 →对比一下 GPT-5.5 的设计效果和 Opus 4.8 的设计效果
来源:X:宝玉宝玉对比了GPT-5.5与Opus 4.8的设计能力,认为Opus 4.8效果远优于GPT-5.5。他介绍并推荐了基于Cursor和元素标注的baoyu-design Skill,通过自然语言描述即可生成精良HTML,官方推荐搭配Opus 4.8以获得最佳效果。
查看原文 →结语
今日的AI领域,技术突破正与产业融合、产品形态演进交织前行。从强化学习赋予检索智能体的“有状态”思考,到大型科技公司将游戏、重工、能源与AI深度捆绑,再到AI助手从“对话框”走向“操作系统”的野心,我们看到的是一个从底层硬件到上层应用、从单一技术到复杂系统的全栈演进图景。农民手中的Codex与华尔街关注的万亿估值,共同勾勒出AI技术在下个阶段落地的关键轮廓。未来,AI的价值将越来越多地体现在如何将其能力系统化、工程化,并无缝融入真实世界的复杂工作流中。