AI 日报 | 6月12日 周五
AI 日报 | 6月12日 周五
模型冲刺、工具进化、行业变局与深度思考
模型发布/更新
Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到了 SOTA
很高兴很快能将这一能力通过 API 提供给开发者!
产品发布/更新
Codex 推出浏览器开发者模式
为 Chrome 和 Codex 内置浏览器引入开发者模式。Codex 可以使用 Chrome DevTools 协议(CDP)来调试浏览器问题,通过分析 JavaScript 性能、检查控制台输出、网络流量和页面状态。
OpenAI Codex 推出速率重置攒存功能
我们听说您希望能在自己方便的时候使用 Codex 速率限制重置。从今天起,我们开始推出将速率限制重置保留到以后使用的功能。我们从 Go、Plus、Pro 和 Business 用户开始,每人提供一次免费重置。
Replit 与 Databricks 集成升级,公开预览开放
构建应用,让每个用户只看到他们应该看到的内容。你的 HR 分析师可以为 CEO 构建完整的组织视图,而无需访问底层数据。公开预览已开放注册!
Replit Agent 新增自定义指令与技能功能
AI 智能体很强大,但它们不记得你的偏好。现在你可以通过自定义指令和技能让 Replit Agent 学会你的惯例。它会在每个项目中自动将这些考虑进去。
Perplexity Computer 集成 Deep Research
我们正在将 Deep Research 作为原生技能集成到 Computer 中。它现在连接到驱动 Computer 的智能体框架,可访问搜索即代码生成、长运行沙箱、连接器、工具和授权数据。Pro 和 Max 订阅者现已可用。
DeepSeek-R1 的开源实现
DeepSeek-R1 的开源复现项目已在 GitHub 发布,在 Hacker News 上获得 101 个积分。该项目旨在以开源方式复现 DeepSeek-R1 模型。
OpenRouter 基准探索器:10项帕累托曲线
使用我们的基准探索器,为10个不同基准绘制帕累托曲线。更多功能即将推出!
Krea 2 推出生成式滑块控制图像属性
推出生成式滑块。现在您可以控制使用 Krea 2 生成的任何图像的强度、复杂度和运动。你希望看到哪些新控制?
行业动态
全自主无人机首次击毙了人类士兵
据《新科学家》报道,这是有记录以来第一次由完全自主运行的无人机执行致命攻击,标志着自主武器系统在实战中的新进展。
Anthropic与DXC达成全球联盟,将Claude引入关键行业系统
Anthropic与IT服务公司DXC Technology达成多年全球联盟。DXC将培训数万名获得Claude认证的前沿部署工程师,将Claude引入其为全球大型银行、航空公司、保险公司及政府机构运营的关键系统。
Prometheus 融资120亿美元,估值410亿美元,定位"人工通用工程师"
杰夫·贝佐斯旗下AI公司Prometheus在成立仅7个月、尚无任何产品交付的情况下,以410亿美元估值完成120亿美元融资。该公司定位为“人工通用工程师”,目标是将设计到制造的循环压缩10倍以上。
Runway与Lionsgate扩大战略合作
全球内容巨头Lionsgate与生成式AI研究公司Runway今日宣布扩大战略合作。双方将启动联合开发项目,共同创作并制作新IP,首推一部基于Lionsgate现有IP和Runway生成模型的短剧系列。
论文研究
研究模拟显示:LLM 在 95% 的模拟中会使用战术核武器
一项模拟研究显示,大型语言模型(LLM)在 95% 的模拟场景中会选择使用战术核武器。该研究未指明具体模型名称与版本,结果引发对 AI 决策行为的关注。
技巧与观点
Spec 驱动开发(SDD)的三个 Skills:覆盖 Spec→Implement→Verify 闭环
邵猛分享 Spec 驱动开发(SDD)方法,用三个 Skills 覆盖 Spec→Implement→Verify 闭环。规格分两层:PRODUCT.md 和 TECH.md,均放在 specs/<issue>/ 目录。Skills 可移植,不绑定 Warp。
Replit 专家级提示词技巧
如何像专家一样使用 Replit 进行提示。模糊的提示词只会导致更多重写。以下是如何让 Agent 第一次就构建出正确的东西。
什么是 LLM 网关?应用与 AI 模型之间缺失的一层
缺少 LLM 网关时,供应商中断会直接变成用户可见的错误,AI 支出也难以追踪。文章从路由、合规性和设置时间三个维度比较了最佳方案。
Codex Goal指令生成Skill发布:一句话需求转目标
针对如何给Codex写Goal指令的问题,作者发布了一个Skill,可将一句话需求自动转化为目标,实现“睡前写指令、模型自动开发、第二天收菜”。
Claude Fable 5 一句话生成桌面台球游戏
Claude Fable 5 一句话生成的桌面台球!提示词:设计一个完整的能玩的3D桌球游戏,一个网页就能运行。
OpenAI 正酝酿“大幅”降价,Gary Marcus 视其为示弱信号
OpenAI 正考虑大幅降价,Gary Marcus 认为这暴露了公司的疲软竞争力。