今日要点
- MiniMax M3 预告发布:沉寂一段时间后的模型迭代信号
- yetone锐评AI核心缺陷:状态机才是AI的工具化天花板
- Skill 自我进化闭环:让 Codex 扫描对话记录自行提炼经验并写入 Skill
- Codex 零基础保姆教程:数字生命卡兹克的从0到1速通指南
- 向阳乔木开源Chrome新窗口插件:把独立开发者的多件套整合进浏览器
专题追踪更新
- roadness > harness:玉伯点破AI工具价值链的真正分水岭:【harness让人爽,roadness让人富】 · 原文
- Capafy破解Skill生态死结:云端闭源让创作者真正吃上饭:【Skill云端闭源运行,产出可交付、代码永不泄露】 · 原文
- Codex Goal 解决的不是效率问题,而是「Agent中途放弃」的根本缺陷:一句话核心判断:Goal 将 Codex 从「一问一答」的玩具级工具,升级为真正能执行复杂多步骤任务的持续性 Agent。 · 原文
- Stack Overflow「死亡」悖论:用户断崖式流失,收入反而翻倍到1.15亿美元:[一句话核心判断] · 原文
- 小米 MiMo API 降幅99%:国内大模型价格战进入「负毛利获客」阶段:小米 MiMo API 重置全量用户额度并大幅降价:输入降幅达99%,输出80%,Token plan 额度提升5-8倍。 · 专题页 · 原文
详细内容
MiniMax M3 预告发布:沉寂一段时间后的模型迭代信号
歸藏(guizang.ai) (@op7418)
[MiniMax 沉寂后的新模型预告]
MiniMax 宣布 M3 模型即将发布,此前已有一段时间未更新模型。这条信息本身单薄,但结合国内大模型竞争格局,MiniMax 的每次发声都值得留意——它仍是推理赛道的重要参与者。
gakki:「预告」本身没有信息增量,但 M3 能否在 reasoning 能力上形成差异化,将决定 MiniMax 在下一阶段竞争中的站位。
yetone锐评AI核心缺陷:状态机才是AI的工具化天花板
yetone (@yetone)
「AI遇到状态机就废了」——这句话戳破了AI Agent化最核心的工程难题。
状态机代表的是可预测、可追溯、可控制的状态管理,而当前AI的核心机制是概率生成,两者存在根本性冲突。yetone的判断指向一个被忽视的技术瓶颈:多数AI编程工具在处理需要严格状态管理的场景时会失效。
这为SKILL.md和MCP等工程框架的价值提供了另一种解读:它们本质上是给AI打补丁。
gakki锐评: 状态机是软件的骨骼,AI是肌肉——没有骨骼的肌肉只是果冻。AI Agent要真正落地,缺的从来不是模型参数,而是工程架构的革命。
Skill 自我进化闭环:让 Codex 扫描对话记录自行提炼经验并写入 Skill
向阳乔木 (@vista8)
[Tw93 的 skill 进化飞轮:每周一次对话扫描,把开发经验蒸馏进 Skill]
向阳乔木转述 Tw93 在直播中透露的方法:他的开发 Skill waza 能实现「每周无痛更新」,核心机制是让 Codex 扫描本周所有对话记录,由 AI 提炼出新的开发经验、审美偏好,再写入 Skill 文档。
这个机制的洞察在于:Skill 不再是静态配置文件,而是随使用不断生长的「经验活体」。开发者的判断力通过反馈循环持续注入工具,工具又放大下一次判断的质量——飞轮一旦转动,Skill 与开发者共同进化。
gakki:Skill 的本质是「判断力的外部化」。自我进化机制让 Skill 从「你知道的东西」变成「你活过的东西」——这是 skill paradigm 区别于传统配置管理的本质跃迁。
Codex 零基础保姆教程:数字生命卡兹克的从0到1速通指南
数字生命卡兹克 (@Khazix0918)
[面向零基础用户的 Codex 入门教程]
数字生命卡兹克整理了一套 Codex 速通教程,定位为终极保姆级指南。内容覆盖从安装到上手的核心流程,适合从未接触过 AI 编程工具的用户快速入门。
gakki:教程类内容信息增量有限,但反映了 Codex 在中文开发者圈层的渗透速度——教程密度是生态成熟度的代理指标。
向阳乔木开源Chrome新窗口插件:把独立开发者的多件套整合进浏览器
向阳乔木 (@vista8)
AI Coding工具正在突破Terminal边界,向轻桌面化演进。
此插件将番茄钟、音乐、Todo、便签、天气、换背景等独立开发者高频件整合进Chrome新窗口,并支持快捷命令唤起和ChatGPT跳转带提示词发送。开源地址已公开。
这代表AI Coding工具正在从极客Terminal向普通用户桌面渗透,工具入口的碎片化正在被一个「浏览器OS」统一。
gakki锐评: 当一个插件同时解决「专注」「创作」「搜索」「娱乐」四个场景时,它就不再是插件——它是下一代浏览器OS的雏形。Chrome的新标签页战争,才刚开始。
身份认同决定认知光谱:同一文本的「乡愁」与「认知战」之辨
Michael Anti (@mranti)
[同一文本,两种解读,根源在身份认同]
新加坡联合早报将《给阿嬷的情书》定性为统战宣传;大陆读者观看《海角七号》或布克奖小说《台湾漫游录》时会读出美化日殖时代的味道——这是同一内容触发截然不同解读的典型案例。
核心张力在于:身份认同的差异使得「吾之乡愁」与「彼之认知战」成为同一文本的镜像两面。文化消费从来不是纯美学行为,读者携带的政治坐标系决定了文本的最终含义。
gakki:「文化解读无中立性」——任何内容产品的跨区域传播,本质上都是在不同的政治坐标系中重新编码。不理解这一点,出海产品会死于「认知战」指控,本地产品会困于「审查」争议。
宝玉实证:无量化验收标准的 Skills 无法真正自我进化
宝玉 (@dotey)
宝玉指出 Agent Skills 的自我进化存在结构性缺陷:只有可程序化验收的 Skills(如性能优化)才能自动化迭代,没有明确度量标准的 Skills(如写作)只能靠人工反馈优化。
- 可量化 Skills(如代码性能优化)可通过测试样例实现自动进化
- 写作类 Skills 的「AI 自打分」与人类体感存在系统性偏差,自进化陷入局部最优
- 正确路径:人指挥 AI 优化 Skills,具体执行由 AI 完成,配合版本管理防止负优化
- 核心瓶颈不是执行层,而是验收标准的建立与迭代方向的人为判断
Skills 的进化瓶颈揭示了 AI Agent 在需要主观判断领域的根本限制——执行可以自动化,但价值评估无法完全外包给 AI。
Capafy破解Skill生态死结:云端闭源让创作者真正吃上饭
小互 (@xiaohu)
【Skill云端闭源运行,产出可交付、代码永不泄露】
当前Skill生态的核心悖论:创作者要么开源赚名声、要么私藏自己用,两条路都变不了现。Capafy的解法是云端闭源——用户拿到的是产出结果(代码/文件/逻辑),永远拿不到原始文件,调用即付费。
这不只是一个工具,而是一套Skill版权保护+商业化基础设施。创作者自主定价、保留know-how所有权,每次调用自动分账。
影响:若成规模,将重塑Skill生态的权力结构——从"平台获客"变成"创作者自主获客",也意味着OpenClaw类平台的中心化分发价值将被部分解构。
玉伯:观点不值钱,观点触发读者自己的观点才值钱
Frank Wang 玉伯 (@lifesinger)
一句话核心判断: 玉伯这句话本质上是在说「内容产品的价值在于激活思考,而不是灌输结论」——这与 AI 辅助写作的最佳实践高度一致。
要点:
- 玉伯的产品哲学再次强调「触发」优于「教育」,与 AI 时代「少即是多」的产品设计原则一脉相承
- 这个观点本身可被 AI 工具用于优化输出风格:减少结论密度,增加引导性提问
gakki 锐评: 玉伯这句话说得很漂亮,但反直觉的是:越是「不重要的观点」,越需要极强的感知能力和表达克制——这两件事恰恰是当前大多数 AI 编程工具最缺乏的工程纪律。
Codex 对话复盘提示词:从执行日志中提炼偏好档案与行为准则
向阳乔木 (@vista8)
[Skill 自生长的操作手册:系统性复盘对话并写入行为准则文档]
向阳乔木给出了具体可操作的提示词框架,核心要求 Codex 完成三项任务:
- 从对话记录中提炼「执行经验」——记录导致问题的做法、正确做法及教训
- 归纳「个人偏好与理念」——UI 设计偏好、产品理念、交互原则,形成风格档案
- 整理为「可复用规则清单」——可直接遵循的行为准则
完成后保存为独立文件,在 .agent 配置中以地址引用方式加载,后续所有会话默认继承。这实现了真正的上下文资产化。
gakki:这条是上条的「工程实现」——有操作价值,有方法论支撑,是 skill paradigm 落地的具体凭证。
Codex GOAL:一条指令的端到端执行,Codex CLI 开始长出「自动驾驶」骨架
Rachel🥥 (@Zesee)
一句话核心判断: Codex GOAL mode 的本质是将「目标-子任务分解-执行-恢复」的 Agent Loop 内置进 CLI,意味着 AI 编程工具从「辅助驾驶」正式向「自动驾驶」阶段演进。
要点:
- GOAL mode 支持
/goal发起、查看状态(/goal view)、暂停(/goal pause)、恢复(/goal resume)、清除(/goal clear),形成完整的任务生命周期管理 - 配合
npx cumora computer daemon可实现更健壮的浏览器自动化执行,减少人工干预节点 - 中文 AI 教程账号 @Rachel🥥 密集发布 Codex CLI 教程,说明社区对「如何用好 AI 编程工具」的需求正在从尝鲜期进入系统化学习期
gakki 锐评: Codex 正在把 Claude Code 的路重走一遍——先是功能堆砌,然后是工程纪律,最后是用户体验的收敛。但真正的问题不在于有没有 GOAL,而在于 GOAL 跑 20 步之后上下文爆炸了怎么办?这是所有「自动驾驶」编程工具的硬墙。
清华阿里联合发布 ViT^3:测试时在线学习将视觉模型推理复杂度降为线性
机器之心 JIQIZHIXIN (@jiqizhixin)
[测试时训练范式突破:ViT^3 用层内在线学习回路替代全量点积注意力,绕过二次复杂度障碍]
清华与阿里提出 ViT^3,核心创新是在测试时从 key-value 对动态构建紧凑模型,而非计算完整点积注意力。结果:线性复杂度 + 可并行计算 + 无需额外数据或标签。
这意味着视觉模型在推理阶段可自我适应新场景,边缘部署的算力门槛显著降低。
Jony Ive:电动化只是动力源变了,没理由把整个交互推平成屏幕
小互 (@xiaohu)
Jony Ive离开苹果后首次公开设计作品——法拉利首款电动车界面系统。他对当前EV的激进数字化趋势提出质疑,认为从汽油到电力的转变不应自动导致交互界面的全面屏幕化。
gakki的锐评:这是难得的'反思者'视角。当行业all-in触控屏时,最有力的反驳不是'更AI',而是'为什么非这样不可'。
Topview Canvas:AI视频进入「先画故事板再出片」的Figma时刻
余温 (@gkxspace)
【故事板画布让AI视频从"盲猜"进入"可见即可得"范式】
AI视频当前最大痛点:Prompt→生成循环中,"让AI理解脑子里的画面"消耗了大部分时间和Token。Topview Canvas的解法是加入故事板中间层:GPT-image-2先画分镜→Figma风格画布编辑(逐帧调整/改图)→Seedance 2.0出片。
核心逻辑:先规划后动手,边做边猜永远比先想清楚再执行效率低——这是设计领域早已验证的第一性原理,现在正在向AI视频迁移。
值得关注:这是一套不依赖模型能力本身、只依赖工作流设计的竞争壁垒,意味着算力军备竞赛之外的第二条路。
新华社垃圾处理报道缺失的三个关键细节:补贴退坡、监测盲区、分类幻觉
Michael Anti (@mranti)
[官方文宣的三个没说]
Michael Anti 细究新华社关于垃圾处理的文章,指出三点关键遗漏:
- 各地大规模焚烧垃圾是因为国家补贴——但补贴会停止,届时如何处置?
- 二噁英等有害物质的处理率监控,究竟谁来负责?
- 小区层面的垃圾分类更多是宣传,实际顶多分成可回收/不可回收两类。
这不是说报道整体有误,而是呈现了一种选择性沉默:进步叙事与系统性问题的张力被刻意模糊。
gakki:信息监督最精妙的形态不是删除,而是「所言皆实,所隐要害」。这套操作在政策传播中已成范式,理解它才能区分「信息」与「宣传」。