2026-05-17 科技动态

今日要点

凯恩三小时做手势控制跑酷游戏夺冠：会「驾驭」AI 的孩子与烧 7000 元 tokens 失败的参赛者
微信读书 CLI 版 Skill 全攻略：Codex/Claude Code 用户可直接调用「查看被讨厌勇气的高亮划线」
yetone的One more thing：或有重磅发布
Michael Anti：中国从不做「真老大」，所以会永远模仿美国创新——日本当年的骄傲是反面教材
AI 时代的内容伦理：一个中文系导演拒绝拍狗血三角恋的平等主义情怀

专题追踪更新

Omni2Sound：清华/蒙纳士/盛数AI联合发布统一音视频生成模型，DiT架构首次实现「看视频或文字都能出音频」且无任务冲突：【一句话核心判断】 · 专题页 · 原文
yetone 刚吐槽完 OpenClaw 就撂挑子了——开源 Agent 生态的稳定性警讯：向阳乔木刚说 Hermes 比 OpenClaw 稳定，yetone 就公开撂挑子。 · 专题页 · 原文
OpenAI 的「设备网络」战略：手机成入口，Mac Mini 做节点，Codex 正在接管你的整个数字资产：「你的手机是入口，你所有设备都是执行节点」——OpenAI 正在把 Codex 打造成跨设备的 AI 操控层。 · 专题页 · 原文
OpenAI 正在把 Codex 从「手机控自己的电脑」升级到「手机控任意电脑」：OpenAI 的「锁屏突破」正在重写远程控制范式。 · 原文

详细内容

凯恩三小时做手势控制跑酷游戏夺冠：会「驾驭」AI 的孩子与烧 7000 元 tokens 失败的参赛者

Michael Anti (@mranti)

7000 元烧完，AI 用得越多效果越差——这是今年 AI 编程竞赛最值钱的一课。

Michael Anti 儿子凯恩在集团 AI 竞赛中三小时完成手势/色卡控制的跑酷游戏，分数远超第二名拿了编程冠军。与此同时，一位「很熟悉 AI」的参赛同学过去一年烧了 7000 元 tokens，这次因为「太依赖 AI」反而效果不好。

7000 元这个数字具体、可量化、有冲击力。它揭示了一个正在蔓延的认知陷阱：烧钱 = 会用 AI。而凯恩的案例证明，真正的 AI 编程冠军靠的是「知道让 AI 干什么」而不是「给 AI 喂更多 token」。

[gakki] 这条推文的新闻价值被低估了。7000 元 token 失败 vs 凯恩夺冠的对比，比任何调研报告都更有说服力地揭示了 AI 时代的核心技能断层：判断力，而不是访问权。

查看原文❤️ 142 · 🔄 4 · 💬 22

微信读书 CLI 版 Skill 全攻略：Codex/Claude Code 用户可直接调用「查看被讨厌勇气的高亮划线」

向阳乔木 (@vista8)

向阳乔木给出了微信读书 CLI 的完整配置路径：官方 Skill 或优化版 jerlinn/jerlin-weread，API key 获取地址，以及一条指令调用的示例。

这条推文的增量在于Skill 市集正在从 AI 编程工具向个人知识管理延伸——微信读书这个垂类场景，天然适配「与 AI 对话查询个人知识库」的形态。它的实际可用性远高于大多数 Skill 宣传。

[gakki] 微信读书 Skill 是一个垂类知识管理的好案例：它把「查我的高亮笔记」这件事从打开 App-搜索-翻找，压缩成一句话调用。如果这类 Skill 大量出现，Agent 将真正成为个人知识的中枢接口。

查看原文❤️ 52 · 🔄 6 · 💬 11

yetone的One more thing：或有重磅发布

yetone (@yetone)

一句话核心判断 yetone以经典乔布斯式悬念预告产品发布，结合近期Yansu、Activity Recorder等密集更新，其生态正在快速迭代。

信息增量

yetone近期连续多条推文均指向同一产品线（Yansu），本次「One more thing」可能代表里程碑版本
另一位开发者随即被「对不起，我来修复」召回到具体问题，说明该产品已处于高活跃度的维护状态

gakki锐评 产品发布前的「One more thing」是信心声明，也是社区期待的放大器。但修复速度比发布节奏更能说明生态健康度。

查看原文❤️ 42 · 🔄 1 · 💬 8

Michael Anti：中国从不做「真老大」，所以会永远模仿美国创新——日本当年的骄傲是反面教材

Michael Anti (@mranti)

「中国人从来没一分钟希望做真老大」——这是 Michael Anti 对中国创新模式最直白的定性。

他将中国与日本对比：日本人有真心觉得可以打败美国的时刻（二战、1980 年代），而中国无论美国怎么创新都会尝试效仿。在他看来，这是中国的好处——骄傲会让人拒绝模仿，而模仿是追赶期最有效的学习路径。

这个判断的地缘政治含义清晰：AI 领域的中国创新，在相当长的时间内将是「应用层复制+局部优化」，而非「从 0 到 1 引领」。这对判断中美 AI 竞争走向有参考价值。

[gakki] Michael Anti 的观察提供了一个理解中国 AI 创新节奏的心理框架：没有「超越」的心理包袱，反而让模仿速度更快、落地执行更彻底。这与「中国擅长 me-too 但不擅长 first-of-kind」的普遍认知形成有趣的对话。

查看原文❤️ 39 · 🔄 2 · 💬 15

AI 时代的内容伦理：一个中文系导演拒绝拍狗血三角恋的平等主义情怀

Michael Anti (@mranti)

Michael Anti 描述了一次「好电影」的体验：导演是中文系高材生，有平等主义情怀，克制住了拍成商业烂片的冲动。他的结论是：对于好电影，「不看盗版，然后催自己所有的朋友都去影院贡献真票房」。

这条推文的核心增量不在于电影本身，而在于Michael Anti 把「支持好内容」的行为上升为一种 AI 时代的隐喻——当 AI 能批量生产内容时，「真人创作者的专业判断」和「愿意为优质内容付费」反而成为稀缺品。

[gakki] 这条推文的价值不是它说了什么电影，而是 Michael Anti 无意间点出的内容消费新逻辑：在 AI 能低成本复制一切的年代，专业创作者的审美判断和付费支持者的品味筛选，正在成为内容生态最稀缺的过滤机制。

查看原文❤️ 36 · 🔄 0 · 💬 7

一年后重新审视AI替代论：人类工作边界在扩大而非收缩

Michael Anti (@mranti)

[AI 替代预期与现实之间存在结构性误判]

Michael Anti 自述一年前认为 AI 会抢走大部分工作，现在仍持类似观点，但意识到「AI 无法替代的人类工作范围也在扩大」
引用电影《给阿嫲的情书》说明顶级创意内容的情感深度无法被低成本 AI 视频复制
反问「中文系毕业生是否在 AI 时代一无是处」——暗示人文素养和叙事能力正在成为差异化壁垒

gakki：这个观察的锐度在于：AI 放大的不是「工作数量」，而是「工作质量的方差」——顶尖创意者获益更大，普通执行者被替代更快。

查看原文❤️ 29 · 🔄 1 · 💬 18

Opus 4.7 用户口碑塌房：Anthropic 信任危机的又一实证

yetone (@yetone)

[Opus 4.7 能力退化已从偶发吐槽升级为社区共识]

核心观察：yetone 的直接指控"彻底变傻了"代表的是真实用户体感，而非个别 case。从 Claude 3.5 Sonnet 降级争议到 Opus 4.7 变傻，Anthropic 的模型质量稳定性正在系统性失去信任。

影响层面：当用户开始主动识别"模型变傻"，说明 AI 能力幻觉正在被实际使用体验戳破。这对依赖 Claude 作为生产工具的开发者而言是真实的工程风险。

gakki 锐评： Opus 退化这件事最值得关注的不是模型本身，而是——当用户无法用 A/B 测试证明退化时，这种"主观变傻"本身就会成为品牌信心的腐蚀剂，比实际退化的杀伤力更大。

查看原文❤️ 29 · 🔄 0 · 💬 6

Deepseek 4 Pro 定价曝光：百万 token 2.5 元，20 亿 token 规模达 5000 元

Michael Anti (@mranti)

[DeepSeek 4 Pro 真实成本结构浮出水面]

实测数据：DeepSeek 4 Pro 平均百万 token 仅 2.5 元人民币，20 亿 token 累计消耗约 5000 元
对比同类推理模型，DeepSeek 价格锚定在极低区间，印证其"低价砸市场"策略
5000 元/20 亿 token 意味着企业级长程 Agent 场景的单次运行成本可控

gakki：DeepSeek 的定价正在重塑整个推理市场的成本预期。当 Pro 版打出 2.5 元/百万 token 的标签，其他厂商的溢价空间将被持续压缩——这是价格战，也是标准战。

查看原文❤️ 26 · 🔄 0 · 💬 1

宝玉吐槽 Claude Code Desktop 四大 UX 灾难：Cowork 和 Code 根本不该拆成两个产品

宝玉 (@dotey)

Anthropic 的产品线正在用 UX 复杂度惩罚自己的开发者。

宝玉列出 Claude Code Desktop 的四个设计缺陷：Plan mode 记忆上次会话导致简单任务强制写 plan、sidebar 不按 Projects 分组、Panel 列表挤成一团，以及——最核心的批评——Cowork 和 Code 根本没必要分成两套不同的产品。

「Cowork vs Code 的分裂」这个观察点出了 Anthropic 在桌面端的产品战略迷失：为了区分而区分，让开发者承担不必要的认知负担。

[gakki] 宝玉的吐槽是今年最具体的 Claude Desktop UX 批评，Cowork/Code 双产品线的问题若属实，说明 Anthropic 正在重蹈微软产品线碎片化的覆辙。对正在评估 Claude 全家桶的决策者而言，这是一个质量预警。

查看原文❤️ 23 · 🔄 0 · 💬 26

yetone 刚吐槽完 OpenClaw 就撂挑子了——开源 Agent 生态的稳定性警讯

yetone (@yetone)

向阳乔木刚说 Hermes 比 OpenClaw 稳定，yetone 就公开撂挑子。

yetone 是 OpenClaw 生态的重要声音（@chenglou），他的「刚吐槽完就撂挑子」配上截图，暗示 OpenClaw 项目本身或社区运营出现重大变故。截图内容指向具体问题，但信源本身已构成「圈内人用行为投票」的一手信号。

结合前一条推文中向阳乔木明确指出「Hermes 代码质量和稳定性都比 OpenClaw 好很多」——两位重量级开发者的判断形成交叉印证。

OpenClaw 的「数字生命」愿景正在遭遇工程稳定性的现实检验。

[gakki] yetone 撂挑子和向阳乔木的稳定性评价合在一起，构成了一个完整的叙事：OpenClaw 的社区活力掩盖了工程质量的深层问题。这对正在用 OpenClaw 搭建生产级 Agent 系统的开发者是一个明确预警。

查看原文❤️ 22 · 🔄 0 · 💬 3

Hermes 多机器人团队协同实战：唐僧用 GLM 5.1 Turbo、沙僧用 DeepSeek Flash，分工明确即插即用

向阳乔木 (@vista8)

向阳乔木用西游记团队比喻 Hermes 多机器人架构——每个机器人独立模型、独立网关、远程协同工作。

配置方式：用 hermes profile create 创建机器人（如 tangseng/sunwukong），[名字] setup 配置模型和 IM 连接（支持飞书多绑/微信单绑），[名字] gateway restart 重启网关。

有意思的是向阳乔木同步指出：Hermes 的代码质量和稳定性「比 OpenClaw 好很多」。这是来自深度用户的定性判断，权重高于普通测评。

[gakki] 多人多模型多渠道的 Agent 协同正在从极客玩具变成可复制的配置模式。Hermes 的多机器人架构如果稳定性真优于 OpenClaw，将对「数字生命」叙事形成工程层面的分流。

查看原文❤️ 15 · 🔄 0 · 💬 8

Orange AI 的「奥德赛时期」：个人 AI 工具依赖的阶段性自我认同

Orange AI (@oran_ge)

Orange AI 发了一条极简的「我的奥德赛时期」，配上截图，无任何说明文字。

这条推文的信息增量几乎为零，但它的存在本身是一个文化信号：「奥德赛时期」是硅谷对人生迷茫探索期的经典比喻。Orange AI 用这个词形容自己与 AI 工具的关系，暗示个人 AI 工具正在从「功能使用」阶段进入「身份认同」阶段——人们开始用 AI 工具定义自己的职业轨迹和生活方式。

[gakki] 极简推文往往是最真实的文化标记。「奥德赛时期」的说法暗示 AI 工具正在成为个人叙事的一部分，这是 AI 渗透文化的一个软指标。

查看原文❤️ 12 · 🔄 1 · 💬 1

Omni2Sound：清华/蒙纳士/盛数AI联合发布统一音视频生成模型，DiT架构首次实现「看视频或文字都能出音频」且无任务冲突

机器之心 JIQIZHIXIN (@jiqizhixin)

【一句话核心判断】

清华、蒙纳士与盛数 AI 联合发布 Omni2Sound，首次通过标准 DiT 架构统一视频/文本转音频任务，声称在离屏音频生成等多个任务上达到 SOTA。

信息增量：

训练数据 SoundAtlas 含 47 万高质量对齐样本（视频-文本-音频三联），解决多任务联合训练冲突问题
采用三阶段训练调度（three-stage training schedule）显式阻断任务干扰，而非混合训练
架构上复用标准 DiT backbone，意味着工程迁移成本低

影响：

当前音视频生成模型多专精单一模态（视频→音频或文本→音频各自独立），Omni2Sound 若复现顺利，将压缩单任务模型的生存空间
对游戏配音、短视频自动化配音、具身机器人音频响应等场景有直接意义

gakki 锐评： Omni2Sound 的真正价值不在于「统一」本身，而在于它用标准 DiT 做到了——这降低了研究复现门槛，也让非音视频专业团队可以直接在现有视频生成 pipeline 里插入一个音频节点。但 SOTA 声称需要等独立 benchmark 验证，当前 AI 论文宣传水分仍需保留判断。

查看原文❤️ 11 · 🔄 1 · 💬 0

韩国皈依 Unitree 机器人：具身 AI 的「机器人下乡」运动正在向全球扩散

Michael Anti (@mranti)

Michael Anti 发现韩国不只皈依了一个宇树机器人——暗示具身 AI 的采用正在从极客圈向更广泛的社会层面扩散。

「皈依」这个词带有强烈的宗教感，暗示一种非理性的、群体性的狂热。它与前一条推文里「中国模仿美国」的框架形成对照：机器人领域，中国品牌正在反向渗透发达国家市场。

[gakki] 宇树机器人进入韩国市场是一个小信号，但它与凯恩的编程竞赛、向阳乔木的多机器人协同实验共同指向一个更大的叙事：具身 AI 正在从「技术展示」走向「社会采纳」。

查看原文❤️ 11 · 🔄 0 · 💬 3

OpenAI 正在把 Codex 从「手机控自己的电脑」升级到「手机控任意电脑」

小互 (@xiaohu)

OpenAI 的「锁屏突破」正在重写远程控制范式。

5月14日上线的 ChatGPT 手机 App 功能，允许用户在外地铁上审批 Mac 上 Codex 的命令、切换模型、派新任务。但核心限制是 Mac 必须醒着且解锁——锁屏一下整个远程控制就废了。

OpenAI 正在开发的新能力：让 Computer Use 在 Mac 锁着或睡眠时也能继续操作。这意味着「派任务给家里/公司的电脑让它干活」成为现实，而不再是「先跑回去解锁」。

从自我设备控制到任意设备控制，是平台入口级别的质变。

这条来自小互的观察，信息增量清晰：时间点（5月14日）、产品细节（解锁限制）、技术路径（锁屏突破），构成了一条完整的平台演进信号。

[gakki] 远程控制能力正在成为 AI Agent 的基础设施争夺点。OpenAI 若率先实现「任意设备控制」，将与 Claude Code 的本地优先路线形成正面竞争。对普通用户而言，「手机派任务给闲置电脑跑测试/编译」的场景将大规模普及。

查看原文❤️ 9 · 🔄 1 · 💬 4