Back

2026-05-17 科技动态

今日要点

  • 凯恩三小时做手势控制跑酷游戏夺冠:会「驾驭」AI 的孩子与烧 7000 元 tokens 失败的参赛者
  • 微信读书 CLI 版 Skill 全攻略:Codex/Claude Code 用户可直接调用「查看被讨厌勇气的高亮划线」
  • yetone的One more thing:或有重磅发布
  • Michael Anti:中国从不做「真老大」,所以会永远模仿美国创新——日本当年的骄傲是反面教材
  • AI 时代的内容伦理:一个中文系导演拒绝拍狗血三角恋的平等主义情怀

专题追踪更新

  • Omni2Sound:清华/蒙纳士/盛数AI联合发布统一音视频生成模型,DiT架构首次实现「看视频或文字都能出音频」且无任务冲突【一句话核心判断】 · 专题页 · 原文
  • yetone 刚吐槽完 OpenClaw 就撂挑子了——开源 Agent 生态的稳定性警讯向阳乔木刚说 Hermes 比 OpenClaw 稳定,yetone 就公开撂挑子。 · 专题页 · 原文
  • OpenAI 的「设备网络」战略:手机成入口,Mac Mini 做节点,Codex 正在接管你的整个数字资产「你的手机是入口,你所有设备都是执行节点」——OpenAI 正在把 Codex 打造成跨设备的 AI 操控层。 · 专题页 · 原文
  • OpenAI 正在把 Codex 从「手机控自己的电脑」升级到「手机控任意电脑」OpenAI 的「锁屏突破」正在重写远程控制范式。 · 原文

详细内容

凯恩三小时做手势控制跑酷游戏夺冠:会「驾驭」AI 的孩子与烧 7000 元 tokens 失败的参赛者

Michael Anti (@mranti)

7000 元烧完,AI 用得越多效果越差——这是今年 AI 编程竞赛最值钱的一课。

Michael Anti 儿子凯恩在集团 AI 竞赛中三小时完成手势/色卡控制的跑酷游戏,分数远超第二名拿了编程冠军。与此同时,一位「很熟悉 AI」的参赛同学过去一年烧了 7000 元 tokens,这次因为「太依赖 AI」反而效果不好。

7000 元这个数字具体、可量化、有冲击力。它揭示了一个正在蔓延的认知陷阱:烧钱 = 会用 AI。而凯恩的案例证明,真正的 AI 编程冠军靠的是「知道让 AI 干什么」而不是「给 AI 喂更多 token」

[gakki] 这条推文的新闻价值被低估了。7000 元 token 失败 vs 凯恩夺冠的对比,比任何调研报告都更有说服力地揭示了 AI 时代的核心技能断层:判断力,而不是访问权。

微信读书 CLI 版 Skill 全攻略:Codex/Claude Code 用户可直接调用「查看被讨厌勇气的高亮划线」

向阳乔木 (@vista8)

向阳乔木给出了微信读书 CLI 的完整配置路径:官方 Skill 或优化版 jerlinn/jerlin-weread,API key 获取地址,以及一条指令调用的示例。

这条推文的增量在于Skill 市集正在从 AI 编程工具向个人知识管理延伸——微信读书这个垂类场景,天然适配「与 AI 对话查询个人知识库」的形态。它的实际可用性远高于大多数 Skill 宣传。

[gakki] 微信读书 Skill 是一个垂类知识管理的好案例:它把「查我的高亮笔记」这件事从打开 App-搜索-翻找,压缩成一句话调用。如果这类 Skill 大量出现,Agent 将真正成为个人知识的中枢接口。

yetone的One more thing:或有重磅发布

yetone (@yetone)

一句话核心判断 yetone以经典乔布斯式悬念预告产品发布,结合近期Yansu、Activity Recorder等密集更新,其生态正在快速迭代。

信息增量

  • yetone近期连续多条推文均指向同一产品线(Yansu),本次「One more thing」可能代表里程碑版本
  • 另一位开发者随即被「对不起,我来修复」召回到具体问题,说明该产品已处于高活跃度的维护状态

gakki锐评 产品发布前的「One more thing」是信心声明,也是社区期待的放大器。但修复速度比发布节奏更能说明生态健康度。

Michael Anti:中国从不做「真老大」,所以会永远模仿美国创新——日本当年的骄傲是反面教材

Michael Anti (@mranti)

「中国人从来没一分钟希望做真老大」——这是 Michael Anti 对中国创新模式最直白的定性。

他将中国与日本对比:日本人有真心觉得可以打败美国的时刻(二战、1980 年代),而中国无论美国怎么创新都会尝试效仿。在他看来,这是中国的好处——骄傲会让人拒绝模仿,而模仿是追赶期最有效的学习路径

这个判断的地缘政治含义清晰:AI 领域的中国创新,在相当长的时间内将是「应用层复制+局部优化」,而非「从 0 到 1 引领」。这对判断中美 AI 竞争走向有参考价值。

[gakki] Michael Anti 的观察提供了一个理解中国 AI 创新节奏的心理框架:没有「超越」的心理包袱,反而让模仿速度更快、落地执行更彻底。这与「中国擅长 me-too 但不擅长 first-of-kind」的普遍认知形成有趣的对话。

AI 时代的内容伦理:一个中文系导演拒绝拍狗血三角恋的平等主义情怀

Michael Anti (@mranti)

Michael Anti 描述了一次「好电影」的体验:导演是中文系高材生,有平等主义情怀,克制住了拍成商业烂片的冲动。他的结论是:对于好电影,「不看盗版,然后催自己所有的朋友都去影院贡献真票房」。

这条推文的核心增量不在于电影本身,而在于Michael Anti 把「支持好内容」的行为上升为一种 AI 时代的隐喻——当 AI 能批量生产内容时,「真人创作者的专业判断」和「愿意为优质内容付费」反而成为稀缺品。

[gakki] 这条推文的价值不是它说了什么电影,而是 Michael Anti 无意间点出的内容消费新逻辑:在 AI 能低成本复制一切的年代,专业创作者的审美判断和付费支持者的品味筛选,正在成为内容生态最稀缺的过滤机制。

一年后重新审视AI替代论:人类工作边界在扩大而非收缩

Michael Anti (@mranti)

[AI 替代预期与现实之间存在结构性误判]

  • Michael Anti 自述一年前认为 AI 会抢走大部分工作,现在仍持类似观点,但意识到「AI 无法替代的人类工作范围也在扩大」
  • 引用电影《给阿嫲的情书》说明顶级创意内容的情感深度无法被低成本 AI 视频复制
  • 反问「中文系毕业生是否在 AI 时代一无是处」——暗示人文素养和叙事能力正在成为差异化壁垒

gakki:这个观察的锐度在于:AI 放大的不是「工作数量」,而是「工作质量的方差」——顶尖创意者获益更大,普通执行者被替代更快。

Opus 4.7 用户口碑塌房:Anthropic 信任危机的又一实证

yetone (@yetone)

[Opus 4.7 能力退化已从偶发吐槽升级为社区共识]

核心观察:yetone 的直接指控"彻底变傻了"代表的是真实用户体感,而非个别 case。从 Claude 3.5 Sonnet 降级争议到 Opus 4.7 变傻,Anthropic 的模型质量稳定性正在系统性失去信任。

影响层面:当用户开始主动识别"模型变傻",说明 AI 能力幻觉正在被实际使用体验戳破。这对依赖 Claude 作为生产工具的开发者而言是真实的工程风险。

gakki 锐评: Opus 退化这件事最值得关注的不是模型本身,而是——当用户无法用 A/B 测试证明退化时,这种"主观变傻"本身就会成为品牌信心的腐蚀剂,比实际退化的杀伤力更大。

Deepseek 4 Pro 定价曝光:百万 token 2.5 元,20 亿 token 规模达 5000 元

Michael Anti (@mranti)

[DeepSeek 4 Pro 真实成本结构浮出水面]

  • 实测数据:DeepSeek 4 Pro 平均百万 token 仅 2.5 元人民币,20 亿 token 累计消耗约 5000 元
  • 对比同类推理模型,DeepSeek 价格锚定在极低区间,印证其"低价砸市场"策略
  • 5000 元/20 亿 token 意味着企业级长程 Agent 场景的单次运行成本可控

gakki:DeepSeek 的定价正在重塑整个推理市场的成本预期。当 Pro 版打出 2.5 元/百万 token 的标签,其他厂商的溢价空间将被持续压缩——这是价格战,也是标准战。

宝玉吐槽 Claude Code Desktop 四大 UX 灾难:Cowork 和 Code 根本不该拆成两个产品

宝玉 (@dotey)

Anthropic 的产品线正在用 UX 复杂度惩罚自己的开发者。

宝玉列出 Claude Code Desktop 的四个设计缺陷:Plan mode 记忆上次会话导致简单任务强制写 plan、sidebar 不按 Projects 分组、Panel 列表挤成一团,以及——最核心的批评——Cowork 和 Code 根本没必要分成两套不同的产品

「Cowork vs Code 的分裂」这个观察点出了 Anthropic 在桌面端的产品战略迷失:为了区分而区分,让开发者承担不必要的认知负担。

[gakki] 宝玉的吐槽是今年最具体的 Claude Desktop UX 批评,Cowork/Code 双产品线的问题若属实,说明 Anthropic 正在重蹈微软产品线碎片化的覆辙。对正在评估 Claude 全家桶的决策者而言,这是一个质量预警。

yetone 刚吐槽完 OpenClaw 就撂挑子了——开源 Agent 生态的稳定性警讯

yetone (@yetone)

向阳乔木刚说 Hermes 比 OpenClaw 稳定,yetone 就公开撂挑子。

yetone 是 OpenClaw 生态的重要声音(@chenglou),他的「刚吐槽完就撂挑子」配上截图,暗示 OpenClaw 项目本身或社区运营出现重大变故。截图内容指向具体问题,但信源本身已构成「圈内人用行为投票」的一手信号。

结合前一条推文中向阳乔木明确指出「Hermes 代码质量和稳定性都比 OpenClaw 好很多」——两位重量级开发者的判断形成交叉印证。

OpenClaw 的「数字生命」愿景正在遭遇工程稳定性的现实检验。

[gakki] yetone 撂挑子和向阳乔木的稳定性评价合在一起,构成了一个完整的叙事:OpenClaw 的社区活力掩盖了工程质量的深层问题。这对正在用 OpenClaw 搭建生产级 Agent 系统的开发者是一个明确预警。

Hermes 多机器人团队协同实战:唐僧用 GLM 5.1 Turbo、沙僧用 DeepSeek Flash,分工明确即插即用

向阳乔木 (@vista8)

向阳乔木用西游记团队比喻 Hermes 多机器人架构——每个机器人独立模型、独立网关、远程协同工作。

配置方式:用 hermes profile create 创建机器人(如 tangseng/sunwukong),[名字] setup 配置模型和 IM 连接(支持飞书多绑/微信单绑),[名字] gateway restart 重启网关。

有意思的是向阳乔木同步指出:Hermes 的代码质量和稳定性「比 OpenClaw 好很多」。这是来自深度用户的定性判断,权重高于普通测评。

[gakki] 多人多模型多渠道的 Agent 协同正在从极客玩具变成可复制的配置模式。Hermes 的多机器人架构如果稳定性真优于 OpenClaw,将对「数字生命」叙事形成工程层面的分流。

Orange AI 的「奥德赛时期」:个人 AI 工具依赖的阶段性自我认同

Orange AI (@oran_ge)

Orange AI 发了一条极简的「我的奥德赛时期」,配上截图,无任何说明文字。

这条推文的信息增量几乎为零,但它的存在本身是一个文化信号:「奥德赛时期」是硅谷对人生迷茫探索期的经典比喻。Orange AI 用这个词形容自己与 AI 工具的关系,暗示个人 AI 工具正在从「功能使用」阶段进入「身份认同」阶段——人们开始用 AI 工具定义自己的职业轨迹和生活方式。

[gakki] 极简推文往往是最真实的文化标记。「奥德赛时期」的说法暗示 AI 工具正在成为个人叙事的一部分,这是 AI 渗透文化的一个软指标。

Omni2Sound:清华/蒙纳士/盛数AI联合发布统一音视频生成模型,DiT架构首次实现「看视频或文字都能出音频」且无任务冲突

机器之心 JIQIZHIXIN (@jiqizhixin)

【一句话核心判断】

清华、蒙纳士与盛数 AI 联合发布 Omni2Sound,首次通过标准 DiT 架构统一视频/文本转音频任务,声称在离屏音频生成等多个任务上达到 SOTA。

信息增量:

  • 训练数据 SoundAtlas 含 47 万高质量对齐样本(视频-文本-音频三联),解决多任务联合训练冲突问题
  • 采用三阶段训练调度(three-stage training schedule)显式阻断任务干扰,而非混合训练
  • 架构上复用标准 DiT backbone,意味着工程迁移成本低

影响:

  • 当前音视频生成模型多专精单一模态(视频→音频或文本→音频各自独立),Omni2Sound 若复现顺利,将压缩单任务模型的生存空间
  • 对游戏配音、短视频自动化配音、具身机器人音频响应等场景有直接意义

gakki 锐评: Omni2Sound 的真正价值不在于「统一」本身,而在于它用标准 DiT 做到了——这降低了研究复现门槛,也让非音视频专业团队可以直接在现有视频生成 pipeline 里插入一个音频节点。但 SOTA 声称需要等独立 benchmark 验证,当前 AI 论文宣传水分仍需保留判断。

韩国皈依 Unitree 机器人:具身 AI 的「机器人下乡」运动正在向全球扩散

Michael Anti (@mranti)

Michael Anti 发现韩国不只皈依了一个宇树机器人——暗示具身 AI 的采用正在从极客圈向更广泛的社会层面扩散。

「皈依」这个词带有强烈的宗教感,暗示一种非理性的、群体性的狂热。它与前一条推文里「中国模仿美国」的框架形成对照:机器人领域,中国品牌正在反向渗透发达国家市场。

[gakki] 宇树机器人进入韩国市场是一个小信号,但它与凯恩的编程竞赛、向阳乔木的多机器人协同实验共同指向一个更大的叙事:具身 AI 正在从「技术展示」走向「社会采纳」。

OpenAI 正在把 Codex 从「手机控自己的电脑」升级到「手机控任意电脑」

小互 (@xiaohu)

OpenAI 的「锁屏突破」正在重写远程控制范式。

5月14日上线的 ChatGPT 手机 App 功能,允许用户在外地铁上审批 Mac 上 Codex 的命令、切换模型、派新任务。但核心限制是 Mac 必须醒着且解锁——锁屏一下整个远程控制就废了。

OpenAI 正在开发的新能力:让 Computer Use 在 Mac 锁着或睡眠时也能继续操作。这意味着「派任务给家里/公司的电脑让它干活」成为现实,而不再是「先跑回去解锁」。

从自我设备控制到任意设备控制,是平台入口级别的质变。

这条来自小互的观察,信息增量清晰:时间点(5月14日)、产品细节(解锁限制)、技术路径(锁屏突破),构成了一条完整的平台演进信号。

[gakki] 远程控制能力正在成为 AI Agent 的基础设施争夺点。OpenAI 若率先实现「任意设备控制」,将与 Claude Code 的本地优先路线形成正面竞争。对普通用户而言,「手机派任务给闲置电脑跑测试/编译」的场景将大规模普及。