2026-05-20 科技动态

今日要点

Antigravity 2.0 被指抄 Codex：Google AI 工具的 UI 焦虑
Gemini Omni：世界模型的雏形，通用AGI的初始形态
Karpathy 加入 Anthropic：那个教你训练GPT的人进了Anthropic门
Karpathy 加入 Anthropic：AI 顶级人才从「造神」转向「守门」的行业分水岭
Google I/O 2026全解：Flash做大脑、Spark做入口、Omni做世界模型

专题追踪更新

Karpathy 加入 Anthropic：AI 顶级人才从「造神」转向「守门」的行业分水岭：一句话核心判断： Andrej Karpathy 加入 Anthropic，标志着 AI 顶级人才从「模型能力军备竞赛」向「AI 安全与对齐研究」的战略大迁徙。 · 原文
Karpathy 加入 Anthropic：那个教你训练GPT的人进了Anthropic门：一句话核心判断：AI教育界失去最会讲原理的人，Anthropic多了一个懂如何让模型"自觉"的架构师。 · 原文
LeCun出走Meta创业：顶级AI科学家押注「反LLM」架构，隐含范式转向信号：LeCun从Meta离职创业，押注"反LLM"的架构方向 · 原文
Gemini Omni：世界模型的雏形，通用AGI的初始形态：[小互对Gemini Omni的定性判断：它不是视频编辑器，而是世界模型的雏形，代表通用AGI的初始形态。] · 专题页 · 原文
Antigravit 2.0 更像 Codex，但权限审批和预览体验仍是早期玩具：一句话核心判断 · 原文

详细内容

Antigravity 2.0 被指抄 Codex：Google AI 工具的 UI 焦虑

宝玉 (@dotey)

[Antigravity 2.0 和 Codex「长一个样」]

宝玉评论 Google 新 UI 框架 Antigravity 2.0 与 Codex 高度相似，并指出 Google 舍得抄 UI/UX 是好事，至少不会像 Gemini UI 那么难用。

这侧面印证了 Codex 的交互范式已被市场验证为最优解之一。Google 放下身段抄，说明 AI Coding 工具的形态正在收敛。

gakki：当 Google 开始抄，说明这个 UI 范式已经过了「创新窗口期」，进入「工程实现」的效率竞争阶段。这对用户是好事，对先发者是不小的压力。

查看原文❤️ 59 · 🔄 1 · 💬 33

Gemini Omni：世界模型的雏形，通用AGI的初始形态

小互 (@xiaohu)

[小互对Gemini Omni的定性判断：它不是视频编辑器，而是世界模型的雏形，代表通用AGI的初始形态。]

要点：

Gemini Omni被类比为"视频版的香蕉"，意指其能力远超单纯视频编辑
核心判断：它是世界模型的雏形，意味着对物理世界规律的抽象理解与推理
激进观点：这是通用AGI的初始形态——不是渐进增强，而是范式起点

[gakki] 互联网老炮都知道，每次"XX是AGI初始形态"的叙事出现时，要么是真正的范式转折，要么是营销用力过猛。Gemini Omni的真实水位，需要等实际任务表现而非现场演示。

查看原文❤️ 52 · 🔄 2 · 💬 17

Karpathy 加入 Anthropic：那个教你训练GPT的人进了Anthropic门

歸藏(guizang.ai) (@op7418)

一句话核心判断：AI教育界失去最会讲原理的人，Anthropic多了一个懂如何让模型"自觉"的架构师。

Karpathy 的教程价值在于把复杂模型"白盒化"给公众，加盟 Anthropic 后其公开分享频率大概率骤降，开发者失去了一个重要的知识枢纽。
从战略看，Karpathy 一直强调"模型需要理解自身行为边界"，这与 Anthropic 的 Constitutional AI 路线高度契合，加入后或加速 Claude 的自我解释与对齐工程。
短期最大受影响群体：独立开发者和 AI 学习者——他们的"AI 入门导师"正式转入模型厂商，公开教程产出预计断崖。

Karpathy 加入不代表他会变沉默，但他的输出将从"怎么训练模型"变成"模型为什么这样决策"——这是两种完全不同的知识商品。

查看原文❤️ 44 · 🔄 1 · 💬 14

Karpathy 加入 Anthropic：AI 顶级人才从「造神」转向「守门」的行业分水岭

宝玉 (@dotey)

一句话核心判断： Andrej Karpathy 加入 Anthropic，标志着 AI 顶级人才从「模型能力军备竞赛」向「AI 安全与对齐研究」的战略大迁徙。

信息增量：

Karpathy 是深度学习界「祖师爷」级别人物，曾主导特斯拉 Autopilot、创办 OpenAI 教育部、回 OpenAI 任职——其每一次选择都是行业风向标
加入 Anthropic 而非 OpenAI 或 xAI，表明安全研究机构对顶级人才的吸引力已超越模型能力竞技场

gakki 锐评： Karpathy 的选择不是对 Anthropic 的投票，而是对「AGI 风险不可忽视」这一判断的用脚投票。当最懂 AI 能力边界的人选择去研究边界本身，这本身就是最大的行业信号。

查看原文❤️ 38 · 🔄 1 · 💬 19

Google I/O 2026全解：Flash做大脑、Spark做入口、Omni做世界模型

小互 (@xiaohu)

[Gemini三剑客的产品定位首次厘清：Flash是行动大脑、Spark是远端个人AI Agent入口、Omni是多模态世界模型。]

要点：

Gemini 3.5 Flash升级为"行动大脑"——承担执行与推理职能
Gemini Spark定位为个人AI Agent的远端入口——设备边界正在消融
Gemini Omni定位多模态世界模型——小互认为这是本次大会真正值得关注的变量

[gakki] 三款产品的定位逻辑有意思：入口、执行、世界理解。如果Omni真的能做到世界模型级别的物理直觉，那Flash和Spark就有了真正的大脑。否则只是更贵的语音助手。

查看原文❤️ 30 · 🔄 5 · 💬 5

Gemini CLI 变身 Antigravity CLI：Go 重写底层后瞄齐 Codex，Agent-First IDE 方向确立

余温 (@gkxspace)

[多代理编排工具竞争格局生变，Google 终于有了对标 Codex 的正经武器]

Gemini CLI 退役并以 Antigravity CLI 重生，Go 重写底层意味着性能与跨平台能力的根本性提升。
新增多代理编排和异步工作流能力——这是此前 Gemini CLI 最大短板，现在补齐。
终端可直接调用 Claude Opus 4.6，且网络问题已修复；意味着 Google 与 Anthropic 在工具层的深度合作已穿透。
Antigravity IDE 方向明确向 Codex 的"agent-first"靠拢，产品形态对标意图已不再掩饰。

这不只是品牌重做，而是 Google 在 AI Coding 工具链上终于拿出一款能与 Claude Code / Codex 正面竞争的产品。竞争从模型层蔓延到工具层，2026 年的 AI 开发者工具战争进入新阶段。

gakki锐评： Google I/O 还没正式开场，Antigravity 先声夺人。但 Go 重写底层是多代理编排的正确工程选择——这个赛道终于被 Google 当回事了。

查看原文❤️ 30 · 🔄 4 · 💬 15

Michael Anti 谈台湾：身份认同叙事折射 AI 时代的语言与地缘焦虑

Michael Anti (@mranti)

[台海表态背后是一个南京人的双语教育观]

Michael Anti 从个人家族史出发，解释其国家认同立场，同时强调在 AI 已打通语言的今天，仍坚持送孩子学法语——这是一种在技术平权时代主动保留语言阶级壁垒的明确选择。

gakki：他说「其他技能孩子已自己把握」——这句话比任何 AI 发布会都更能说明问题。当语言成为最后的阶级护城河，AI 反而在帮它加固。

查看原文❤️ 28 · 🔄 2 · 💬 11

Google AI Studio 内置安卓模拟器：浏览器即 IDE 边界彻底模糊

歸藏(guizang.ai) (@op7418)

[AI Studio 连续更新，浏览器内开发安卓应用成为现实]

昨晚 AI Studio 两个重要能力：直接拉取 Google Docs/Sheets 作数据库；网页内开发安卓应用并内置模拟器。

博主实测 3.1 Pro 前端能力强于安卓开发，但内置模拟器这一动作本身是信号——Google 正在抹平「开发环境」与「消费界面」的最后一层纱。

数据库直连 + 模拟器内嵌，两件事叠加意味着 AI Studio 已不再是「学 AI」的工具，而是「用 AI 构建完整应用」的入口。

gakki：内置模拟器是防御性动作——Google 不愿意让 Replit、Cursor 抢走「浏览器即电脑」的定义权。但真正的威胁是：一旦 WebAssembly 安卓兼容层成熟，安卓模拟器本身也会成为历史遗迹。

查看原文❤️ 23 · 🔄 1 · 💬 13

Gemini Omni Flash 上线 Flow：谷歌视频模型开始学Sora走内容创作者渠道

歸藏(guizang.ai) (@op7418)

一句话核心判断：谷歌终于明白视频模型要卖不能只靠技术文档，得学Midjourney搭生态。

Gemini Omni Flash 通过 Flow 平台发布，而非 Google 自有终端——这是谷歌首次将视频生成模型嵌入第三方创作者工具链。
视频生成正在从"模型性能竞争"转向"分发渠道竞争"：谁先拿下内容创作者的工作流，谁就拥有事实标准。
Flow 作为创意工具的属性意味着 Gemini Omni Flash 第一波用户是真实创作者而非评测者，口碑发酵速度会比技术Benchmark更快。

谷歌这次学聪明了——让创作者用脚投票，比发论文更有用。

查看原文❤️ 22 · 🔄 0 · 💬 6

向阳乔木开源油猴脚本矩阵：NotebookLM 接管 YouTube 字幕已成开发者标配工作流

向阳乔木 (@vista8)

[内容消费工具链正在被 AI 重构，字幕→NotebookLM→知识库的单人闭环已成型]

开源的三个脚本覆盖了中文内容生态的核心痛点：小红书/抖音/微信贴图自动上传、YouTube 字幕一键复制、播客倍速调节。
核心价值在于将 YouTube 字幕→NotebookLM/ChatGPT 的管道标准化，这是 2025 年知识工作者的高频需求。
开源而非付费——作者选择生态建设而非变现，这在小红书/KOL 圈层中有一定的示范意义。
开发者工具下沉到内容创作者群体的路径越来越短：油猴脚本降低了门槛，但最终会被原生 AI 工具替代。

gakki锐评： 这类脚本的生命周期不会太长——等 YouTube 和 NotebookLM 都原生支持的时候，这个轮子就不需要再发明了。

查看原文❤️ 21 · 🔄 1 · 💬 7

「容易而正确」的复利陷阱：AI 时代最大的认知误区

天策 (@Leobai825)

[越容易越正确——天策的逆向创业哲学]

天策提出「容易而正确」的做事方法论，自媒体、读书、拍视频、幸福生活、AI 额度用完，核心逻辑是「低阻力路径的持续累积」。

这个观点反主流叙事而行——主流告诉你要做难的事，天策告诉你难的事往往是在对抗复利。

gakki：这个框架的盲点是「容易」的判断标准——容易的事往往是因为别人已经验证过路径，而路径一旦验证完成，壁垒也就消失了。真正的「容易而正确」只在路径尚未被广泛认知的窗口期成立。

查看原文❤️ 20 · 🔄 1 · 💬 7

Gemini Gems 无法固定到侧栏：产品经理在给用户制造不必要的认知税

宝玉 (@dotey)

一句话核心判断：功能做加法体验做减法——这是 AI 产品化进程中最典型的工程思维对用户体验思维的胜利。

常用 Gem 无法固定意味着每次使用需要额外3-4步导航，在高频使用场景下这是致命的摩擦力损耗。
@提及 Gem 的替代方案在输入框层面实现了，但没有替代固定侧栏的即时可达性——产品设计者显然不做高频创作者。
AI 助手的工具属性越强，其可定制性和快速调用就越重要；Gemini 这次更新暴露了谷歌在"AI产品体验"上仍是功能导向而非任务导向。

做AI产品不考虑高频场景，就像做输入法不带剪贴板。

查看原文❤️ 18 · 🔄 0 · 💬 20

Google Genie 3 把美国街景变可漫游世界：风格化变换打开创作空间

歸藏(guizang.ai) (@op7418)

[Google Genie 3 以街景为锚点生成可互动的虚构世界]

用户可选取美国任意谷歌街景地点作为首帧，生成可进入游览的互动世界，黄石公园等知名地标均支持。

核心亮点是风格化变换能力——同一街景可一键转为海底世界或末日废土，代入感强。

这意味着 AI 生成从「单次创作」向「空间体验」延伸，创作边界从帧扩展到可探索的世界。

gakki：街景 + 风格化本质是「数据资源的创作变现」，壁垒在于 Google 街景数据覆盖度，而非模型本身。创作者会买单，但天花板是 Google 愿意开放多少真实世界坐标。

查看原文❤️ 17 · 🔄 1 · 💬 4

Multica：Trello 看板任务分类从「人」变「Agent」，多 Agent 编排的视觉化尝试

向阳乔木 (@vista8)

[看板工具正在成为多 Agent 协作的标准入口，不是聊天界面]

Multica 将类 Trello 的看板任务管理引入多 Agent 场景——任务分类从人变成了 Agent 智能体。亮点在于它直接集成 Claude Code、Codex CLI、Hermes 等本地 AI Coding 工具，用户无需额外付费即可驱动并行 AI 提效。执行细节可见的特性保留了人类掌控感，这是当前 Agent 工具普遍缺失的维度。开源地址可见评论。

查看原文❤️ 17 · 🔄 0 · 💬 5

Cola接入Codex套餐：AI工具互通正在绕过平台壁垒

Orange AI (@oran_ge)

[具体产品动态：Orange AI的Cola接入了Codex登录功能，用户可用Codex配额驱动Cola，同时支持自定义GPT/Claude Key。]

要点：

工具互通在发生：Codex的套餐额度可跨产品使用，打破平台封锁
用户侧价值：降低使用成本，Codex配额不再闲置
行业信号：AI工具间的互操作性正在以民间方式快速实现，而非等待官方开放

[gakki] 当一个工具的配额多到"根本用不完"时，它的资产属性就开始向通用算力演变。Cola接Codex不是集成，是算力解放。

查看原文❤️ 16 · 🔄 0 · 💬 4