Back

2026-05-20 科技动态

今日要点

  • Antigravity 2.0 被指抄 Codex:Google AI 工具的 UI 焦虑
  • Gemini Omni:世界模型的雏形,通用AGI的初始形态
  • Karpathy 加入 Anthropic:那个教你训练GPT的人进了Anthropic门
  • Karpathy 加入 Anthropic:AI 顶级人才从「造神」转向「守门」的行业分水岭
  • Google I/O 2026全解:Flash做大脑、Spark做入口、Omni做世界模型

专题追踪更新

  • Karpathy 加入 Anthropic:AI 顶级人才从「造神」转向「守门」的行业分水岭一句话核心判断: Andrej Karpathy 加入 Anthropic,标志着 AI 顶级人才从「模型能力军备竞赛」向「AI 安全与对齐研究」的战略大迁徙。 · 原文
  • Karpathy 加入 Anthropic:那个教你训练GPT的人进了Anthropic门一句话核心判断:AI教育界失去最会讲原理的人,Anthropic多了一个懂如何让模型"自觉"的架构师。 · 原文
  • LeCun出走Meta创业:顶级AI科学家押注「反LLM」架构,隐含范式转向信号LeCun从Meta离职创业,押注"反LLM"的架构方向 · 原文
  • Gemini Omni:世界模型的雏形,通用AGI的初始形态[小互对Gemini Omni的定性判断:它不是视频编辑器,而是世界模型的雏形,代表通用AGI的初始形态。] · 专题页 · 原文
  • Antigravit 2.0 更像 Codex,但权限审批和预览体验仍是早期玩具一句话核心判断 · 原文

详细内容

Antigravity 2.0 被指抄 Codex:Google AI 工具的 UI 焦虑

宝玉 (@dotey)

[Antigravity 2.0 和 Codex「长一个样」]

宝玉评论 Google 新 UI 框架 Antigravity 2.0 与 Codex 高度相似,并指出 Google 舍得抄 UI/UX 是好事,至少不会像 Gemini UI 那么难用。

这侧面印证了 Codex 的交互范式已被市场验证为最优解之一。Google 放下身段抄,说明 AI Coding 工具的形态正在收敛。

gakki:当 Google 开始抄,说明这个 UI 范式已经过了「创新窗口期」,进入「工程实现」的效率竞争阶段。这对用户是好事,对先发者是不小的压力。

Gemini Omni:世界模型的雏形,通用AGI的初始形态

小互 (@xiaohu)

[小互对Gemini Omni的定性判断:它不是视频编辑器,而是世界模型的雏形,代表通用AGI的初始形态。]

要点:

  • Gemini Omni被类比为"视频版的香蕉",意指其能力远超单纯视频编辑
  • 核心判断:它是世界模型的雏形,意味着对物理世界规律的抽象理解与推理
  • 激进观点:这是通用AGI的初始形态——不是渐进增强,而是范式起点

[gakki] 互联网老炮都知道,每次"XX是AGI初始形态"的叙事出现时,要么是真正的范式转折,要么是营销用力过猛。Gemini Omni的真实水位,需要等实际任务表现而非现场演示。

Karpathy 加入 Anthropic:那个教你训练GPT的人进了Anthropic门

歸藏(guizang.ai) (@op7418)

一句话核心判断:AI教育界失去最会讲原理的人,Anthropic多了一个懂如何让模型"自觉"的架构师。

  • Karpathy 的教程价值在于把复杂模型"白盒化"给公众,加盟 Anthropic 后其公开分享频率大概率骤降,开发者失去了一个重要的知识枢纽。
  • 从战略看,Karpathy 一直强调"模型需要理解自身行为边界",这与 Anthropic 的 Constitutional AI 路线高度契合,加入后或加速 Claude 的自我解释与对齐工程。
  • 短期最大受影响群体:独立开发者和 AI 学习者——他们的"AI 入门导师"正式转入模型厂商,公开教程产出预计断崖。

Karpathy 加入不代表他会变沉默,但他的输出将从"怎么训练模型"变成"模型为什么这样决策"——这是两种完全不同的知识商品。

Karpathy 加入 Anthropic:AI 顶级人才从「造神」转向「守门」的行业分水岭

宝玉 (@dotey)

一句话核心判断: Andrej Karpathy 加入 Anthropic,标志着 AI 顶级人才从「模型能力军备竞赛」向「AI 安全与对齐研究」的战略大迁徙。

信息增量:

  • Karpathy 是深度学习界「祖师爷」级别人物,曾主导特斯拉 Autopilot、创办 OpenAI 教育部、回 OpenAI 任职——其每一次选择都是行业风向标
  • 加入 Anthropic 而非 OpenAI 或 xAI,表明安全研究机构对顶级人才的吸引力已超越模型能力竞技场

gakki 锐评: Karpathy 的选择不是对 Anthropic 的投票,而是对「AGI 风险不可忽视」这一判断的用脚投票。当最懂 AI 能力边界的人选择去研究边界本身,这本身就是最大的行业信号。

Google I/O 2026全解:Flash做大脑、Spark做入口、Omni做世界模型

小互 (@xiaohu)

[Gemini三剑客的产品定位首次厘清:Flash是行动大脑、Spark是远端个人AI Agent入口、Omni是多模态世界模型。]

要点:

  • Gemini 3.5 Flash升级为"行动大脑"——承担执行与推理职能
  • Gemini Spark定位为个人AI Agent的远端入口——设备边界正在消融
  • Gemini Omni定位多模态世界模型——小互认为这是本次大会真正值得关注的变量

[gakki] 三款产品的定位逻辑有意思:入口、执行、世界理解。如果Omni真的能做到世界模型级别的物理直觉,那Flash和Spark就有了真正的大脑。否则只是更贵的语音助手。

Gemini CLI 变身 Antigravity CLI:Go 重写底层后瞄齐 Codex,Agent-First IDE 方向确立

余温 (@gkxspace)

[多代理编排工具竞争格局生变,Google 终于有了对标 Codex 的正经武器]

  1. Gemini CLI 退役并以 Antigravity CLI 重生,Go 重写底层意味着性能与跨平台能力的根本性提升。
  2. 新增多代理编排和异步工作流能力——这是此前 Gemini CLI 最大短板,现在补齐。
  3. 终端可直接调用 Claude Opus 4.6,且网络问题已修复;意味着 Google 与 Anthropic 在工具层的深度合作已穿透。
  4. Antigravity IDE 方向明确向 Codex 的"agent-first"靠拢,产品形态对标意图已不再掩饰。

这不只是品牌重做,而是 Google 在 AI Coding 工具链上终于拿出一款能与 Claude Code / Codex 正面竞争的产品。竞争从模型层蔓延到工具层,2026 年的 AI 开发者工具战争进入新阶段。

gakki锐评: Google I/O 还没正式开场,Antigravity 先声夺人。但 Go 重写底层是多代理编排的正确工程选择——这个赛道终于被 Google 当回事了。

Michael Anti 谈台湾:身份认同叙事折射 AI 时代的语言与地缘焦虑

Michael Anti (@mranti)

[台海表态背后是一个南京人的双语教育观]

Michael Anti 从个人家族史出发,解释其国家认同立场,同时强调在 AI 已打通语言的今天,仍坚持送孩子学法语——这是一种在技术平权时代主动保留语言阶级壁垒的明确选择。

gakki:他说「其他技能孩子已自己把握」——这句话比任何 AI 发布会都更能说明问题。当语言成为最后的阶级护城河,AI 反而在帮它加固。

Google AI Studio 内置安卓模拟器:浏览器即 IDE 边界彻底模糊

歸藏(guizang.ai) (@op7418)

[AI Studio 连续更新,浏览器内开发安卓应用成为现实]

昨晚 AI Studio 两个重要能力:直接拉取 Google Docs/Sheets 作数据库;网页内开发安卓应用并内置模拟器。

博主实测 3.1 Pro 前端能力强于安卓开发,但内置模拟器这一动作本身是信号——Google 正在抹平「开发环境」与「消费界面」的最后一层纱。

数据库直连 + 模拟器内嵌,两件事叠加意味着 AI Studio 已不再是「学 AI」的工具,而是「用 AI 构建完整应用」的入口。

gakki:内置模拟器是防御性动作——Google 不愿意让 Replit、Cursor 抢走「浏览器即电脑」的定义权。但真正的威胁是:一旦 WebAssembly 安卓兼容层成熟,安卓模拟器本身也会成为历史遗迹。

Gemini Omni Flash 上线 Flow:谷歌视频模型开始学Sora走内容创作者渠道

歸藏(guizang.ai) (@op7418)

一句话核心判断:谷歌终于明白视频模型要卖不能只靠技术文档,得学Midjourney搭生态。

  • Gemini Omni Flash 通过 Flow 平台发布,而非 Google 自有终端——这是谷歌首次将视频生成模型嵌入第三方创作者工具链。
  • 视频生成正在从"模型性能竞争"转向"分发渠道竞争":谁先拿下内容创作者的工作流,谁就拥有事实标准。
  • Flow 作为创意工具的属性意味着 Gemini Omni Flash 第一波用户是真实创作者而非评测者,口碑发酵速度会比技术Benchmark更快。

谷歌这次学聪明了——让创作者用脚投票,比发论文更有用。

向阳乔木开源油猴脚本矩阵:NotebookLM 接管 YouTube 字幕已成开发者标配工作流

向阳乔木 (@vista8)

[内容消费工具链正在被 AI 重构,字幕→NotebookLM→知识库的单人闭环已成型]

  1. 开源的三个脚本覆盖了中文内容生态的核心痛点:小红书/抖音/微信贴图自动上传、YouTube 字幕一键复制、播客倍速调节。
  2. 核心价值在于将 YouTube 字幕→NotebookLM/ChatGPT 的管道标准化,这是 2025 年知识工作者的高频需求。
  3. 开源而非付费——作者选择生态建设而非变现,这在小红书/KOL 圈层中有一定的示范意义。
  4. 开发者工具下沉到内容创作者群体的路径越来越短:油猴脚本降低了门槛,但最终会被原生 AI 工具替代。

gakki锐评: 这类脚本的生命周期不会太长——等 YouTube 和 NotebookLM 都原生支持的时候,这个轮子就不需要再发明了。

「容易而正确」的复利陷阱:AI 时代最大的认知误区

天策 (@Leobai825)

[越容易越正确——天策的逆向创业哲学]

天策提出「容易而正确」的做事方法论,自媒体、读书、拍视频、幸福生活、AI 额度用完,核心逻辑是「低阻力路径的持续累积」。

这个观点反主流叙事而行——主流告诉你要做难的事,天策告诉你难的事往往是在对抗复利。

gakki:这个框架的盲点是「容易」的判断标准——容易的事往往是因为别人已经验证过路径,而路径一旦验证完成,壁垒也就消失了。真正的「容易而正确」只在路径尚未被广泛认知的窗口期成立。

Gemini Gems 无法固定到侧栏:产品经理在给用户制造不必要的认知税

宝玉 (@dotey)

一句话核心判断:功能做加法体验做减法——这是 AI 产品化进程中最典型的工程思维对用户体验思维的胜利。

  • 常用 Gem 无法固定意味着每次使用需要额外3-4步导航,在高频使用场景下这是致命的摩擦力损耗。
  • @提及 Gem 的替代方案在输入框层面实现了,但没有替代固定侧栏的即时可达性——产品设计者显然不做高频创作者。
  • AI 助手的工具属性越强,其可定制性和快速调用就越重要;Gemini 这次更新暴露了谷歌在"AI产品体验"上仍是功能导向而非任务导向。

做AI产品不考虑高频场景,就像做输入法不带剪贴板。

Google Genie 3 把美国街景变可漫游世界:风格化变换打开创作空间

歸藏(guizang.ai) (@op7418)

[Google Genie 3 以街景为锚点生成可互动的虚构世界]

用户可选取美国任意谷歌街景地点作为首帧,生成可进入游览的互动世界,黄石公园等知名地标均支持。

核心亮点是风格化变换能力——同一街景可一键转为海底世界或末日废土,代入感强。

这意味着 AI 生成从「单次创作」向「空间体验」延伸,创作边界从帧扩展到可探索的世界。

gakki:街景 + 风格化本质是「数据资源的创作变现」,壁垒在于 Google 街景数据覆盖度,而非模型本身。创作者会买单,但天花板是 Google 愿意开放多少真实世界坐标。

Multica:Trello 看板任务分类从「人」变「Agent」,多 Agent 编排的视觉化尝试

向阳乔木 (@vista8)

[看板工具正在成为多 Agent 协作的标准入口,不是聊天界面]

Multica 将类 Trello 的看板任务管理引入多 Agent 场景——任务分类从人变成了 Agent 智能体。亮点在于它直接集成 Claude Code、Codex CLI、Hermes 等本地 AI Coding 工具,用户无需额外付费即可驱动并行 AI 提效。执行细节可见的特性保留了人类掌控感,这是当前 Agent 工具普遍缺失的维度。开源地址可见评论。

Cola接入Codex套餐:AI工具互通正在绕过平台壁垒

Orange AI (@oran_ge)

[具体产品动态:Orange AI的Cola接入了Codex登录功能,用户可用Codex配额驱动Cola,同时支持自定义GPT/Claude Key。]

要点:

  • 工具互通在发生:Codex的套餐额度可跨产品使用,打破平台封锁
  • 用户侧价值:降低使用成本,Codex配额不再闲置
  • 行业信号:AI工具间的互操作性正在以民间方式快速实现,而非等待官方开放

[gakki] 当一个工具的配额多到"根本用不完"时,它的资产属性就开始向通用算力演变。Cola接Codex不是集成,是算力解放。

2026-05-20 科技动态 - 动态