今日要点
- Antigravity 2.0 被指抄 Codex:Google AI 工具的 UI 焦虑
- Gemini Omni:世界模型的雏形,通用AGI的初始形态
- Karpathy 加入 Anthropic:那个教你训练GPT的人进了Anthropic门
- Karpathy 加入 Anthropic:AI 顶级人才从「造神」转向「守门」的行业分水岭
- Google I/O 2026全解:Flash做大脑、Spark做入口、Omni做世界模型
专题追踪更新
- Karpathy 加入 Anthropic:AI 顶级人才从「造神」转向「守门」的行业分水岭:一句话核心判断: Andrej Karpathy 加入 Anthropic,标志着 AI 顶级人才从「模型能力军备竞赛」向「AI 安全与对齐研究」的战略大迁徙。 · 原文
- Karpathy 加入 Anthropic:那个教你训练GPT的人进了Anthropic门:一句话核心判断:AI教育界失去最会讲原理的人,Anthropic多了一个懂如何让模型"自觉"的架构师。 · 原文
- LeCun出走Meta创业:顶级AI科学家押注「反LLM」架构,隐含范式转向信号:LeCun从Meta离职创业,押注"反LLM"的架构方向 · 原文
- Gemini Omni:世界模型的雏形,通用AGI的初始形态:[小互对Gemini Omni的定性判断:它不是视频编辑器,而是世界模型的雏形,代表通用AGI的初始形态。] · 专题页 · 原文
- Antigravit 2.0 更像 Codex,但权限审批和预览体验仍是早期玩具:一句话核心判断 · 原文
详细内容
Antigravity 2.0 被指抄 Codex:Google AI 工具的 UI 焦虑
宝玉 (@dotey)
[Antigravity 2.0 和 Codex「长一个样」]
宝玉评论 Google 新 UI 框架 Antigravity 2.0 与 Codex 高度相似,并指出 Google 舍得抄 UI/UX 是好事,至少不会像 Gemini UI 那么难用。
这侧面印证了 Codex 的交互范式已被市场验证为最优解之一。Google 放下身段抄,说明 AI Coding 工具的形态正在收敛。
gakki:当 Google 开始抄,说明这个 UI 范式已经过了「创新窗口期」,进入「工程实现」的效率竞争阶段。这对用户是好事,对先发者是不小的压力。
Gemini Omni:世界模型的雏形,通用AGI的初始形态
小互 (@xiaohu)
[小互对Gemini Omni的定性判断:它不是视频编辑器,而是世界模型的雏形,代表通用AGI的初始形态。]
要点:
- Gemini Omni被类比为"视频版的香蕉",意指其能力远超单纯视频编辑
- 核心判断:它是世界模型的雏形,意味着对物理世界规律的抽象理解与推理
- 激进观点:这是通用AGI的初始形态——不是渐进增强,而是范式起点
[gakki] 互联网老炮都知道,每次"XX是AGI初始形态"的叙事出现时,要么是真正的范式转折,要么是营销用力过猛。Gemini Omni的真实水位,需要等实际任务表现而非现场演示。
Karpathy 加入 Anthropic:那个教你训练GPT的人进了Anthropic门
歸藏(guizang.ai) (@op7418)
一句话核心判断:AI教育界失去最会讲原理的人,Anthropic多了一个懂如何让模型"自觉"的架构师。
- Karpathy 的教程价值在于把复杂模型"白盒化"给公众,加盟 Anthropic 后其公开分享频率大概率骤降,开发者失去了一个重要的知识枢纽。
- 从战略看,Karpathy 一直强调"模型需要理解自身行为边界",这与 Anthropic 的 Constitutional AI 路线高度契合,加入后或加速 Claude 的自我解释与对齐工程。
- 短期最大受影响群体:独立开发者和 AI 学习者——他们的"AI 入门导师"正式转入模型厂商,公开教程产出预计断崖。
Karpathy 加入不代表他会变沉默,但他的输出将从"怎么训练模型"变成"模型为什么这样决策"——这是两种完全不同的知识商品。
Karpathy 加入 Anthropic:AI 顶级人才从「造神」转向「守门」的行业分水岭
宝玉 (@dotey)
一句话核心判断: Andrej Karpathy 加入 Anthropic,标志着 AI 顶级人才从「模型能力军备竞赛」向「AI 安全与对齐研究」的战略大迁徙。
信息增量:
- Karpathy 是深度学习界「祖师爷」级别人物,曾主导特斯拉 Autopilot、创办 OpenAI 教育部、回 OpenAI 任职——其每一次选择都是行业风向标
- 加入 Anthropic 而非 OpenAI 或 xAI,表明安全研究机构对顶级人才的吸引力已超越模型能力竞技场
gakki 锐评: Karpathy 的选择不是对 Anthropic 的投票,而是对「AGI 风险不可忽视」这一判断的用脚投票。当最懂 AI 能力边界的人选择去研究边界本身,这本身就是最大的行业信号。
Google I/O 2026全解:Flash做大脑、Spark做入口、Omni做世界模型
小互 (@xiaohu)
[Gemini三剑客的产品定位首次厘清:Flash是行动大脑、Spark是远端个人AI Agent入口、Omni是多模态世界模型。]
要点:
- Gemini 3.5 Flash升级为"行动大脑"——承担执行与推理职能
- Gemini Spark定位为个人AI Agent的远端入口——设备边界正在消融
- Gemini Omni定位多模态世界模型——小互认为这是本次大会真正值得关注的变量
[gakki] 三款产品的定位逻辑有意思:入口、执行、世界理解。如果Omni真的能做到世界模型级别的物理直觉,那Flash和Spark就有了真正的大脑。否则只是更贵的语音助手。
Gemini CLI 变身 Antigravity CLI:Go 重写底层后瞄齐 Codex,Agent-First IDE 方向确立
余温 (@gkxspace)
[多代理编排工具竞争格局生变,Google 终于有了对标 Codex 的正经武器]
- Gemini CLI 退役并以 Antigravity CLI 重生,Go 重写底层意味着性能与跨平台能力的根本性提升。
- 新增多代理编排和异步工作流能力——这是此前 Gemini CLI 最大短板,现在补齐。
- 终端可直接调用 Claude Opus 4.6,且网络问题已修复;意味着 Google 与 Anthropic 在工具层的深度合作已穿透。
- Antigravity IDE 方向明确向 Codex 的"agent-first"靠拢,产品形态对标意图已不再掩饰。
这不只是品牌重做,而是 Google 在 AI Coding 工具链上终于拿出一款能与 Claude Code / Codex 正面竞争的产品。竞争从模型层蔓延到工具层,2026 年的 AI 开发者工具战争进入新阶段。
gakki锐评: Google I/O 还没正式开场,Antigravity 先声夺人。但 Go 重写底层是多代理编排的正确工程选择——这个赛道终于被 Google 当回事了。
Michael Anti 谈台湾:身份认同叙事折射 AI 时代的语言与地缘焦虑
Michael Anti (@mranti)
[台海表态背后是一个南京人的双语教育观]
Michael Anti 从个人家族史出发,解释其国家认同立场,同时强调在 AI 已打通语言的今天,仍坚持送孩子学法语——这是一种在技术平权时代主动保留语言阶级壁垒的明确选择。
gakki:他说「其他技能孩子已自己把握」——这句话比任何 AI 发布会都更能说明问题。当语言成为最后的阶级护城河,AI 反而在帮它加固。
Google AI Studio 内置安卓模拟器:浏览器即 IDE 边界彻底模糊
歸藏(guizang.ai) (@op7418)
[AI Studio 连续更新,浏览器内开发安卓应用成为现实]
昨晚 AI Studio 两个重要能力:直接拉取 Google Docs/Sheets 作数据库;网页内开发安卓应用并内置模拟器。
博主实测 3.1 Pro 前端能力强于安卓开发,但内置模拟器这一动作本身是信号——Google 正在抹平「开发环境」与「消费界面」的最后一层纱。
数据库直连 + 模拟器内嵌,两件事叠加意味着 AI Studio 已不再是「学 AI」的工具,而是「用 AI 构建完整应用」的入口。
gakki:内置模拟器是防御性动作——Google 不愿意让 Replit、Cursor 抢走「浏览器即电脑」的定义权。但真正的威胁是:一旦 WebAssembly 安卓兼容层成熟,安卓模拟器本身也会成为历史遗迹。
Gemini Omni Flash 上线 Flow:谷歌视频模型开始学Sora走内容创作者渠道
歸藏(guizang.ai) (@op7418)
一句话核心判断:谷歌终于明白视频模型要卖不能只靠技术文档,得学Midjourney搭生态。
- Gemini Omni Flash 通过 Flow 平台发布,而非 Google 自有终端——这是谷歌首次将视频生成模型嵌入第三方创作者工具链。
- 视频生成正在从"模型性能竞争"转向"分发渠道竞争":谁先拿下内容创作者的工作流,谁就拥有事实标准。
- Flow 作为创意工具的属性意味着 Gemini Omni Flash 第一波用户是真实创作者而非评测者,口碑发酵速度会比技术Benchmark更快。
谷歌这次学聪明了——让创作者用脚投票,比发论文更有用。
向阳乔木开源油猴脚本矩阵:NotebookLM 接管 YouTube 字幕已成开发者标配工作流
向阳乔木 (@vista8)
[内容消费工具链正在被 AI 重构,字幕→NotebookLM→知识库的单人闭环已成型]
- 开源的三个脚本覆盖了中文内容生态的核心痛点:小红书/抖音/微信贴图自动上传、YouTube 字幕一键复制、播客倍速调节。
- 核心价值在于将 YouTube 字幕→NotebookLM/ChatGPT 的管道标准化,这是 2025 年知识工作者的高频需求。
- 开源而非付费——作者选择生态建设而非变现,这在小红书/KOL 圈层中有一定的示范意义。
- 开发者工具下沉到内容创作者群体的路径越来越短:油猴脚本降低了门槛,但最终会被原生 AI 工具替代。
gakki锐评: 这类脚本的生命周期不会太长——等 YouTube 和 NotebookLM 都原生支持的时候,这个轮子就不需要再发明了。
「容易而正确」的复利陷阱:AI 时代最大的认知误区
天策 (@Leobai825)
[越容易越正确——天策的逆向创业哲学]
天策提出「容易而正确」的做事方法论,自媒体、读书、拍视频、幸福生活、AI 额度用完,核心逻辑是「低阻力路径的持续累积」。
这个观点反主流叙事而行——主流告诉你要做难的事,天策告诉你难的事往往是在对抗复利。
gakki:这个框架的盲点是「容易」的判断标准——容易的事往往是因为别人已经验证过路径,而路径一旦验证完成,壁垒也就消失了。真正的「容易而正确」只在路径尚未被广泛认知的窗口期成立。
Gemini Gems 无法固定到侧栏:产品经理在给用户制造不必要的认知税
宝玉 (@dotey)
一句话核心判断:功能做加法体验做减法——这是 AI 产品化进程中最典型的工程思维对用户体验思维的胜利。
- 常用 Gem 无法固定意味着每次使用需要额外3-4步导航,在高频使用场景下这是致命的摩擦力损耗。
- @提及 Gem 的替代方案在输入框层面实现了,但没有替代固定侧栏的即时可达性——产品设计者显然不做高频创作者。
- AI 助手的工具属性越强,其可定制性和快速调用就越重要;Gemini 这次更新暴露了谷歌在"AI产品体验"上仍是功能导向而非任务导向。
做AI产品不考虑高频场景,就像做输入法不带剪贴板。
Google Genie 3 把美国街景变可漫游世界:风格化变换打开创作空间
歸藏(guizang.ai) (@op7418)
[Google Genie 3 以街景为锚点生成可互动的虚构世界]
用户可选取美国任意谷歌街景地点作为首帧,生成可进入游览的互动世界,黄石公园等知名地标均支持。
核心亮点是风格化变换能力——同一街景可一键转为海底世界或末日废土,代入感强。
这意味着 AI 生成从「单次创作」向「空间体验」延伸,创作边界从帧扩展到可探索的世界。
gakki:街景 + 风格化本质是「数据资源的创作变现」,壁垒在于 Google 街景数据覆盖度,而非模型本身。创作者会买单,但天花板是 Google 愿意开放多少真实世界坐标。
Multica:Trello 看板任务分类从「人」变「Agent」,多 Agent 编排的视觉化尝试
向阳乔木 (@vista8)
[看板工具正在成为多 Agent 协作的标准入口,不是聊天界面]
Multica 将类 Trello 的看板任务管理引入多 Agent 场景——任务分类从人变成了 Agent 智能体。亮点在于它直接集成 Claude Code、Codex CLI、Hermes 等本地 AI Coding 工具,用户无需额外付费即可驱动并行 AI 提效。执行细节可见的特性保留了人类掌控感,这是当前 Agent 工具普遍缺失的维度。开源地址可见评论。
Cola接入Codex套餐:AI工具互通正在绕过平台壁垒
Orange AI (@oran_ge)
[具体产品动态:Orange AI的Cola接入了Codex登录功能,用户可用Codex配额驱动Cola,同时支持自定义GPT/Claude Key。]
要点:
- 工具互通在发生:Codex的套餐额度可跨产品使用,打破平台封锁
- 用户侧价值:降低使用成本,Codex配额不再闲置
- 行业信号:AI工具间的互操作性正在以民间方式快速实现,而非等待官方开放
[gakki] 当一个工具的配额多到"根本用不完"时,它的资产属性就开始向通用算力演变。Cola接Codex不是集成,是算力解放。