今日要点
- SubQ 首个亚二次稀疏注意力模型:12M 上下文窗口、比 FlashAttention 快 52 倍、成本不到 Opus 的 5%
- PageIndex 用树索引替代向量检索:RAG 的「反 Embedding」范式正在动摇整个向量数据库行业
- Gemma 4 多Token预测推理提速3倍:端侧Agent的速度瓶颈正在被架构级方案击穿
- GPT-5.5 驱动 ChatGPT 入驻 Excel/Sheets:AI Agent 正在吞噬办公套件的入口层
- 非技术团队开始交付生产代码:AI Coding 的真正冲击波刚刚开始
专题追踪更新
- SubQ 首个亚二次稀疏注意力模型:12M 上下文窗口、比 FlashAttention 快 52 倍、成本不到 Opus 的 5%:注意力机制的工程瓶颈正在被亚二次架构撬开。 · 专题页 · 原文
- 宝玉实测 Codex /goal 跑 17 小时:长时间 Agent 任务的工程纪律不是「让它跑久」,而是分阶段验收:长时任务的关键不是 duration,而是 feedback loop 的工程化。 · 原文
- Gemma 4 多Token预测推理提速3倍:端侧Agent的速度瓶颈正在被架构级方案击穿:MTP草稿机制让Gemma 4在不损失质量的前提下输出速度翻3倍,这是端侧Agent从「能跑」到「好用」的关键拐点。 · 专题页 · 原文
- GPT-5.5 Instant 悄悄替换 5.3 成为 ChatGPT 默认档:幻觉降 52%,回答变短,但开始主动翻你的聊天记录:OpenAI 把几亿人的日常模型静默升级了,这是「隐形基建」层面的能力跃迁。 · 原文
- Perplexity 推出金融专业版:带牌照数据源+35个垂直工作流,AI搜索开始啃硬骨头:Perplexity Computer for Professional Finance 不是在做通用AI搜索的增量,而是在用Morningstar、PitchBook等授权数据源构建金融分析师的专属工作台。 · 原文
X AI 趋势速览
Ai2 发布开源 MolmoAct 2,赋能真实世界机器人任务
**AI 摘要:**AI2 发布了 MolmoAct 2,这是一个完全开放的模型,能让机器人完成倒茶、擦桌子、叠毛巾等日常家务,以及 CRISPR 样品处理等实验室工作。它擅长 3D 推理,无需定制即可适配双臂机器人,执行速度比前代快 37 倍,在多项基准测试中超越 GPT-5 等模型。所有权重、720 小时演示数据,甚至廉价硬件方案均在 Hugging Face 开源,助力全球实验室推进机器人研究。研究人员称其为机器人领域迈向重大突破的一步。
Ai2 (@allen_ai):Robotics models often struggle outside controlled environments. Ours is built to work in real ones.
Today we're launching MolmoAct 2, which can assist with a host of chores & lab tasks, plus the MolmoAct 2-Bimanual YAM dataset—the largest open robotics dataset of its kind. 🧵 https://t.co/xObLxwldMr
❤️ 196🔄 49💬 4查看趋势
Bun 开发者尝试用 Claude 将 Zig 代码移植到 Rust
**AI 摘要:**主要用 Zig 编写的高速 JavaScript 运行时 Bun,近日出现了一个实验性分支,其创始人 Jarred Sumner 已提交超过 30 个 commit,将部分代码移植到 Rust。该分支名为"claude/phase-a-port",包含一份长达 622 行的 PORTING.md 移植指南,详细映射了 Zig 中的分配器、指针等概念到 Rust 的对应实现,并规划了草稿和优化等阶段。社区对 Rust 的稳定性和生态表示期待,但也有观点认为这是 Anthropic 的 Claude 进行的一次 AI 实验——依据是仓库中存在 CLAUDE.md 等文件,且 Bun 早有利用大语言模型优化代码的先例。目前尚无变更合并至主分支。
Luke Parker (@LukeParkerDev):what!? is Bun moving from Zig to Rust???
❤️ 358🔄 32💬 17查看趋势
ChatGPT推出1985年复古风格广告,在X上掀起AI怀旧热潮
**AI 摘要:**周日晚间,ChatGPT 官方账号发布了一张虚构的1985年电脑杂志广告,画面中一家人在老式电脑上提问、头脑风暴、不停聊天。网友们迅速跟风,创作了各种80年代风格的广告:有带着阴险猴子的加密项目 CoinMafia、代币 Memelord 标价42美元的梗图、F1 主页、怪物史莱克的 OgreMode,甚至还有适配老硬件的 AmigaeGPT。大多数人沉浸在怀旧氛围中,但艺术家 Reid Southen 指出了"值得信赖的知识"旁边那段错误免责声明的讽刺意味,还有人调侃说自家的 Commodore 64 都要哭了。这股热潮延续了此前假造1998年 ChatGPT 首页等爆款的势头,再次证明 AI 能轻松将过去重新混搭成趣味十足的社区创作。
ChatGPT (@ChatGPTapp):https://t.co/zA3iLk28Hb
❤️ 7109🔄 681💬 479查看趋势
Coinbase 裁员引发"被炒鱿鱼坦白局"讽刺梗热潮
**AI 摘要:**2026年5月5日,用户@ghhosttdn42发布了一条讽刺帖文,称自己在Coinbase工作多年,无故冻结客户账户后被解雇,还配了一张AI风格的照片。这条帖子的时机恰逢CEO Brian Armstrong宣布裁员700人(占员工总数的14%),以在市场动荡期间向AI原生架构转型。网友纷纷跟帖玩梗,用夸张的copypasta吐槽公司各种槽点,比如投诉工单关闭太快等。与此同时,用户对市场波动期间账户被冻结的真实不满依然存在,尽管Coinbase给出了合规方面的解释并进行了近期改进。
Nick Szabo (@NickSzabo4):@ghhosttdn42 Very sorry to hear this. But please tell us more.
❤️ 72🔄 0💬 2查看趋势
Coinbase裁员700人,应对加密货币市场波动与AI转型
**AI 摘要:**Coinbase 正在裁减约 14% 的员工,即从 5,000 人中裁去 700 人,原因是加密货币市场低迷以及 AI 加速了过去需要整支团队完成的工作。Armstrong 强调公司资金充裕,将继续投入稳定币和代币化业务的增长,同时推进组织扁平化改革,组建由小型团队构成的"AI 原生小组"。外界质疑在一家保管客户资金的公司中使用 AI 生成代码存在风险,Armstrong 对此澄清,所有此类代码均需经过严格的人工审查;受影响的员工将获得至少 16 周的遣散费及相关福利。
James Surowiecki (@JamesSurowiecki):The last thing you want to hear the CEO of a financial-services firm say is "Non-technical teams are now shipping production code." https://t.co/ZqEZjR7Fcg
❤️ 2368🔄 167💬 101查看趋势
详细内容
SubQ 首个亚二次稀疏注意力模型:12M 上下文窗口、比 FlashAttention 快 52 倍、成本不到 Opus 的 5%
Alexander Whedon (@alex_whedon)
注意力机制的工程瓶颈正在被亚二次架构撬开。
- SubQ 是首个基于全亚二次稀疏注意力(SSA)的前沿模型,上下文窗口达 1200 万 token
- 在 1M token 场景下比 FlashAttention 快 52 倍,推理成本压缩至 Opus 的 5% 以下
- 核心思路:标准注意力浪费算力在无关词对关系上,SSA 只聚焦真正重要的关联
gakki 锐评:稀疏注意力不是新概念,但能跑出 52 倍加速且保持前沿质量的,这是第一个。如果经得起独立评测验证,Opus 级别的百万上下文叙事可能需要重写——因为成本结构被改写了。
PageIndex 用树索引替代向量检索:RAG 的「反 Embedding」范式正在动摇整个向量数据库行业
How To AI (@HowToAI_)
[向量数据库不是 RAG 的必要条件,树索引 + LLM 推理链路在金融基准上跑出 98.7% 准确率。]
- PageIndex 完全跳过 Embedding、Chunking、相似度搜索三件套,改用文档树索引让 LLM 像人翻书一样逐层推理
- 在 FinanceBench 上 98.7% 准确率,超越所有向量 RAG 方案登顶
- 架构极简:零向量库依赖,意味着 RAG 基础设施成本可能被重新定义
gakki 锐评:这不是 RAG 的替代品,而是对「Embedding 万能论」的一次实证反驳——当 LLM 推理能力足够强时,索引结构比向量空间更重要。
Gemma 4 多Token预测推理提速3倍:端侧Agent的速度瓶颈正在被架构级方案击穿
Google for Developers (@googledevs)
MTP草稿机制让Gemma 4在不损失质量的前提下输出速度翻3倍,这是端侧Agent从「能跑」到「好用」的关键拐点。
- 多Token预测(MTP)drafters一次预测多个token,等效于将推理吞吐量提升至3倍
- Google明确宣称「same quality, way more speed」——质量守恒前提下的纯速度增益
- 对移动端/边缘Agent场景意义重大:低延迟交互是Agent体验的硬约束
Gakki:MTP不是新概念,但Google把它工程化落地到开源模型上,意味着端侧Agent的速度门槛正在被系统性拆除。真正的竞争点不在模型智商,在于「感知-决策-执行」闭环的响应速度。
GPT-5.5 驱动 ChatGPT 入驻 Excel/Sheets:AI Agent 正在吞噬办公套件的入口层
ChatGPT (@ChatGPTapp)
ChatGPT 以插件形态嵌入 Excel 和 Google Sheets,背后是 GPT-5.5 的推理能力。
• 支持数据清洗、公式生成、实时解释,用户无需离开表格环境 • 标志着 OpenAI 从「对话入口」向「工作流原生嵌入」的战略转向 • 对 Google Workspace AI 和 Microsoft Copilot 形成直接竞争压力
锐评:这不是功能更新,是入口战争的降维打击——谁能在用户「不切换窗口」的瞬间提供价值,谁就握住了企业级 AI 的咽喉。
非技术团队开始交付生产代码:AI Coding 的真正冲击波刚刚开始
James Surowiecki (@JamesSurowiecki)
金融服务公司 CEO 宣称非技术团队已在交付生产代码——这是 AI 编程工具渗透到业务一线的里程碑信号。
- 当非技术人员能直接产出可运行的生产代码,传统「技术门槛」正在被 AI 工具链彻底消解
- 这不是 Vibe Coding 的玩具 Demo,而是金融服务这种对代码质量有严格要求的行业
- 意味着「谁来写代码」的权力结构正在重组:产品经理、业务分析师可能成为新的代码生产者
gakki 锐评: 这条推文的警示意义大于庆祝意义——非技术团队能交付代码,不代表他们能维护代码。真正的考验在生产事故发生时。
Perplexity 推出金融专业版:带牌照数据源+35个垂直工作流,AI搜索开始啃硬骨头
Perplexity (@perplexity_ai)
Perplexity Computer for Professional Finance 不是在做通用AI搜索的增量,而是在用Morningstar、PitchBook等授权数据源构建金融分析师的专属工作台。
- 接入Morningstar、PitchBook、Daloopa、Carbon Arc四家专业金融数据提供商
- 内置35个覆盖分析师周度重复工作的专用流程
- 从「AI搜索」跃迁到「AI工作台」,本质是把搜索能力嵌入专业决策链
Gakki:这条路线的真正壁垒不在AI能力——谁都能接API——而在牌照数据源的排他性和工作流的行业理解深度。Perplexity正在验证一个假设:垂直Agent的价值上限取决于你嵌入了多少「不可替代的决策上下文」。
Google AI Studio 内置图像资产自动生成:设计工具正在从「辅助」滑向「替代」
Google AI Studio (@GoogleAIStudio)
[AI Studio 将 NanoBanana 图像生成嵌入应用构建流程,编辑工具支持视觉化组件注解与素材替换。]
- 应用生成时自动创建配套图像素材,不再需要单独跑图再导入
- 重新设计的编辑工具支持可视化组件更新、标注、图片替换
- 信号:Google 正在把「设计」从独立环节压缩进「构建」环节
gakki 锐评:当 AI Studio 一站式搞定代码+图像+布局,独立设计工具的生存空间正在被上游平台吞噬——Figma 们该紧张的不是 AI 画图,而是 AI 构建流程本身。
Google Finance 集成AI关键摘要:巨头正在用AI重写存量产品的信息密度
Evan (@StockMKTNewz)
Google Finance上线AI-powered key moments功能,将AI摘要能力嵌入金融信息消费场景。
- 不是新产品发布,而是在成熟产品中植入AI能力——这是Google的典型打法
- 与Perplexity金融版形成有趣对照:一个是垂直Agent降维打击,一个是存量产品就地升级
- 信号意义大于功能本身:Google正在系统性地将AI能力渗透进每一个产品触点
Gakki:Google的做法是「毛细血管式渗透」——不造新船,而是在每条旧船上装引擎。短期体验提升有限,但长期看,当所有产品都有AI摘要,「信息过载」这个需求本身就可能被重新定义。
MATLAB 也要加 Agentic Workflow:传统工程工具的 AI 焦虑正在蔓延
terminally onλine εngineer (@tekbog)
一位工程师吐槽「在 MATLAB 里加 agentic workflows 感觉很不神圣」——这种不适感恰恰说明 AI Agent 正在渗透到最保守的工程工具链。
- MATLAB 代表的是传统工程/科研领域,这个群体对「AI 化」的接受度最低
- 当连 MATLAB 都在追 Agent 概念时,说明 AI 工具化已经过了「要不要做」的阶段,进入「怎么做好」
- 工程师的「unholy 感」反映了工具哲学的冲突:确定性工程 vs 概率性 AI
gakki 锐评: MATLAB 加 Agent 是必然的,但「感觉不神圣」的直觉是对的——工程工具的核心是确定性,Agent 的核心是概率性,两者融合需要新的设计哲学。
OpenClaw Agent 拥有独立电脑、邮箱、电话和信用卡:「数字分身」从概念进入可操作阶段
Micky (@Rasmic)
开发者 Micky 花两个月为 OpenClaw Agent 接入真实基础设施,实现自主通信与支付能力。
• Agent 获得独立计算资源(Daytona)、邮箱、电话、信用卡四件套 • 从「对话助手」到「经济主体」的跨越,Agent 经济自主权的实证案例 • 开源社区的 DIY 实践正在跑赢大厂的 Agent 产品化节奏
锐评:当 Agent 能自己付钱、自己打电话时,「数字员工」就不再是比喻。但这也意味着风控和合规将成为下一个硬约束。
DFlash 为 Gemma 4 提速 6 倍:开源推理优化工具瞄准端侧部署效率瓶颈
Zhijian Liu (@zhijianliu_)
推理效率优化工具直接适配 Gemma 4,开源方案挑战闭源推理栈的定价权。
• DFlash 实现 Gemma 4 最高 6 倍推理加速,原生支持 MTP(Multi-Token Prediction)特性 • 开源工具链绕过云厂商推理服务溢价,端侧部署成本结构被重写 • Google 官方模型 + 第三方开源加速器的组合模式正在成为新范式
gakki 锐评:端侧推理效率优化已进入"工具民主化"阶段,但真正决定落地的是谁能跑通从模型到应用的最后一公里——DFlash 的价值不在速度本身,在于它让小团队也能玩得起 Gemma 4。
MoonPay 收购 DFlow:加密支付基础设施开始为 AI Agent 的「经济自主权」铺设底层通道
MoonPay 🟣 (@moonpay)
MoonPay 收购 DFlow 是一个信号:加密支付正在从「人用工具」向「Agent 可调用基础设施」迁移。
- DFlow 专注订单流和 DeFi 路由,MoonPay 是法币-加密桥接巨头
- 收购意味着支付通道正在整合,为 Agent 自主交易提供更完整的基础设施
gakki 锐评:当 AI Agent 需要自己付钱、自己收款、自己结算时,它需要的不是「用户授权后执行」的支付 API,而是一个原生的金融通道。MoonPay + DFlow 的组合正在朝这个方向走——虽然离真正的 Agent 经济自主权还有距离,但管道在铺。
RadixArk 一亿美金种子轮押注开源前沿 AI 基础设施:训练推理栈不该被巨头垄断
RadixArk (@radixark)
AI 基础设施的「重复造轮子」问题正在吸引大额资本介入。
- RadixArk 以 4 亿美金估值完成 $100M 种子轮,Accel 领投、Spark Capital 跟投
- 定位:让前沿 AI 训练和推理基础设施开源可及
- 痛点:大多数 AI 团队被迫从零重建训练推理栈,重复劳动严重
gakki 锐评:一亿美金种子轮本身就是信号——VC 认为 AI infra 的开源化不是公益而是生意。但开源 infra 的护城河在哪?历史上 Hugging Face 走通了社区飞轮,RadixArk 需要回答同样的问题。
Ai2 发布 MolmoAct 2:开源机器人模型首次突破「实验室围墙」进入真实家务场景
Ai2 (@allen_ai)
MolmoAct 2 是目前最大的开源双臂机器人数据集,首次在非受控环境中验证家务与实验任务能力。
• 配套发布 Bimanual YAM 数据集,开源程度碾压同类闭源方案 • 从「实验室 demo」到「真实环境部署」的跨越,是具身 AI 商业化的关键拐点 • 对特斯拉 Optimus 等闭源路线形成开源社区的正面挑战
锐评:具身智能的真正瓶颈不是硬件,是「见过多少种真实场景」。开源数据集的规模优势正在倒逼闭源玩家加速落地。
以太坊代币化美债市值突破 80 亿美元:链上无风险资产半年翻倍,Agent 经济的底层流动性池成型
Cointelegraph (@Cointelegraph)
代币化美债成为链上经济体的"基础设施利率",Agent 交易和 DeFi 策略的底层资产锚正在形成。
• 以太坊上代币化美债市值达 80 亿美元历史新高,半年翻倍增长 • 为 Agent 经济提供链上无风险收益率基准,支撑自动化策略的资产配置逻辑 • 传统金融资产链上化进程加速,合规与去中心化的张力持续拉扯
gakki 锐评:这不只是数字好看——代币化美债是 Agent 经济的"国债利率",没有稳定的链上无风险资产,Agent 的量化策略就是空中楼阁。80 亿美元说明机构资金正在认真下注这条路径。