2026-05-06 科技动态

今日要点

SubQ 首个亚二次稀疏注意力模型：12M 上下文窗口、比 FlashAttention 快 52 倍、成本不到 Opus 的 5%
PageIndex 用树索引替代向量检索：RAG 的「反 Embedding」范式正在动摇整个向量数据库行业
Gemma 4 多Token预测推理提速3倍：端侧Agent的速度瓶颈正在被架构级方案击穿
GPT-5.5 驱动 ChatGPT 入驻 Excel/Sheets：AI Agent 正在吞噬办公套件的入口层
非技术团队开始交付生产代码：AI Coding 的真正冲击波刚刚开始

专题追踪更新

SubQ 首个亚二次稀疏注意力模型：12M 上下文窗口、比 FlashAttention 快 52 倍、成本不到 Opus 的 5%：注意力机制的工程瓶颈正在被亚二次架构撬开。 · 专题页 · 原文
宝玉实测 Codex /goal 跑 17 小时：长时间 Agent 任务的工程纪律不是「让它跑久」，而是分阶段验收：长时任务的关键不是 duration，而是 feedback loop 的工程化。 · 原文
Gemma 4 多Token预测推理提速3倍：端侧Agent的速度瓶颈正在被架构级方案击穿：MTP草稿机制让Gemma 4在不损失质量的前提下输出速度翻3倍，这是端侧Agent从「能跑」到「好用」的关键拐点。 · 专题页 · 原文
GPT-5.5 Instant 悄悄替换 5.3 成为 ChatGPT 默认档：幻觉降 52%，回答变短，但开始主动翻你的聊天记录：OpenAI 把几亿人的日常模型静默升级了，这是「隐形基建」层面的能力跃迁。 · 原文
Perplexity 推出金融专业版：带牌照数据源+35个垂直工作流，AI搜索开始啃硬骨头：Perplexity Computer for Professional Finance 不是在做通用AI搜索的增量，而是在用Morningstar、PitchBook等授权数据源构建金融分析师的专属工作台。 · 原文

**AI 摘要：**AI2 发布了 MolmoAct 2，这是一个完全开放的模型，能让机器人完成倒茶、擦桌子、叠毛巾等日常家务，以及 CRISPR 样品处理等实验室工作。它擅长 3D 推理，无需定制即可适配双臂机器人，执行速度比前代快 37 倍，在多项基准测试中超越 GPT-5 等模型。所有权重、720 小时演示数据，甚至廉价硬件方案均在 Hugging Face 开源，助力全球实验室推进机器人研究。研究人员称其为机器人领域迈向重大突破的一步。

Ai2 (@allen_ai)：Robotics models often struggle outside controlled environments. Ours is built to work in real ones.

Today we're launching MolmoAct 2, which can assist with a host of chores & lab tasks, plus the MolmoAct 2-Bimanual YAM dataset—the largest open robotics dataset of its kind. 🧵 https://t.co/xObLxwldMr

❤️ 196🔄 49💬 4查看趋势

Bun 开发者尝试用 Claude 将 Zig 代码移植到 Rust

**AI 摘要：**主要用 Zig 编写的高速 JavaScript 运行时 Bun，近日出现了一个实验性分支，其创始人 Jarred Sumner 已提交超过 30 个 commit，将部分代码移植到 Rust。该分支名为"claude/phase-a-port"，包含一份长达 622 行的 PORTING.md 移植指南，详细映射了 Zig 中的分配器、指针等概念到 Rust 的对应实现，并规划了草稿和优化等阶段。社区对 Rust 的稳定性和生态表示期待，但也有观点认为这是 Anthropic 的 Claude 进行的一次 AI 实验——依据是仓库中存在 CLAUDE.md 等文件，且 Bun 早有利用大语言模型优化代码的先例。目前尚无变更合并至主分支。

Luke Parker (@LukeParkerDev)：what!? is Bun moving from Zig to Rust???

https://t.co/qGbQsrHMZI

❤️ 358🔄 32💬 17查看趋势

ChatGPT推出1985年复古风格广告，在X上掀起AI怀旧热潮

**AI 摘要：**周日晚间，ChatGPT 官方账号发布了一张虚构的1985年电脑杂志广告，画面中一家人在老式电脑上提问、头脑风暴、不停聊天。网友们迅速跟风，创作了各种80年代风格的广告：有带着阴险猴子的加密项目 CoinMafia、代币 Memelord 标价42美元的梗图、F1 主页、怪物史莱克的 OgreMode，甚至还有适配老硬件的 AmigaeGPT。大多数人沉浸在怀旧氛围中，但艺术家 Reid Southen 指出了"值得信赖的知识"旁边那段错误免责声明的讽刺意味，还有人调侃说自家的 Commodore 64 都要哭了。这股热潮延续了此前假造1998年 ChatGPT 首页等爆款的势头，再次证明 AI 能轻松将过去重新混搭成趣味十足的社区创作。

ChatGPT (@ChatGPTapp)：https://t.co/zA3iLk28Hb

❤️ 7109🔄 681💬 479查看趋势

Coinbase 裁员引发"被炒鱿鱼坦白局"讽刺梗热潮

**AI 摘要：**2026年5月5日，用户@ghhosttdn42发布了一条讽刺帖文，称自己在Coinbase工作多年，无故冻结客户账户后被解雇，还配了一张AI风格的照片。这条帖子的时机恰逢CEO Brian Armstrong宣布裁员700人（占员工总数的14%），以在市场动荡期间向AI原生架构转型。网友纷纷跟帖玩梗，用夸张的copypasta吐槽公司各种槽点，比如投诉工单关闭太快等。与此同时，用户对市场波动期间账户被冻结的真实不满依然存在，尽管Coinbase给出了合规方面的解释并进行了近期改进。

Nick Szabo (@NickSzabo4)：@ghhosttdn42 Very sorry to hear this. But please tell us more.

❤️ 72🔄 0💬 2查看趋势

Coinbase裁员700人，应对加密货币市场波动与AI转型

**AI 摘要：**Coinbase 正在裁减约 14% 的员工，即从 5,000 人中裁去 700 人，原因是加密货币市场低迷以及 AI 加速了过去需要整支团队完成的工作。Armstrong 强调公司资金充裕，将继续投入稳定币和代币化业务的增长，同时推进组织扁平化改革，组建由小型团队构成的"AI 原生小组"。外界质疑在一家保管客户资金的公司中使用 AI 生成代码存在风险，Armstrong 对此澄清，所有此类代码均需经过严格的人工审查；受影响的员工将获得至少 16 周的遣散费及相关福利。

James Surowiecki (@JamesSurowiecki)：The last thing you want to hear the CEO of a financial-services firm say is "Non-technical teams are now shipping production code." https://t.co/ZqEZjR7Fcg

❤️ 2368🔄 167💬 101查看趋势

详细内容

SubQ 首个亚二次稀疏注意力模型：12M 上下文窗口、比 FlashAttention 快 52 倍、成本不到 Opus 的 5%

Alexander Whedon (@alex_whedon)

注意力机制的工程瓶颈正在被亚二次架构撬开。

SubQ 是首个基于全亚二次稀疏注意力（SSA）的前沿模型，上下文窗口达 1200 万 token
在 1M token 场景下比 FlashAttention 快 52 倍，推理成本压缩至 Opus 的 5% 以下
核心思路：标准注意力浪费算力在无关词对关系上，SSA 只聚焦真正重要的关联

gakki 锐评：稀疏注意力不是新概念，但能跑出 52 倍加速且保持前沿质量的，这是第一个。如果经得起独立评测验证，Opus 级别的百万上下文叙事可能需要重写——因为成本结构被改写了。

查看原文❤️ 15272 · 🔄 1952 · 💬 1057

PageIndex 用树索引替代向量检索：RAG 的「反 Embedding」范式正在动摇整个向量数据库行业

How To AI (@HowToAI_)

[向量数据库不是 RAG 的必要条件，树索引 + LLM 推理链路在金融基准上跑出 98.7% 准确率。]

PageIndex 完全跳过 Embedding、Chunking、相似度搜索三件套，改用文档树索引让 LLM 像人翻书一样逐层推理
在 FinanceBench 上 98.7% 准确率，超越所有向量 RAG 方案登顶
架构极简：零向量库依赖，意味着 RAG 基础设施成本可能被重新定义

gakki 锐评：这不是 RAG 的替代品，而是对「Embedding 万能论」的一次实证反驳——当 LLM 推理能力足够强时，索引结构比向量空间更重要。

查看原文❤️ 6054 · 🔄 664 · 💬 199

Gemma 4 多Token预测推理提速3倍：端侧Agent的速度瓶颈正在被架构级方案击穿

Google for Developers (@googledevs)

MTP草稿机制让Gemma 4在不损失质量的前提下输出速度翻3倍，这是端侧Agent从「能跑」到「好用」的关键拐点。

多Token预测（MTP）drafters一次预测多个token，等效于将推理吞吐量提升至3倍
Google明确宣称「same quality, way more speed」——质量守恒前提下的纯速度增益
对移动端/边缘Agent场景意义重大：低延迟交互是Agent体验的硬约束

Gakki：MTP不是新概念，但Google把它工程化落地到开源模型上，意味着端侧Agent的速度门槛正在被系统性拆除。真正的竞争点不在模型智商，在于「感知-决策-执行」闭环的响应速度。

查看原文❤️ 4206 · 🔄 399 · 💬 100

GPT-5.5 驱动 ChatGPT 入驻 Excel/Sheets：AI Agent 正在吞噬办公套件的入口层

ChatGPT (@ChatGPTapp)

ChatGPT 以插件形态嵌入 Excel 和 Google Sheets，背后是 GPT-5.5 的推理能力。

• 支持数据清洗、公式生成、实时解释，用户无需离开表格环境 • 标志着 OpenAI 从「对话入口」向「工作流原生嵌入」的战略转向 • 对 Google Workspace AI 和 Microsoft Copilot 形成直接竞争压力

锐评：这不是功能更新，是入口战争的降维打击——谁能在用户「不切换窗口」的瞬间提供价值，谁就握住了企业级 AI 的咽喉。

查看原文❤️ 2947 · 🔄 256 · 💬 92

非技术团队开始交付生产代码：AI Coding 的真正冲击波刚刚开始

James Surowiecki (@JamesSurowiecki)

金融服务公司 CEO 宣称非技术团队已在交付生产代码——这是 AI 编程工具渗透到业务一线的里程碑信号。

当非技术人员能直接产出可运行的生产代码，传统「技术门槛」正在被 AI 工具链彻底消解
这不是 Vibe Coding 的玩具 Demo，而是金融服务这种对代码质量有严格要求的行业
意味着「谁来写代码」的权力结构正在重组：产品经理、业务分析师可能成为新的代码生产者

gakki 锐评： 这条推文的警示意义大于庆祝意义——非技术团队能交付代码，不代表他们能维护代码。真正的考验在生产事故发生时。

查看原文❤️ 2368 · 🔄 167 · 💬 101

Perplexity 推出金融专业版：带牌照数据源+35个垂直工作流，AI搜索开始啃硬骨头

Perplexity (@perplexity_ai)

Perplexity Computer for Professional Finance 不是在做通用AI搜索的增量，而是在用Morningstar、PitchBook等授权数据源构建金融分析师的专属工作台。

接入Morningstar、PitchBook、Daloopa、Carbon Arc四家专业金融数据提供商
内置35个覆盖分析师周度重复工作的专用流程
从「AI搜索」跃迁到「AI工作台」，本质是把搜索能力嵌入专业决策链

Gakki：这条路线的真正壁垒不在AI能力——谁都能接API——而在牌照数据源的排他性和工作流的行业理解深度。Perplexity正在验证一个假设：垂直Agent的价值上限取决于你嵌入了多少「不可替代的决策上下文」。

查看原文❤️ 1950 · 🔄 189 · 💬 93

Google AI Studio 内置图像资产自动生成：设计工具正在从「辅助」滑向「替代」

Google AI Studio (@GoogleAIStudio)

[AI Studio 将 NanoBanana 图像生成嵌入应用构建流程，编辑工具支持视觉化组件注解与素材替换。]

应用生成时自动创建配套图像素材，不再需要单独跑图再导入
重新设计的编辑工具支持可视化组件更新、标注、图片替换
信号：Google 正在把「设计」从独立环节压缩进「构建」环节

gakki 锐评：当 AI Studio 一站式搞定代码+图像+布局，独立设计工具的生存空间正在被上游平台吞噬——Figma 们该紧张的不是 AI 画图，而是 AI 构建流程本身。

查看原文❤️ 1053 · 🔄 111 · 💬 57

Google Finance 集成AI关键摘要：巨头正在用AI重写存量产品的信息密度

Evan (@StockMKTNewz)

Google Finance上线AI-powered key moments功能，将AI摘要能力嵌入金融信息消费场景。

不是新产品发布，而是在成熟产品中植入AI能力——这是Google的典型打法
与Perplexity金融版形成有趣对照：一个是垂直Agent降维打击，一个是存量产品就地升级
信号意义大于功能本身：Google正在系统性地将AI能力渗透进每一个产品触点

Gakki：Google的做法是「毛细血管式渗透」——不造新船，而是在每条旧船上装引擎。短期体验提升有限，但长期看，当所有产品都有AI摘要，「信息过载」这个需求本身就可能被重新定义。

查看原文❤️ 596 · 🔄 41 · 💬 26

MATLAB 也要加 Agentic Workflow：传统工程工具的 AI 焦虑正在蔓延

terminally onλine εngineer (@tekbog)

一位工程师吐槽「在 MATLAB 里加 agentic workflows 感觉很不神圣」——这种不适感恰恰说明 AI Agent 正在渗透到最保守的工程工具链。

MATLAB 代表的是传统工程/科研领域，这个群体对「AI 化」的接受度最低
当连 MATLAB 都在追 Agent 概念时，说明 AI 工具化已经过了「要不要做」的阶段，进入「怎么做好」
工程师的「unholy 感」反映了工具哲学的冲突：确定性工程 vs 概率性 AI

gakki 锐评： MATLAB 加 Agent 是必然的，但「感觉不神圣」的直觉是对的——工程工具的核心是确定性，Agent 的核心是概率性，两者融合需要新的设计哲学。

查看原文❤️ 561 · 🔄 15 · 💬 16

OpenClaw Agent 拥有独立电脑、邮箱、电话和信用卡：「数字分身」从概念进入可操作阶段

Micky (@Rasmic)

开发者 Micky 花两个月为 OpenClaw Agent 接入真实基础设施，实现自主通信与支付能力。

• Agent 获得独立计算资源（Daytona）、邮箱、电话、信用卡四件套 • 从「对话助手」到「经济主体」的跨越，Agent 经济自主权的实证案例 • 开源社区的 DIY 实践正在跑赢大厂的 Agent 产品化节奏

锐评：当 Agent 能自己付钱、自己打电话时，「数字员工」就不再是比喻。但这也意味着风控和合规将成为下一个硬约束。

查看原文❤️ 469 · 🔄 31 · 💬 31

DFlash 为 Gemma 4 提速 6 倍：开源推理优化工具瞄准端侧部署效率瓶颈

Zhijian Liu (@zhijianliu_)

推理效率优化工具直接适配 Gemma 4，开源方案挑战闭源推理栈的定价权。

• DFlash 实现 Gemma 4 最高 6 倍推理加速，原生支持 MTP（Multi-Token Prediction）特性 • 开源工具链绕过云厂商推理服务溢价，端侧部署成本结构被重写 • Google 官方模型 + 第三方开源加速器的组合模式正在成为新范式

gakki 锐评：端侧推理效率优化已进入"工具民主化"阶段，但真正决定落地的是谁能跑通从模型到应用的最后一公里——DFlash 的价值不在速度本身，在于它让小团队也能玩得起 Gemma 4。

查看原文❤️ 425 · 🔄 47 · 💬 27

MoonPay 收购 DFlow：加密支付基础设施开始为 AI Agent 的「经济自主权」铺设底层通道

MoonPay 🟣 (@moonpay)

MoonPay 收购 DFlow 是一个信号：加密支付正在从「人用工具」向「Agent 可调用基础设施」迁移。

DFlow 专注订单流和 DeFi 路由，MoonPay 是法币-加密桥接巨头
收购意味着支付通道正在整合，为 Agent 自主交易提供更完整的基础设施

gakki 锐评：当 AI Agent 需要自己付钱、自己收款、自己结算时，它需要的不是「用户授权后执行」的支付 API，而是一个原生的金融通道。MoonPay + DFlow 的组合正在朝这个方向走——虽然离真正的 Agent 经济自主权还有距离，但管道在铺。

查看原文❤️ 408 · 🔄 55 · 💬 118

RadixArk 一亿美金种子轮押注开源前沿 AI 基础设施：训练推理栈不该被巨头垄断

RadixArk (@radixark)

AI 基础设施的「重复造轮子」问题正在吸引大额资本介入。

RadixArk 以 4 亿美金估值完成 $100M 种子轮，Accel 领投、Spark Capital 跟投
定位：让前沿 AI 训练和推理基础设施开源可及
痛点：大多数 AI 团队被迫从零重建训练推理栈，重复劳动严重

gakki 锐评：一亿美金种子轮本身就是信号——VC 认为 AI infra 的开源化不是公益而是生意。但开源 infra 的护城河在哪？历史上 Hugging Face 走通了社区飞轮，RadixArk 需要回答同样的问题。

查看原文❤️ 230 · 🔄 43 · 💬 35

Ai2 发布 MolmoAct 2：开源机器人模型首次突破「实验室围墙」进入真实家务场景

Ai2 (@allen_ai)

MolmoAct 2 是目前最大的开源双臂机器人数据集，首次在非受控环境中验证家务与实验任务能力。

• 配套发布 Bimanual YAM 数据集，开源程度碾压同类闭源方案 • 从「实验室 demo」到「真实环境部署」的跨越，是具身 AI 商业化的关键拐点 • 对特斯拉 Optimus 等闭源路线形成开源社区的正面挑战

锐评：具身智能的真正瓶颈不是硬件，是「见过多少种真实场景」。开源数据集的规模优势正在倒逼闭源玩家加速落地。

查看原文❤️ 196 · 🔄 49 · 💬 4

以太坊代币化美债市值突破 80 亿美元：链上无风险资产半年翻倍，Agent 经济的底层流动性池成型

Cointelegraph (@Cointelegraph)

代币化美债成为链上经济体的"基础设施利率"，Agent 交易和 DeFi 策略的底层资产锚正在形成。

• 以太坊上代币化美债市值达 80 亿美元历史新高，半年翻倍增长 • 为 Agent 经济提供链上无风险收益率基准，支撑自动化策略的资产配置逻辑 • 传统金融资产链上化进程加速，合规与去中心化的张力持续拉扯

gakki 锐评：这不只是数字好看——代币化美债是 Agent 经济的"国债利率"，没有稳定的链上无风险资产，Agent 的量化策略就是空中楼阁。80 亿美元说明机构资金正在认真下注这条路径。

查看原文❤️ 161 · 🔄 41 · 💬 65

leavingme.cn