Back

2026-05-06 科技动态

今日要点

  • SubQ 首个亚二次稀疏注意力模型:12M 上下文窗口、比 FlashAttention 快 52 倍、成本不到 Opus 的 5%
  • PageIndex 用树索引替代向量检索:RAG 的「反 Embedding」范式正在动摇整个向量数据库行业
  • Gemma 4 多Token预测推理提速3倍:端侧Agent的速度瓶颈正在被架构级方案击穿
  • GPT-5.5 驱动 ChatGPT 入驻 Excel/Sheets:AI Agent 正在吞噬办公套件的入口层
  • 非技术团队开始交付生产代码:AI Coding 的真正冲击波刚刚开始

专题追踪更新

  • SubQ 首个亚二次稀疏注意力模型:12M 上下文窗口、比 FlashAttention 快 52 倍、成本不到 Opus 的 5%注意力机制的工程瓶颈正在被亚二次架构撬开。 · 专题页 · 原文
  • 宝玉实测 Codex /goal 跑 17 小时:长时间 Agent 任务的工程纪律不是「让它跑久」,而是分阶段验收长时任务的关键不是 duration,而是 feedback loop 的工程化。 · 原文
  • Gemma 4 多Token预测推理提速3倍:端侧Agent的速度瓶颈正在被架构级方案击穿MTP草稿机制让Gemma 4在不损失质量的前提下输出速度翻3倍,这是端侧Agent从「能跑」到「好用」的关键拐点。 · 专题页 · 原文
  • GPT-5.5 Instant 悄悄替换 5.3 成为 ChatGPT 默认档:幻觉降 52%,回答变短,但开始主动翻你的聊天记录OpenAI 把几亿人的日常模型静默升级了,这是「隐形基建」层面的能力跃迁。 · 原文
  • Perplexity 推出金融专业版:带牌照数据源+35个垂直工作流,AI搜索开始啃硬骨头Perplexity Computer for Professional Finance 不是在做通用AI搜索的增量,而是在用Morningstar、PitchBook等授权数据源构建金融分析师的专属工作台。 · 原文

X AI 趋势速览

Ai2 发布开源 MolmoAct 2,赋能真实世界机器人任务

**AI 摘要:**AI2 发布了 MolmoAct 2,这是一个完全开放的模型,能让机器人完成倒茶、擦桌子、叠毛巾等日常家务,以及 CRISPR 样品处理等实验室工作。它擅长 3D 推理,无需定制即可适配双臂机器人,执行速度比前代快 37 倍,在多项基准测试中超越 GPT-5 等模型。所有权重、720 小时演示数据,甚至廉价硬件方案均在 Hugging Face 开源,助力全球实验室推进机器人研究。研究人员称其为机器人领域迈向重大突破的一步。

Ai2 (@allen_ai):Robotics models often struggle outside controlled environments. Ours is built to work in real ones.

Today we're launching MolmoAct 2, which can assist with a host of chores & lab tasks, plus the MolmoAct 2-Bimanual YAM dataset—the largest open robotics dataset of its kind. 🧵 https://t.co/xObLxwldMr

❤️ 196🔄 49💬 4查看趋势

Bun 开发者尝试用 Claude 将 Zig 代码移植到 Rust

**AI 摘要:**主要用 Zig 编写的高速 JavaScript 运行时 Bun,近日出现了一个实验性分支,其创始人 Jarred Sumner 已提交超过 30 个 commit,将部分代码移植到 Rust。该分支名为"claude/phase-a-port",包含一份长达 622 行的 PORTING.md 移植指南,详细映射了 Zig 中的分配器、指针等概念到 Rust 的对应实现,并规划了草稿和优化等阶段。社区对 Rust 的稳定性和生态表示期待,但也有观点认为这是 Anthropic 的 Claude 进行的一次 AI 实验——依据是仓库中存在 CLAUDE.md 等文件,且 Bun 早有利用大语言模型优化代码的先例。目前尚无变更合并至主分支。

Luke Parker (@LukeParkerDev):what!? is Bun moving from Zig to Rust???

https://t.co/qGbQsrHMZI

❤️ 358🔄 32💬 17查看趋势

ChatGPT推出1985年复古风格广告,在X上掀起AI怀旧热潮

**AI 摘要:**周日晚间,ChatGPT 官方账号发布了一张虚构的1985年电脑杂志广告,画面中一家人在老式电脑上提问、头脑风暴、不停聊天。网友们迅速跟风,创作了各种80年代风格的广告:有带着阴险猴子的加密项目 CoinMafia、代币 Memelord 标价42美元的梗图、F1 主页、怪物史莱克的 OgreMode,甚至还有适配老硬件的 AmigaeGPT。大多数人沉浸在怀旧氛围中,但艺术家 Reid Southen 指出了"值得信赖的知识"旁边那段错误免责声明的讽刺意味,还有人调侃说自家的 Commodore 64 都要哭了。这股热潮延续了此前假造1998年 ChatGPT 首页等爆款的势头,再次证明 AI 能轻松将过去重新混搭成趣味十足的社区创作。

ChatGPT (@ChatGPTapp)https://t.co/zA3iLk28Hb

❤️ 7109🔄 681💬 479查看趋势

Coinbase 裁员引发"被炒鱿鱼坦白局"讽刺梗热潮

**AI 摘要:**2026年5月5日,用户@ghhosttdn42发布了一条讽刺帖文,称自己在Coinbase工作多年,无故冻结客户账户后被解雇,还配了一张AI风格的照片。这条帖子的时机恰逢CEO Brian Armstrong宣布裁员700人(占员工总数的14%),以在市场动荡期间向AI原生架构转型。网友纷纷跟帖玩梗,用夸张的copypasta吐槽公司各种槽点,比如投诉工单关闭太快等。与此同时,用户对市场波动期间账户被冻结的真实不满依然存在,尽管Coinbase给出了合规方面的解释并进行了近期改进。

Nick Szabo (@NickSzabo4):@ghhosttdn42 Very sorry to hear this. But please tell us more.

❤️ 72🔄 0💬 2查看趋势

Coinbase裁员700人,应对加密货币市场波动与AI转型

**AI 摘要:**Coinbase 正在裁减约 14% 的员工,即从 5,000 人中裁去 700 人,原因是加密货币市场低迷以及 AI 加速了过去需要整支团队完成的工作。Armstrong 强调公司资金充裕,将继续投入稳定币和代币化业务的增长,同时推进组织扁平化改革,组建由小型团队构成的"AI 原生小组"。外界质疑在一家保管客户资金的公司中使用 AI 生成代码存在风险,Armstrong 对此澄清,所有此类代码均需经过严格的人工审查;受影响的员工将获得至少 16 周的遣散费及相关福利。

James Surowiecki (@JamesSurowiecki):The last thing you want to hear the CEO of a financial-services firm say is "Non-technical teams are now shipping production code." https://t.co/ZqEZjR7Fcg

❤️ 2368🔄 167💬 101查看趋势

详细内容

SubQ 首个亚二次稀疏注意力模型:12M 上下文窗口、比 FlashAttention 快 52 倍、成本不到 Opus 的 5%

Alexander Whedon (@alex_whedon)

注意力机制的工程瓶颈正在被亚二次架构撬开。

  • SubQ 是首个基于全亚二次稀疏注意力(SSA)的前沿模型,上下文窗口达 1200 万 token
  • 在 1M token 场景下比 FlashAttention 快 52 倍,推理成本压缩至 Opus 的 5% 以下
  • 核心思路:标准注意力浪费算力在无关词对关系上,SSA 只聚焦真正重要的关联

gakki 锐评:稀疏注意力不是新概念,但能跑出 52 倍加速且保持前沿质量的,这是第一个。如果经得起独立评测验证,Opus 级别的百万上下文叙事可能需要重写——因为成本结构被改写了。

PageIndex 用树索引替代向量检索:RAG 的「反 Embedding」范式正在动摇整个向量数据库行业

How To AI (@HowToAI_)

[向量数据库不是 RAG 的必要条件,树索引 + LLM 推理链路在金融基准上跑出 98.7% 准确率。]

  • PageIndex 完全跳过 Embedding、Chunking、相似度搜索三件套,改用文档树索引让 LLM 像人翻书一样逐层推理
  • 在 FinanceBench 上 98.7% 准确率,超越所有向量 RAG 方案登顶
  • 架构极简:零向量库依赖,意味着 RAG 基础设施成本可能被重新定义

gakki 锐评:这不是 RAG 的替代品,而是对「Embedding 万能论」的一次实证反驳——当 LLM 推理能力足够强时,索引结构比向量空间更重要。

Gemma 4 多Token预测推理提速3倍:端侧Agent的速度瓶颈正在被架构级方案击穿

Google for Developers (@googledevs)

MTP草稿机制让Gemma 4在不损失质量的前提下输出速度翻3倍,这是端侧Agent从「能跑」到「好用」的关键拐点。

  • 多Token预测(MTP)drafters一次预测多个token,等效于将推理吞吐量提升至3倍
  • Google明确宣称「same quality, way more speed」——质量守恒前提下的纯速度增益
  • 对移动端/边缘Agent场景意义重大:低延迟交互是Agent体验的硬约束

Gakki:MTP不是新概念,但Google把它工程化落地到开源模型上,意味着端侧Agent的速度门槛正在被系统性拆除。真正的竞争点不在模型智商,在于「感知-决策-执行」闭环的响应速度。

GPT-5.5 驱动 ChatGPT 入驻 Excel/Sheets:AI Agent 正在吞噬办公套件的入口层

ChatGPT (@ChatGPTapp)

ChatGPT 以插件形态嵌入 Excel 和 Google Sheets,背后是 GPT-5.5 的推理能力。

• 支持数据清洗、公式生成、实时解释,用户无需离开表格环境 • 标志着 OpenAI 从「对话入口」向「工作流原生嵌入」的战略转向 • 对 Google Workspace AI 和 Microsoft Copilot 形成直接竞争压力

锐评:这不是功能更新,是入口战争的降维打击——谁能在用户「不切换窗口」的瞬间提供价值,谁就握住了企业级 AI 的咽喉。

非技术团队开始交付生产代码:AI Coding 的真正冲击波刚刚开始

James Surowiecki (@JamesSurowiecki)

金融服务公司 CEO 宣称非技术团队已在交付生产代码——这是 AI 编程工具渗透到业务一线的里程碑信号。

  • 当非技术人员能直接产出可运行的生产代码,传统「技术门槛」正在被 AI 工具链彻底消解
  • 这不是 Vibe Coding 的玩具 Demo,而是金融服务这种对代码质量有严格要求的行业
  • 意味着「谁来写代码」的权力结构正在重组:产品经理、业务分析师可能成为新的代码生产者

gakki 锐评: 这条推文的警示意义大于庆祝意义——非技术团队能交付代码,不代表他们能维护代码。真正的考验在生产事故发生时。

Perplexity 推出金融专业版:带牌照数据源+35个垂直工作流,AI搜索开始啃硬骨头

Perplexity (@perplexity_ai)

Perplexity Computer for Professional Finance 不是在做通用AI搜索的增量,而是在用Morningstar、PitchBook等授权数据源构建金融分析师的专属工作台。

  • 接入Morningstar、PitchBook、Daloopa、Carbon Arc四家专业金融数据提供商
  • 内置35个覆盖分析师周度重复工作的专用流程
  • 从「AI搜索」跃迁到「AI工作台」,本质是把搜索能力嵌入专业决策链

Gakki:这条路线的真正壁垒不在AI能力——谁都能接API——而在牌照数据源的排他性和工作流的行业理解深度。Perplexity正在验证一个假设:垂直Agent的价值上限取决于你嵌入了多少「不可替代的决策上下文」。

Google AI Studio 内置图像资产自动生成:设计工具正在从「辅助」滑向「替代」

Google AI Studio (@GoogleAIStudio)

[AI Studio 将 NanoBanana 图像生成嵌入应用构建流程,编辑工具支持视觉化组件注解与素材替换。]

  • 应用生成时自动创建配套图像素材,不再需要单独跑图再导入
  • 重新设计的编辑工具支持可视化组件更新、标注、图片替换
  • 信号:Google 正在把「设计」从独立环节压缩进「构建」环节

gakki 锐评:当 AI Studio 一站式搞定代码+图像+布局,独立设计工具的生存空间正在被上游平台吞噬——Figma 们该紧张的不是 AI 画图,而是 AI 构建流程本身。

Google Finance 集成AI关键摘要:巨头正在用AI重写存量产品的信息密度

Evan (@StockMKTNewz)

Google Finance上线AI-powered key moments功能,将AI摘要能力嵌入金融信息消费场景。

  • 不是新产品发布,而是在成熟产品中植入AI能力——这是Google的典型打法
  • 与Perplexity金融版形成有趣对照:一个是垂直Agent降维打击,一个是存量产品就地升级
  • 信号意义大于功能本身:Google正在系统性地将AI能力渗透进每一个产品触点

Gakki:Google的做法是「毛细血管式渗透」——不造新船,而是在每条旧船上装引擎。短期体验提升有限,但长期看,当所有产品都有AI摘要,「信息过载」这个需求本身就可能被重新定义。

MATLAB 也要加 Agentic Workflow:传统工程工具的 AI 焦虑正在蔓延

terminally onλine εngineer (@tekbog)

一位工程师吐槽「在 MATLAB 里加 agentic workflows 感觉很不神圣」——这种不适感恰恰说明 AI Agent 正在渗透到最保守的工程工具链。

  • MATLAB 代表的是传统工程/科研领域,这个群体对「AI 化」的接受度最低
  • 当连 MATLAB 都在追 Agent 概念时,说明 AI 工具化已经过了「要不要做」的阶段,进入「怎么做好」
  • 工程师的「unholy 感」反映了工具哲学的冲突:确定性工程 vs 概率性 AI

gakki 锐评: MATLAB 加 Agent 是必然的,但「感觉不神圣」的直觉是对的——工程工具的核心是确定性,Agent 的核心是概率性,两者融合需要新的设计哲学。

OpenClaw Agent 拥有独立电脑、邮箱、电话和信用卡:「数字分身」从概念进入可操作阶段

Micky (@Rasmic)

开发者 Micky 花两个月为 OpenClaw Agent 接入真实基础设施,实现自主通信与支付能力。

• Agent 获得独立计算资源(Daytona)、邮箱、电话、信用卡四件套 • 从「对话助手」到「经济主体」的跨越,Agent 经济自主权的实证案例 • 开源社区的 DIY 实践正在跑赢大厂的 Agent 产品化节奏

锐评:当 Agent 能自己付钱、自己打电话时,「数字员工」就不再是比喻。但这也意味着风控和合规将成为下一个硬约束。

DFlash 为 Gemma 4 提速 6 倍:开源推理优化工具瞄准端侧部署效率瓶颈

Zhijian Liu (@zhijianliu_)

推理效率优化工具直接适配 Gemma 4,开源方案挑战闭源推理栈的定价权。

• DFlash 实现 Gemma 4 最高 6 倍推理加速,原生支持 MTP(Multi-Token Prediction)特性 • 开源工具链绕过云厂商推理服务溢价,端侧部署成本结构被重写 • Google 官方模型 + 第三方开源加速器的组合模式正在成为新范式

gakki 锐评:端侧推理效率优化已进入"工具民主化"阶段,但真正决定落地的是谁能跑通从模型到应用的最后一公里——DFlash 的价值不在速度本身,在于它让小团队也能玩得起 Gemma 4。

MoonPay 收购 DFlow:加密支付基础设施开始为 AI Agent 的「经济自主权」铺设底层通道

MoonPay 🟣 (@moonpay)

MoonPay 收购 DFlow 是一个信号:加密支付正在从「人用工具」向「Agent 可调用基础设施」迁移。

  • DFlow 专注订单流和 DeFi 路由,MoonPay 是法币-加密桥接巨头
  • 收购意味着支付通道正在整合,为 Agent 自主交易提供更完整的基础设施

gakki 锐评:当 AI Agent 需要自己付钱、自己收款、自己结算时,它需要的不是「用户授权后执行」的支付 API,而是一个原生的金融通道。MoonPay + DFlow 的组合正在朝这个方向走——虽然离真正的 Agent 经济自主权还有距离,但管道在铺。

RadixArk 一亿美金种子轮押注开源前沿 AI 基础设施:训练推理栈不该被巨头垄断

RadixArk (@radixark)

AI 基础设施的「重复造轮子」问题正在吸引大额资本介入。

  • RadixArk 以 4 亿美金估值完成 $100M 种子轮,Accel 领投、Spark Capital 跟投
  • 定位:让前沿 AI 训练和推理基础设施开源可及
  • 痛点:大多数 AI 团队被迫从零重建训练推理栈,重复劳动严重

gakki 锐评:一亿美金种子轮本身就是信号——VC 认为 AI infra 的开源化不是公益而是生意。但开源 infra 的护城河在哪?历史上 Hugging Face 走通了社区飞轮,RadixArk 需要回答同样的问题。

Ai2 发布 MolmoAct 2:开源机器人模型首次突破「实验室围墙」进入真实家务场景

Ai2 (@allen_ai)

MolmoAct 2 是目前最大的开源双臂机器人数据集,首次在非受控环境中验证家务与实验任务能力。

• 配套发布 Bimanual YAM 数据集,开源程度碾压同类闭源方案 • 从「实验室 demo」到「真实环境部署」的跨越,是具身 AI 商业化的关键拐点 • 对特斯拉 Optimus 等闭源路线形成开源社区的正面挑战

锐评:具身智能的真正瓶颈不是硬件,是「见过多少种真实场景」。开源数据集的规模优势正在倒逼闭源玩家加速落地。

以太坊代币化美债市值突破 80 亿美元:链上无风险资产半年翻倍,Agent 经济的底层流动性池成型

Cointelegraph (@Cointelegraph)

代币化美债成为链上经济体的"基础设施利率",Agent 交易和 DeFi 策略的底层资产锚正在形成。

• 以太坊上代币化美债市值达 80 亿美元历史新高,半年翻倍增长 • 为 Agent 经济提供链上无风险收益率基准,支撑自动化策略的资产配置逻辑 • 传统金融资产链上化进程加速,合规与去中心化的张力持续拉扯

gakki 锐评:这不只是数字好看——代币化美债是 Agent 经济的"国债利率",没有稳定的链上无风险资产,Agent 的量化策略就是空中楼阁。80 亿美元说明机构资金正在认真下注这条路径。