2026-04-30 科技动态

今日要点

Gemini 内嵌 Office 全家桶：Google 正在用「对话即交付」重定义生产力入口
Musk vs OpenAI 庭审交锋：亿万富翁拒绝被律师「格式化」的回答范本
Cursor 开放 Agent SDK：从编辑器升级为 Agent 基础设施平台
Zed 编辑器打破零版本传统：版本号从 0 到 1，编辑器军备赛进入正赛
Stripe Agent 市场的 SaaS V2 叙事：为 Agent 构建「可消费」的数字服务正在成为新创业方向

专题追踪更新

OpenAI 上架 AWS 打破 Azure 独占：模型分发从「租户绑定」走向「云中立」：OpenAI 首次将模型、Codex 和 Bedrock Managed Agents 以有限预览形式开放给 AWS 客户，标志着其分发策略从 Azure 独占转向多云中立。 · 原文
DeepSeek 多模态模型全量上线：识图速度碾压级，但交互形态仍在「拼装期」：DeepSeek 多模态识图能力正式全量上线网页版，用户实测反推提示词、前端复刻等场景均表现强劲，速度成为最大记忆点。 · 原文
DeepSeek 多模态识图模型上线灰度测试：速度快到像 System 1 直觉输出，但推理能力缺席：DeepSeek 的视觉多模态能力正式进入灰度测试，但形态与预期不同。 · 专题页 · 原文
Qwen 发布 FlashQLA：线性注意力内核 2-3x 加速，边缘 Agent 推理瓶颈松动：边缘 AI 的真正瓶颈不是模型大小，而是注意力计算复杂度——FlashQLA 从内核层突破。 · 原文
Cursor 开放 Agent SDK：从编辑器升级为 Agent 基础设施平台：Cursor 正在从 IDE 转型为 Agent 运行时平台——这是编码工具品类的平台化拐点。 · 专题页 · 原文

**AI 摘要：**2026年4月28日，在AWS的"What's Next"活动上，公司宣布与OpenAI深化合作，以有限预览的方式向客户提供前沿模型、Codex编程代理及Bedrock托管代理。此举紧随OpenAI近期摆脱微软独家合作的转变，将AWS Bedrock打造为关键的多云选项，支持IAM身份验证、加密以及通过CLI或VS Code实现的无缝代码工具集成。AWS CEO Matt Garman等高管对此举表示赞赏，认为这为客户提供了更多选择，助力企业从AI实验快速迈向生产落地。

OpenAI Newsroom (@OpenAINewsroom)：Earlier this year, OpenAI and @amazon partnered to bring OpenAI’s frontier capabilities to enterprises, startups, and customers around the world.

We’re taking the next step: making our models, Codex, and Bedrock Managed Agents available to @awscloud customers, in limited preview.

Making OpenAI available on AWS means enterprises can get AI into production faster - across software engineering and other professional workflows.

We’re excited to see what gets built!

https://t.co/04HlMSSOEe

❤️ 858🔄 70💬 33查看趋势

阿里巴巴 FlashQLA 加速设备端 AI 注意力机制

**AI 摘要：**FlashQLA 在 NVIDIA H200 GPU 上针对预填充阶段进行优化，为 Qwen3.5 和 Qwen3.6 模型中的线性注意力方法 GDN 实现了前向传播 2-3 倍加速和反向传播 2 倍提速。它引入了门控驱动并行、硬件调优和 TileLang 内核，将最长 32k token 长序列的延迟大幅降低，并支持单卡上的张量并行运行。开发者对其在本地 AI 智能体方面的潜力给予高度评价，但该方案需要较新的 Hopper GPU；该库采用 MIT 许可证，通过 pip 即可快速安装测试。

Qwen (@Alibaba_Qwen)：🚀 Introducing FlashQLA: high-performance linear attention kernels built on TileLang.

⚡ 2–3× forward speedup. 2× backward speedup. 💻 Purpose-built for agentic AI on your personal devices.

💡Key insights:

Gate-driven automatic intra-card CP.
Hardware-friendly algebraic reformulation.
TileLang fused warp-specialized kernels.

FlashQLA boosts SM utilization via automatic intra-device CP. The gains are especially pronounced for TP setups, small models, and long-context workloads.

Instead of fusing the entire GDN flow into a single kernel, we split it into two kernels optimized for CP and backward efficiency. At large batch sizes this incurs extra memory I/O overhead vs. a fully fused approach, but it delivers better real-world performance on edge devices and long-context workloads.

The backward pass was the hardest part: we built a 16-stage warp-specialized pipeline under extremely tight on-chip memory constraints, ultimately achieving 2×+ kernel-level speedups.

We hope this is useful to the community!🫶🫶 Learn more: 📖 Blog: https://t.co/HF6opiR4yf 💻 Code: https://t.co/G3oaf5L1AZ

❤️ 995🔄 115💬 26查看趋势

动画视频揭秘智齿拔除步骤

**AI 摘要：**这段由 NANA 在周二早些时候转发的 16 秒视频，标注了从麻醉、拔牙到愈合的全过程，期间还闪烁着"智齿真是奇怪"的字样。网友们分享了插管导致喉咙疼痛、术后说话困难，以及对牙医椅挥之不去的恐惧。尽管有人表示术后有所缓解，但大多数人认同这个手术确实带来不小的不适，不适感在第一天达到顶峰，肿胀则会持续 3 到 7 天。

Shels Bella (@ShelsBellaen)：Wisdom teeth are weird. 🥹 https://t.co/H22SVRHT97

❤️ 84🔄 8💬 83查看趋势

蚂蚁集团 Ling-2.6-flash 开源快速 104B AI 模型

**AI 摘要：**蚂蚁集团旗下的inclusionAI发布了Ling-2.6-flash，这是一个拥有1040亿参数的混合专家模型，但活跃参数仅74亿，测试中跑出了每秒210个token的速度。它在SWE-bench Verified等基准测试中表现出色，得分61.2%，并支持26.2万token的上下文窗口，非常适合高效的Agent工作流、编程和中英双语任务。该模型以MIT许可证在Hugging Face上开放，在实际应用场景中超越了不少参数规模更大的竞品，vLLM等推理引擎也已快速适配，Demo展示了高速生成网页和小说的能力。

Ant Ling (@AntLingAGI)：Ling-2.6-flash is now officially open-sourced! A fast, token-efficient Instruct model built for real-world agent workflows. 104B total parameters · 7.4B active parameters Available in BF16, FP8, and INT4 variants for different deployment needs. Key strengths:

Fast generation: 215 tokens/s on Artificial Analysis Output Speed
High token efficiency: only 15M tokens on the full AA Intelligence Index evaluation
Real task execution: strong performance across coding, document processing, and lightweight agent workflows
Improved experience: better Chinese-English switching and smoother compatibility with mainstream coding frameworks

❤️ 436🔄 66💬 30查看趋势

Anthropic 为创意软件推出 Claude 连接器

**AI 摘要：**2026年4月28日，Anthropic 发布了连接器功能，让 Claude AI 能够直接与 Blender、Adobe 创意云应用、Ableton 和 Autodesk Fusion 等工具协作。用户只需用自然语言向 Claude 描述需求，即可在几秒内完成材质分配、素材生成、场景调试或 3D 建模等任务。创作者们对这一效率提升赞不绝口，有人称其为颠覆性变革；但也有观点指出，一些简单演示不过是快捷操作的翻版，并对专业人士的就业前景表达了担忧。

Claude (@claudeai)：Claude now connects to the tools creative professionals already use.

With the new Blender connector, you can debug a scene, build new tools, or batch-apply changes across every object, directly from Claude. https://t.co/Kc3cBHTNpV

❤️ 30834🔄 2635💬 1168查看趋势

详细内容

Gemini 内嵌 Office 全家桶：Google 正在用「对话即交付」重定义生产力入口

Sundar Pichai (@sundarpichai)

Google 把文档生成从「工具」变成「对话的副作用」，这是平台级生产力入口的重新定义。

Gemini 现在可以直接在对话中生成 Docs、Sheets、Slides、PDFs 并下载，无需复制粘贴或格式转换
全球所有 Gemini 用户可用，意味着 Google 正将 AI 对话界面升级为 Office 的替代入口
这不是功能更新，而是 Google 对「AI 工具应该长什么样」的回答：对话即产出

锐评：Google 终于找到了 Gemini 的差异化打法——不跟模型能力卷，而是把自家 Office 生态变成 AI 的原生输出格式。微软的 Copilot 还在「辅助」，Google 直接跳到了「替代」。

查看原文❤️ 14968 · 🔄 1364 · 💬 493

Musk vs OpenAI 庭审交锋：亿万富翁拒绝被律师「格式化」的回答范本

NIK (@ns123abc)

Musk 在交叉质询中反客为主，拒绝 Wachtell Lipton 律师的二元陷阱，展示了对抗性法律话术的标准拆解方式。

Wachtell Lipton 的 Savitt 试图用「是或否」框架压缩复杂问题，Musk 直接揭露问题本身的误导性前提
这场庭审的核心是 OpenAI 从非营利转营利的合法性，Musk 的证词风格暗示他准备打「公众舆论战」而非纯法律战
对 AI 治理的意义：非营利转营利的治理漏洞正在被司法系统逐条审视

gakki 锐评：Musk 深谙「拒绝回答本身就是回答」的传播策略——这场庭审的真正战场不在法庭，在推特。

查看原文❤️ 9011 · 🔄 971 · 💬 328

Cursor 开放 Agent SDK：从编辑器升级为 Agent 基础设施平台

Cursor (@cursor_ai)

Cursor 正在从 IDE 转型为 Agent 运行时平台——这是编码工具品类的平台化拐点。

SDK 将 Cursor 内部的 harness（代码索引、语义搜索、MCP 工具接入、.cursor/skills/ 技能加载、子 agent 拆分能力）整体开放，开发者 npm install @cursor/sdk 即可调用
支持本地运行和云端沙箱双模式，云端 agent 拥有独立 VM、克隆仓库、断网续跑能力，完成后可直接开 PR
模型层不锁定，OpenAI / Anthropic / Google 前沿模型一键切换，也可用 Cursor 自研 Composer 2

gakki 锐评：Anthropic 的 Claude Code SDK、OpenAI 的 Codex CLI、现在 Cursor SDK——三大玩家同时把 Agent 运行时开放为平台级 API，「编码工具」这个品类正在坍缩为「Agent 基础设施」。Cursor 的差异化在于它把 harness 和 skills 生态一起打包了，这比单纯开放模型调用有更深的护城河。

查看原文❤️ 7495 · 🔄 702 · 💬 336

Zed 编辑器打破零版本传统：版本号从 0 到 1，编辑器军备赛进入正赛

Zed (@zeddotdev)

Zed 从 0.x 跳到 1.0，意味着它从「实验性项目」正式毕业为「生产级产品」。

千余个版本都在 0.x 徘徊，今天正式进入 1.0——这是对稳定性和承诺的公开宣示
在 Cursor、Windsurf 等 AI 编辑器疯狂迭代的窗口期发布 1.0，Zed 选择了「稳定压倒创新」的差异化路线

锐评：编辑器赛道的竞争维度已经从「AI 能力」扩展到「工程成熟度」。Zed 的 1.0 不是在追 AI 潮流，而是在赌「开发者最终需要的是一个不会崩的编辑器」。

查看原文❤️ 7272 · 🔄 771 · 💬 251

Stripe Agent 市场的 SaaS V2 叙事：为 Agent 构建「可消费」的数字服务正在成为新创业方向

Max Blade (@_MaxBlade)

当 Agent 开始「花钱」，围绕 Agent 消费行为构建的 SaaS 就是下一代创业机会。

核心逻辑：Stripe 创造了一个全新的市场——Agent 作为消费者购买数字服务
当前市场空白，先发者有机会定义品类
本质是 SaaS 2.0：从「卖给人用」到「卖给 Agent 用」

gakki 锐评：叙事很性感，但 Agent 真正需要的「消费」是什么？不是又一个 API wrapper，而是能被 Agent 自主发现、调用、付费的服务单元。Stripe 接了水管，但水还没流起来。

查看原文❤️ 3457 · 🔄 163 · 💬 101

DeepSeek V4 用三分钱修了 Claude Opus 4.7 的 8 个内存泄漏：跨模型调试的性价比叙事正在改写工具选型逻辑

HealthRanger (@HealthRanger)

便宜模型在「确定性修复任务」上的性价比碾压已不是传闻，而是可复现的工程事实。

Claude Opus 4.7 写的代码存在 8 个内存泄漏导致崩溃，DeepSeek V4 几分钟内全部定位并修复，成本约三分钱
这验证了「用贵模型写、用便宜模型修」的混合工作流模式，模型分工正在按任务确定性分层
对开发者而言，这动摇了「顶级模型=全能」的迷信，场景适配比模型等级更重要

gakki 锐评：这个案例的真正价值不在于 DeepSeek 便宜，而在于它暴露了一个被忽视的事实——debug 是高度确定性的任务，不需要推理链，需要的是模式匹配和代码理解，这恰好是便宜模型的甜区。

查看原文❤️ 2828 · 🔄 218 · 💬 117

Qwen 发布 FlashQLA：线性注意力内核 2-3x 加速，边缘 Agent 推理瓶颈松动

Qwen (@Alibaba_Qwen)

边缘 AI 的真正瓶颈不是模型大小，而是注意力计算复杂度——FlashQLA 从内核层突破。

基于 TileLang 构建的高性能线性注意力内核，前向 2-3x 加速，反向 2x 加速
三大技术亮点：Gate 驱动的自动卡内 CP、硬件友好代数重排、TileLang 融合 warp 专用内核
明确定位为「个人设备上的 agentic AI」，对 TP 配置、小模型、长上下文场景增益最显著

gakki 锐评：当行业还在卷模型参数量时，Qwen 在卷内核效率。线性注意力 + 端侧优化的组合拳，意味着未来手机上的 Agent 不只是「能跑」，而是「跑得快到可以用」。这是算力民主化的底层基建。

查看原文❤️ 995 · 🔄 115 · 💬 26

Stripe Treasury 上线：Agent 支付基础设施从「借道加密货币」走向「正统银行账户」

Marc Lou (@marclou)

Stripe Treasury 为 Agent 提供原生银行级资金管理能力，削弱了加密货币作为 Agent 支付唯一通道的叙事。

Stripe Treasury 提供银行账户详情、余额转账、信用卡等功能，所有操作基于 Stripe 余额完成
这意味着 AI Agent 可以通过 Stripe 生态获得正规的金融基础设施，无需依赖加密货币通道
对 Agent 经济而言，传统金融基础设施的开放程度正在追赶加密基建的速度

gakki 锐评：Agent 经济的支付层正在分裂成两条路线——加密原生 vs 传统金融原生。Stripe Treasury 的出现意味着 Agent 不一定要走 crypto 才能实现经济自主，这对「Agent 必须上链」的叙事是降维打击。

查看原文❤️ 1043 · 🔄 37 · 💬 99

Cloudflare 正式赋予 Agent「客户身份」：注册账号、订阅付费、部署代码，Agent 经济自主权的关键基建缺口被填补

Cloudflare (@Cloudflare)

Agent 首次获得独立的基础设施客户身份，这是 Agent 经济自主权从概念走向工程落地的标志性一步。

Cloudflare 宣布 Agent 可以自主创建账号、发起付费订阅、注册域名并获取 API Token 部署代码，无需人类代持
这意味着 Agent 不再是「借用人身份的脚本」，而是拥有独立账户生命周期的实体
对 Agent 经济生态而言，基础设施层的身份独立是支付独立的前提条件

gakki 锐评：Cloudflare 这步棋的本质是把「Agent 当人看」——当基础设施厂商开始为 Agent 设计原生客户流程时，说明 Agent 经济不再是叙事，而是正在被工程化验证的商业现实。

查看原文❤️ 912 · 🔄 87 · 💬 36

OpenAI 上架 AWS 打破 Azure 独占：模型分发从「租户绑定」走向「云中立」

OpenAI Newsroom (@OpenAINewsroom)

OpenAI 首次将模型、Codex 和 Bedrock Managed Agents 以有限预览形式开放给 AWS 客户，标志着其分发策略从 Azure 独占转向多云中立。

企业客户可直接在 AWS 侧调用 OpenAI 能力，软件工程和专业工作流场景优先落地
此举等于承认单一云绑定已成增长瓶颈，模型商品化压力倒逼分发侧「去围墙化」
AWS 获得顶级模型入驻，与 Anthropic/Google 的 Bedrock 竞争格局骤然加剧

gakki 锐评：OpenAI 终于想明白——模型差异化在收窄，谁的管道更宽谁赢。Azure 独占是历史包袱，不是护城河。

查看原文❤️ 858 · 🔄 70 · 💬 33

AI 基础设施股持续碾压预期：市场在用真金白银投票「算力 > 应用」

amit (@amitisinvesting)

市场正在结构性地奖励 AI 基础设施层，即使估值倍数已经很高。

SOFI、HOOD 等零售概念股遭遇重挫，而 BE、STX、NXP 等 AI 基础设施股持续交出亮眼财报
关键信号：在当前从低点反弹的阶段，市场更倾向于追涨赢家而非抄底输家
「输家」（基本面没问题但股价弱）的传统抄底逻辑正在失效

gakki 锐评：这不是简单的「AI 概念炒作」，而是市场在重新定价「谁在 AI 价值链中拿走了最大的蛋糕」。答案越来越清晰：卖铲子的比挖金子的赚钱——而且差距还在扩大。

查看原文❤️ 553 · 🔄 7 · 💬 115

Vanta 增长反常识加速：$10M→$300M ARR 复利效应验证合规 SaaS 天花板

Christina Cacioppo (@christinacaci)

合规自动化赛道正在打破「大公司增长必然减速」的常识。

Vanta 从 $10M 到 $100M ARR 花了 2 年，$100M 到 $200M 花了 15 个月，$200M 到 $300M 只花了 9 个月
增长率连续四个季度加速——在 B2B SaaS 中极为罕见
「叙事违抗」（Narrative Violation）：市场默认 pre-2022 公司增速会放缓，Vanta 用数据反驳

gakki 锐评：Vanta 的加速增长揭示了一个被低估的 AI 商业逻辑：合规不是「锦上添花」，而是企业数字化的刚性瓶颈。当 AI 让创业门槛降低，合规需求反而指数级增长——Vanta 踩中的是 AI 繁荣的「影子需求」。

查看原文❤️ 393 · 🔄 26 · 💬 25

OpenAI 提示词指南的范式信号：GPT-5.5 在逼你「少写」而不是「多写」

宝玉 (@dotey)

GPT-5.5 的提示词指南不是使用技巧，是 OpenAI 对 Agent 工程范式的官方重新定义。

核心转变：从「保姆式步骤指令」转向「描述结果+约束条件」，模型自行规划路径
官方原话暗示：冗长指令反而缩小搜索空间、让输出死板——这是对整个 Prompt Engineering 产业链的降维否定
API 定价 $5/$30 per M tokens，100 万上下文，六周迭代节奏未放缓

gakki 锐评：当模型方亲自下场说「别写那么多了」，还在卖课教 Prompt 模板的博主该紧张了。但「少写」不等于「不写」——边界在于你是否真的理解任务结构，而不是偷懒。

查看原文❤️ 235 · 🔄 36 · 💬 7

Karpathy 重新定义 Vibe Coding：从「随意编码」到「Agentic Engineering」的认知升级

宝玉 (@dotey)

Vibe Coding 的终局不是「不写代码」，是工程化编排 Agent。

Karpathy 最新访谈明确将 Vibe Coding 定义为起点而非终点
真正重要的是 Agentic Engineering——如何系统化地编排、约束、验证 Agent 行为
这与当前社区「Vibe Coding = 不需要工程能力」的误读形成直接对冲

gakki 锐评：当 Vibe Coding 的提出者亲自修正方向，说明行业已经越过了「速度幻觉」阶段。下一步是 Harness Engineering，不是更随意，而是更结构化。

查看原文❤️ 170 · 🔄 39 · 💬 3

Stripe Managed Payments 上线 195 个市场：Agent 经济基础设施的「水管」正式接通

Stripe (@stripe)

Stripe 不是在做支付产品，是在为 Agent 经济铺设「税务+风控+争议处理」的全托管管道。

195 个市场的商家记录解决方案，覆盖税务、欺诈、争议、客服全链路
对 Agent 场景意味着：任何 Agent 驱动的数字交易都有了现成的合规基础设施
这是从「Agent 能花钱」到「Agent 花钱合法合规」的关键一步

不是加密叙事，是传统支付基础设施对 Agent 经济的正式拥抱。

查看原文❤️ 169 · 🔄 15 · 💬 18

leavingme.cn