Back

2026-04-30 科技动态

今日要点

  • Gemini 内嵌 Office 全家桶:Google 正在用「对话即交付」重定义生产力入口
  • Musk vs OpenAI 庭审交锋:亿万富翁拒绝被律师「格式化」的回答范本
  • Cursor 开放 Agent SDK:从编辑器升级为 Agent 基础设施平台
  • Zed 编辑器打破零版本传统:版本号从 0 到 1,编辑器军备赛进入正赛
  • Stripe Agent 市场的 SaaS V2 叙事:为 Agent 构建「可消费」的数字服务正在成为新创业方向

专题追踪更新

  • OpenAI 上架 AWS 打破 Azure 独占:模型分发从「租户绑定」走向「云中立」OpenAI 首次将模型、Codex 和 Bedrock Managed Agents 以有限预览形式开放给 AWS 客户,标志着其分发策略从 Azure 独占转向多云中立。 · 原文
  • DeepSeek 多模态模型全量上线:识图速度碾压级,但交互形态仍在「拼装期」DeepSeek 多模态识图能力正式全量上线网页版,用户实测反推提示词、前端复刻等场景均表现强劲,速度成为最大记忆点。 · 原文
  • DeepSeek 多模态识图模型上线灰度测试:速度快到像 System 1 直觉输出,但推理能力缺席DeepSeek 的视觉多模态能力正式进入灰度测试,但形态与预期不同。 · 专题页 · 原文
  • Qwen 发布 FlashQLA:线性注意力内核 2-3x 加速,边缘 Agent 推理瓶颈松动边缘 AI 的真正瓶颈不是模型大小,而是注意力计算复杂度——FlashQLA 从内核层突破。 · 原文
  • Cursor 开放 Agent SDK:从编辑器升级为 Agent 基础设施平台Cursor 正在从 IDE 转型为 Agent 运行时平台——这是编码工具品类的平台化拐点。 · 专题页 · 原文

X AI 趋势速览

AWS 通过 Bedrock 集成扩大与 OpenAI 的合作

**AI 摘要:**2026年4月28日,在AWS的"What's Next"活动上,公司宣布与OpenAI深化合作,以有限预览的方式向客户提供前沿模型、Codex编程代理及Bedrock托管代理。此举紧随OpenAI近期摆脱微软独家合作的转变,将AWS Bedrock打造为关键的多云选项,支持IAM身份验证、加密以及通过CLI或VS Code实现的无缝代码工具集成。AWS CEO Matt Garman等高管对此举表示赞赏,认为这为客户提供了更多选择,助力企业从AI实验快速迈向生产落地。

OpenAI Newsroom (@OpenAINewsroom):Earlier this year, OpenAI and @amazon partnered to bring OpenAI’s frontier capabilities to enterprises, startups, and customers around the world.

We’re taking the next step: making our models, Codex, and Bedrock Managed Agents available to @awscloud customers, in limited preview.

Making OpenAI available on AWS means enterprises can get AI into production faster - across software engineering and other professional workflows.

We’re excited to see what gets built!

https://t.co/04HlMSSOEe

❤️ 858🔄 70💬 33查看趋势

阿里巴巴 FlashQLA 加速设备端 AI 注意力机制

**AI 摘要:**FlashQLA 在 NVIDIA H200 GPU 上针对预填充阶段进行优化,为 Qwen3.5 和 Qwen3.6 模型中的线性注意力方法 GDN 实现了前向传播 2-3 倍加速和反向传播 2 倍提速。它引入了门控驱动并行、硬件调优和 TileLang 内核,将最长 32k token 长序列的延迟大幅降低,并支持单卡上的张量并行运行。开发者对其在本地 AI 智能体方面的潜力给予高度评价,但该方案需要较新的 Hopper GPU;该库采用 MIT 许可证,通过 pip 即可快速安装测试。

Qwen (@Alibaba_Qwen):🚀 Introducing FlashQLA: high-performance linear attention kernels built on TileLang.

⚡ 2–3× forward speedup. 2× backward speedup. 💻 Purpose-built for agentic AI on your personal devices.

💡Key insights:

  1. Gate-driven automatic intra-card CP.
  2. Hardware-friendly algebraic reformulation.
  3. TileLang fused warp-specialized kernels.

FlashQLA boosts SM utilization via automatic intra-device CP. The gains are especially pronounced for TP setups, small models, and long-context workloads.

Instead of fusing the entire GDN flow into a single kernel, we split it into two kernels optimized for CP and backward efficiency. At large batch sizes this incurs extra memory I/O overhead vs. a fully fused approach, but it delivers better real-world performance on edge devices and long-context workloads.

The backward pass was the hardest part: we built a 16-stage warp-specialized pipeline under extremely tight on-chip memory constraints, ultimately achieving 2×+ kernel-level speedups.

We hope this is useful to the community!🫶🫶 Learn more: 📖 Blog: https://t.co/HF6opiR4yf 💻 Code: https://t.co/G3oaf5L1AZ

❤️ 995🔄 115💬 26查看趋势

动画视频揭秘智齿拔除步骤

**AI 摘要:**这段由 NANA 在周二早些时候转发的 16 秒视频,标注了从麻醉、拔牙到愈合的全过程,期间还闪烁着"智齿真是奇怪"的字样。网友们分享了插管导致喉咙疼痛、术后说话困难,以及对牙医椅挥之不去的恐惧。尽管有人表示术后有所缓解,但大多数人认同这个手术确实带来不小的不适,不适感在第一天达到顶峰,肿胀则会持续 3 到 7 天。

Shels Bella (@ShelsBellaen):Wisdom teeth are weird. 🥹 https://t.co/H22SVRHT97

❤️ 84🔄 8💬 83查看趋势

蚂蚁集团 Ling-2.6-flash 开源快速 104B AI 模型

**AI 摘要:**蚂蚁集团旗下的inclusionAI发布了Ling-2.6-flash,这是一个拥有1040亿参数的混合专家模型,但活跃参数仅74亿,测试中跑出了每秒210个token的速度。它在SWE-bench Verified等基准测试中表现出色,得分61.2%,并支持26.2万token的上下文窗口,非常适合高效的Agent工作流、编程和中英双语任务。该模型以MIT许可证在Hugging Face上开放,在实际应用场景中超越了不少参数规模更大的竞品,vLLM等推理引擎也已快速适配,Demo展示了高速生成网页和小说的能力。

Ant Ling (@AntLingAGI):Ling-2.6-flash is now officially open-sourced! A fast, token-efficient Instruct model built for real-world agent workflows. 104B total parameters · 7.4B active parameters Available in BF16, FP8, and INT4 variants for different deployment needs. Key strengths:

  • Fast generation: 215 tokens/s on Artificial Analysis Output Speed
  • High token efficiency: only 15M tokens on the full AA Intelligence Index evaluation
  • Real task execution: strong performance across coding, document processing, and lightweight agent workflows
  • Improved experience: better Chinese-English switching and smoother compatibility with mainstream coding frameworks

❤️ 436🔄 66💬 30查看趋势

Anthropic 为创意软件推出 Claude 连接器

**AI 摘要:**2026年4月28日,Anthropic 发布了连接器功能,让 Claude AI 能够直接与 Blender、Adobe 创意云应用、Ableton 和 Autodesk Fusion 等工具协作。用户只需用自然语言向 Claude 描述需求,即可在几秒内完成材质分配、素材生成、场景调试或 3D 建模等任务。创作者们对这一效率提升赞不绝口,有人称其为颠覆性变革;但也有观点指出,一些简单演示不过是快捷操作的翻版,并对专业人士的就业前景表达了担忧。

Claude (@claudeai):Claude now connects to the tools creative professionals already use.

With the new Blender connector, you can debug a scene, build new tools, or batch-apply changes across every object, directly from Claude. https://t.co/Kc3cBHTNpV

❤️ 30834🔄 2635💬 1168查看趋势

详细内容

Gemini 内嵌 Office 全家桶:Google 正在用「对话即交付」重定义生产力入口

Sundar Pichai (@sundarpichai)

Google 把文档生成从「工具」变成「对话的副作用」,这是平台级生产力入口的重新定义。

  • Gemini 现在可以直接在对话中生成 Docs、Sheets、Slides、PDFs 并下载,无需复制粘贴或格式转换
  • 全球所有 Gemini 用户可用,意味着 Google 正将 AI 对话界面升级为 Office 的替代入口
  • 这不是功能更新,而是 Google 对「AI 工具应该长什么样」的回答:对话即产出

锐评:Google 终于找到了 Gemini 的差异化打法——不跟模型能力卷,而是把自家 Office 生态变成 AI 的原生输出格式。微软的 Copilot 还在「辅助」,Google 直接跳到了「替代」。

Musk vs OpenAI 庭审交锋:亿万富翁拒绝被律师「格式化」的回答范本

NIK (@ns123abc)

Musk 在交叉质询中反客为主,拒绝 Wachtell Lipton 律师的二元陷阱,展示了对抗性法律话术的标准拆解方式。

  • Wachtell Lipton 的 Savitt 试图用「是或否」框架压缩复杂问题,Musk 直接揭露问题本身的误导性前提
  • 这场庭审的核心是 OpenAI 从非营利转营利的合法性,Musk 的证词风格暗示他准备打「公众舆论战」而非纯法律战
  • 对 AI 治理的意义:非营利转营利的治理漏洞正在被司法系统逐条审视

gakki 锐评:Musk 深谙「拒绝回答本身就是回答」的传播策略——这场庭审的真正战场不在法庭,在推特。

Cursor 开放 Agent SDK:从编辑器升级为 Agent 基础设施平台

Cursor (@cursor_ai)

Cursor 正在从 IDE 转型为 Agent 运行时平台——这是编码工具品类的平台化拐点。

  • SDK 将 Cursor 内部的 harness(代码索引、语义搜索、MCP 工具接入、.cursor/skills/ 技能加载、子 agent 拆分能力)整体开放,开发者 npm install @cursor/sdk 即可调用
  • 支持本地运行和云端沙箱双模式,云端 agent 拥有独立 VM、克隆仓库、断网续跑能力,完成后可直接开 PR
  • 模型层不锁定,OpenAI / Anthropic / Google 前沿模型一键切换,也可用 Cursor 自研 Composer 2

gakki 锐评:Anthropic 的 Claude Code SDK、OpenAI 的 Codex CLI、现在 Cursor SDK——三大玩家同时把 Agent 运行时开放为平台级 API,「编码工具」这个品类正在坍缩为「Agent 基础设施」。Cursor 的差异化在于它把 harness 和 skills 生态一起打包了,这比单纯开放模型调用有更深的护城河。

Zed 编辑器打破零版本传统:版本号从 0 到 1,编辑器军备赛进入正赛

Zed (@zeddotdev)

Zed 从 0.x 跳到 1.0,意味着它从「实验性项目」正式毕业为「生产级产品」。

  • 千余个版本都在 0.x 徘徊,今天正式进入 1.0——这是对稳定性和承诺的公开宣示
  • 在 Cursor、Windsurf 等 AI 编辑器疯狂迭代的窗口期发布 1.0,Zed 选择了「稳定压倒创新」的差异化路线

锐评:编辑器赛道的竞争维度已经从「AI 能力」扩展到「工程成熟度」。Zed 的 1.0 不是在追 AI 潮流,而是在赌「开发者最终需要的是一个不会崩的编辑器」。

Stripe Agent 市场的 SaaS V2 叙事:为 Agent 构建「可消费」的数字服务正在成为新创业方向

Max Blade (@_MaxBlade)

当 Agent 开始「花钱」,围绕 Agent 消费行为构建的 SaaS 就是下一代创业机会。

  • 核心逻辑:Stripe 创造了一个全新的市场——Agent 作为消费者购买数字服务
  • 当前市场空白,先发者有机会定义品类
  • 本质是 SaaS 2.0:从「卖给人用」到「卖给 Agent 用」

gakki 锐评:叙事很性感,但 Agent 真正需要的「消费」是什么?不是又一个 API wrapper,而是能被 Agent 自主发现、调用、付费的服务单元。Stripe 接了水管,但水还没流起来。

DeepSeek V4 用三分钱修了 Claude Opus 4.7 的 8 个内存泄漏:跨模型调试的性价比叙事正在改写工具选型逻辑

HealthRanger (@HealthRanger)

便宜模型在「确定性修复任务」上的性价比碾压已不是传闻,而是可复现的工程事实。

  • Claude Opus 4.7 写的代码存在 8 个内存泄漏导致崩溃,DeepSeek V4 几分钟内全部定位并修复,成本约三分钱
  • 这验证了「用贵模型写、用便宜模型修」的混合工作流模式,模型分工正在按任务确定性分层
  • 对开发者而言,这动摇了「顶级模型=全能」的迷信,场景适配比模型等级更重要

gakki 锐评:这个案例的真正价值不在于 DeepSeek 便宜,而在于它暴露了一个被忽视的事实——debug 是高度确定性的任务,不需要推理链,需要的是模式匹配和代码理解,这恰好是便宜模型的甜区。

Qwen 发布 FlashQLA:线性注意力内核 2-3x 加速,边缘 Agent 推理瓶颈松动

Qwen (@Alibaba_Qwen)

边缘 AI 的真正瓶颈不是模型大小,而是注意力计算复杂度——FlashQLA 从内核层突破。

  • 基于 TileLang 构建的高性能线性注意力内核,前向 2-3x 加速,反向 2x 加速
  • 三大技术亮点:Gate 驱动的自动卡内 CP、硬件友好代数重排、TileLang 融合 warp 专用内核
  • 明确定位为「个人设备上的 agentic AI」,对 TP 配置、小模型、长上下文场景增益最显著

gakki 锐评:当行业还在卷模型参数量时,Qwen 在卷内核效率。线性注意力 + 端侧优化的组合拳,意味着未来手机上的 Agent 不只是「能跑」,而是「跑得快到可以用」。这是算力民主化的底层基建。

Stripe Treasury 上线:Agent 支付基础设施从「借道加密货币」走向「正统银行账户」

Marc Lou (@marclou)

Stripe Treasury 为 Agent 提供原生银行级资金管理能力,削弱了加密货币作为 Agent 支付唯一通道的叙事。

  • Stripe Treasury 提供银行账户详情、余额转账、信用卡等功能,所有操作基于 Stripe 余额完成
  • 这意味着 AI Agent 可以通过 Stripe 生态获得正规的金融基础设施,无需依赖加密货币通道
  • 对 Agent 经济而言,传统金融基础设施的开放程度正在追赶加密基建的速度

gakki 锐评:Agent 经济的支付层正在分裂成两条路线——加密原生 vs 传统金融原生。Stripe Treasury 的出现意味着 Agent 不一定要走 crypto 才能实现经济自主,这对「Agent 必须上链」的叙事是降维打击。

Cloudflare 正式赋予 Agent「客户身份」:注册账号、订阅付费、部署代码,Agent 经济自主权的关键基建缺口被填补

Cloudflare (@Cloudflare)

Agent 首次获得独立的基础设施客户身份,这是 Agent 经济自主权从概念走向工程落地的标志性一步。

  • Cloudflare 宣布 Agent 可以自主创建账号、发起付费订阅、注册域名并获取 API Token 部署代码,无需人类代持
  • 这意味着 Agent 不再是「借用人身份的脚本」,而是拥有独立账户生命周期的实体
  • 对 Agent 经济生态而言,基础设施层的身份独立是支付独立的前提条件

gakki 锐评:Cloudflare 这步棋的本质是把「Agent 当人看」——当基础设施厂商开始为 Agent 设计原生客户流程时,说明 Agent 经济不再是叙事,而是正在被工程化验证的商业现实。

OpenAI 上架 AWS 打破 Azure 独占:模型分发从「租户绑定」走向「云中立」

OpenAI Newsroom (@OpenAINewsroom)

OpenAI 首次将模型、Codex 和 Bedrock Managed Agents 以有限预览形式开放给 AWS 客户,标志着其分发策略从 Azure 独占转向多云中立。

  • 企业客户可直接在 AWS 侧调用 OpenAI 能力,软件工程和专业工作流场景优先落地
  • 此举等于承认单一云绑定已成增长瓶颈,模型商品化压力倒逼分发侧「去围墙化」
  • AWS 获得顶级模型入驻,与 Anthropic/Google 的 Bedrock 竞争格局骤然加剧

gakki 锐评:OpenAI 终于想明白——模型差异化在收窄,谁的管道更宽谁赢。Azure 独占是历史包袱,不是护城河。

AI 基础设施股持续碾压预期:市场在用真金白银投票「算力 > 应用」

amit (@amitisinvesting)

市场正在结构性地奖励 AI 基础设施层,即使估值倍数已经很高。

  • SOFI、HOOD 等零售概念股遭遇重挫,而 BE、STX、NXP 等 AI 基础设施股持续交出亮眼财报
  • 关键信号:在当前从低点反弹的阶段,市场更倾向于追涨赢家而非抄底输家
  • 「输家」(基本面没问题但股价弱)的传统抄底逻辑正在失效

gakki 锐评:这不是简单的「AI 概念炒作」,而是市场在重新定价「谁在 AI 价值链中拿走了最大的蛋糕」。答案越来越清晰:卖铲子的比挖金子的赚钱——而且差距还在扩大。

Vanta 增长反常识加速:$10M→$300M ARR 复利效应验证合规 SaaS 天花板

Christina Cacioppo (@christinacaci)

合规自动化赛道正在打破「大公司增长必然减速」的常识。

  • Vanta 从 $10M 到 $100M ARR 花了 2 年,$100M 到 $200M 花了 15 个月,$200M 到 $300M 只花了 9 个月
  • 增长率连续四个季度加速——在 B2B SaaS 中极为罕见
  • 「叙事违抗」(Narrative Violation):市场默认 pre-2022 公司增速会放缓,Vanta 用数据反驳

gakki 锐评:Vanta 的加速增长揭示了一个被低估的 AI 商业逻辑:合规不是「锦上添花」,而是企业数字化的刚性瓶颈。当 AI 让创业门槛降低,合规需求反而指数级增长——Vanta 踩中的是 AI 繁荣的「影子需求」。

OpenAI 提示词指南的范式信号:GPT-5.5 在逼你「少写」而不是「多写」

宝玉 (@dotey)

GPT-5.5 的提示词指南不是使用技巧,是 OpenAI 对 Agent 工程范式的官方重新定义。

  • 核心转变:从「保姆式步骤指令」转向「描述结果+约束条件」,模型自行规划路径
  • 官方原话暗示:冗长指令反而缩小搜索空间、让输出死板——这是对整个 Prompt Engineering 产业链的降维否定
  • API 定价 $5/$30 per M tokens,100 万上下文,六周迭代节奏未放缓

gakki 锐评:当模型方亲自下场说「别写那么多了」,还在卖课教 Prompt 模板的博主该紧张了。但「少写」不等于「不写」——边界在于你是否真的理解任务结构,而不是偷懒。

Karpathy 重新定义 Vibe Coding:从「随意编码」到「Agentic Engineering」的认知升级

宝玉 (@dotey)

Vibe Coding 的终局不是「不写代码」,是工程化编排 Agent。

  • Karpathy 最新访谈明确将 Vibe Coding 定义为起点而非终点
  • 真正重要的是 Agentic Engineering——如何系统化地编排、约束、验证 Agent 行为
  • 这与当前社区「Vibe Coding = 不需要工程能力」的误读形成直接对冲

gakki 锐评:当 Vibe Coding 的提出者亲自修正方向,说明行业已经越过了「速度幻觉」阶段。下一步是 Harness Engineering,不是更随意,而是更结构化。

Stripe Managed Payments 上线 195 个市场:Agent 经济基础设施的「水管」正式接通

Stripe (@stripe)

Stripe 不是在做支付产品,是在为 Agent 经济铺设「税务+风控+争议处理」的全托管管道。

  • 195 个市场的商家记录解决方案,覆盖税务、欺诈、争议、客服全链路
  • 对 Agent 场景意味着:任何 Agent 驱动的数字交易都有了现成的合规基础设施
  • 这是从「Agent 能花钱」到「Agent 花钱合法合规」的关键一步

不是加密叙事,是传统支付基础设施对 Agent 经济的正式拥抱。

2026-04-30 科技动态 - 动态