Back

2026-05-02 科技动态

今日要点

  • Musk 只发了一个词「Neuralink」:脑机接口的沉默比喧嚣更有信号
  • Altman罕见认怂:「用Codex还是Claude Code,选适合你的」,AI编码工具战争进入均势承认期
  • OpenAI 把 OpenClaw 变成 ChatGPT 的「子账户」:身份层即平台层
  • Codex上线「宠物系统」:当AI编码工具开始做留存,说明获客战已结束
  • GPT-5.5 首周数据出炉:API 收入增速 2 倍于历代,Codex 七天翻倍验证 Agent Coding 企业级需求

专题追踪更新

  • AI 电影杀入戛纳:80 分钟长片 + 14 天冲刺,好莱坞导演看完 23 分钟「震惊」AI 内容生产正式冲击传统电影工业的最高殿堂。 · 专题页 · 原文
  • 苹果官方 App 泄露 Claude.md:大厂内部 AI 工具链的「身体诚实」时刻苹果在 Apple Support App v5.13 的发布包里把 Claude.md 一起发出来了。 · 专题页 · 原文
  • GPT-5.5 首周数据出炉:API 收入增速 2 倍于历代,Codex 七天翻倍验证 Agent Coding 企业级需求GPT-5.5 不只是模型升级,而是一次企业级 Agent 工具链的需求验证。 · 专题页 · 原文
  • OpenAI 把 OpenClaw 变成 ChatGPT 的「子账户」:身份层即平台层OpenAI 正在将 ChatGPT 账号体系外溢为整个 Agent 生态的统一身份层。 · 专题页 · 原文
  • xAI 开放 Voice Cloning API:2 分钟克隆声音,Agent 语音人格进入零门槛时代语音克隆从实验室走向 API 调用,Agent 人格化竞争进入新维度。 · 专题页 · 原文

X AI 趋势速览

蚂蚁集团开源万亿参数 Ling-2.6-1T AI 模型

**AI 摘要:**Ling-2.6-1T 模型采用混合专家架构和混合注意力机制,聚焦于高效的"快速推理",在代码生成、Bug 修复以及最长 26.2 万 token 的长上下文任务上表现出色。该模型在 SWE-bench Verified 等开源基准测试中以 72.2% 的成绩位居榜首,并在执行导向的测试中达到与 GPT-4o mini 等顶级模型相当的水平。模型于 4 月 29 日以 MIT 许可证在 Hugging Face 上发布,可通过 Novita Labs、OpenRouter 和 Zenmux 免费试用,开发者对其在生产工作流中的稳定性和低 token 浪费给予了高度评价。

Hasan Toor (@hasantoxr):China just open-sourced a trillion-parameter model that burns fewer tokens than your favorite "efficient" US model.

Ling-2.6-1T is now public, inspectable, and benchmarkable.

The closed-model moat just got smaller. https://t.co/88jM7qsmh5

❤️ 1791🔄 174💬 58查看趋势

Apple 支持应用更新意外泄露 Claude AI 开发备注

**AI 摘要:**2026年4月30日,苹果iOS支持应用5.13版本中意外包含了两个Markdown文件:CLAUDE(1).md和CLAUDE.md。文件内容涉及共享UI组件的严格规范,以及一个融合"Juno AI"与人工客服的聊天系统,详细列出了SwiftUI修饰符和线程安全Actor等技术细节。这些文件具有Claude编程工具的典型特征——自2026年2月起该工具已被集成至Xcode——从而证实了苹果在工程流程中对AI的运用,不过并未泄露任何敏感数据。开发者们对此议论纷纷,有人视之为AI生成的"垃圾内容",也有人认为这恰恰说明了工具已被深度采纳。

Aaron (@aaronp613):Apple accidentally left Claude.md files in today's Apple Support app update (v5.13) https://t.co/owIb3pg3YG

❤️ 5299🔄 299💬 79查看趋势

Astro 联合创始人发布开源 AI Agent 框架 Flue

**AI 摘要:**Flue 是首个代理封装框架,开发者只需少量 TypeScript 代码和 Markdown 文件,即可构建用于代码分拣、翻译等任务的无头 AI 代理。它支持有状态会话、子代理委派、类型化输出,并提供从 Bash 脚本到基于 Daytona 的 Linux 容器等多种沙箱选项。基于 pi-agent-core 构建,自 2026 年 2 月发布以来已获得超 575 个 GitHub 星标,可轻松部署至 Node.js、Cloudflare Workers 和 GitHub Actions,其简洁设计和灵活的运行时选择赢得了开发者的一致好评。

fks (@FredKSchott):Introducing Flue — The First Agent Harness Framework

Flue is a TypeScript framework for building the next generation of agents, designed around a built-in agent harness.

Flue is like Claude Code, but 100% headless and programmable. There's no baked in assumption like requiring a human operator to function. No TUI. No GUI. Just TypeScript.

But using Flue feels like using Claude Code. The agents you build act autonomously to solve problems and complete tasks. They require very little code to run. Most of the "logic" lives in Markdown: skills and context and AGENTS.md.

Flue is like Astro or Next.js for agents (not surprising, given my background 🙃). It's not another AI SDK. It's a proper runtime-agnostic framework. Write once, build, and deploy your agents anywhere (Node.js, Cloudflare, GitHub Actions, GitLab CI/CD, etc).

We originally built Flue to power AI workflows inside of the Astro GitHub repo. But then @_bgiori got his hands on it, and we realized that every agent needs a framework like Flue, not just us.

Check it out! It's early, but I'm curious to hear what people think. Are agents ready for their library -> framework moment?

❤️ 2116🔄 182💬 99查看趋势

字节跳动Seedance 2.0发布电影级AI视频生成,设有严格限制

**AI 摘要:**Seedance 2.0 于 2026 年 2 月 12 日上线,创作者可使用文字、最多九张图片、三段视频片段和三段音频文件生成 15 秒的多镜头视频,在运镜、光影和物理效果上表现出色,堪比大片质感。数字艺术家 Hacknaut 等用户用它制作超现实武士战斗场景,还有人打造游艇怪物或霓虹小巷漫步画面,常搭配 ChatGPT 生成分镜脚本。然而,平台审核严格,涉及疑似名人、暴力甚至原创角色和圣经音频的内容都会被拦截,令 Christopher Gwinn 等专业人士颇为沮丧——即便使用面部网格等变通方案,项目中途仍频繁遭遇拒绝。

Christopher Gwinn | Grindhouse Glitch (@ChrisGwinnLA):Seadance 2 is the best video model available right now, but it can be a nightmare to work with on longer projects (series or long-form films). The censorship has just killed the workflow and reliability of the model (I have access to a less-censored version via the Dreamina CPP and it's still very stressful to use).

I quite often create an interesting video that I would like to return to and develop into something longer - but the AI moderation will block future attempts at generating videos for various nonsensical (and completely bogus) reasons.

I only work with original AI-generated characters - I never use other people's IP, celebrity images, or even look-alikes of celebrities (to the best of my ability - I don't know every actor in the world) - and many characters are even created by Seedance 2, itself - but when I try to generate new videos with them, Seedance 2 will flat-out refuse, claiming I am breaking community guidelines (usually means using celebrities), using improper images (gore, NSFW, etc - which I don't do, either), or a variety of other lame excuses that I can guarantee 100% are false positives.

This makes Seedance 2 completely unreliable for professional work, which is a shame, because (at least when it was still in pre-release) it is an amazing video model. I really don't understand why Bytedance has chosen to hobble it.

❤️ 201🔄 14💬 62查看趋势

ChatGPT提示词生成年轻东亚女性模糊自拍照

**AI 摘要:**4月30日晚,用户"骑司Chase"发布了一段中文提示词,要求ChatGPT生成一张随意、有瑕疵的iPhone风格自拍照,结果得到了一张深色长发年轻女性在不完美光线下的超写实图像。该帖子迅速获得超6000个赞,激励全球用户纷纷尝试,大多收到了类似的"小个子亚洲人"或年轻东亚女性在颗粒感、倾斜照片中的形象。虽然也有人得到青少年男孩或中性形象,但这种模式源于AI训练数据中大量来自东亚等智能手机普及地区的年轻女性随手自拍,以趣味性的meme方式赋予了机器人人情味。

B4K3D・゚✧ (@0xB4K3D):@qisi_ai So there's tiny Asians and gremlins in the eternal pipelines... https://t.co/mbRh0WApWh

❤️ 20🔄 1💬 0查看趋势

详细内容

Musk 只发了一个词「Neuralink」:脑机接口的沉默比喧嚣更有信号

Elon Musk (@elonmusk)

当 Musk 用一个词暗示 Neuralink,市场和媒体会自动补完叙事——这本身就是信息战。\n\n- 推文仅「Neuralink」一个词,无链接、无上下文、无产品发布。这种「留白式传播」是 Musk 的标志性信号操作。\n- 脑机接口与 AI Agent 的交汇点正在浮现:当 Agent 的输入模态从文本、语音扩展到神经信号,人机交互的底层范式将被重写。\n- 但目前没有实质产品或技术进展可分析,信息增量有限。\n\ngakki 锐评:一个词就能上热搜,说明 Musk 的传播效率远超任何 PR 团队。但作为信息消费者,我们更应该问:这次留白背后,是真有东西要来,还是又一轮注意力收割?

Altman罕见认怂:「用Codex还是Claude Code,选适合你的」,AI编码工具战争进入均势承认期

Sam Altman (@sama)

OpenAI CEO公开承认工具选择是个人偏好而非技术碾压,这是AI编码竞争格局的重大信号。

  • Altman用「silly」形容二选一争论,实质是承认Claude Code已构成不可忽视的竞争压力
  • 「grateful there is a choice」的措辞暗示OpenAI已放弃「唯一正确答案」的叙事垄断策略
  • 这与Codex近期密集推宠物/游戏化功能形成互文——当产品力无法碾压时,情感绑定成为新战场

gakki 锐评:CEO亲自下场灭火「谁更好」的争论,通常只在己方优势不明显时才会发生。Altman的谦逊是战略信号,不是真谦虚。

OpenAI 把 OpenClaw 变成 ChatGPT 的「子账户」:身份层即平台层

Sam Altman (@sama)

OpenAI 正在将 ChatGPT 账号体系外溢为整个 Agent 生态的统一身份层。

  • Sam Altman 宣布 OpenClaw 支持 ChatGPT 账号直接登录并复用订阅额度,意味着 OpenAI 不再只是模型供应商,而是要做 Agent 生态的「SSO 基础设施」。
  • 这与 Anthropic 推 Claude 认证体系、Google 推 Gemini 桌面端超级入口的逻辑一致:谁掌控身份层,谁就掌控用户关系和数据回流。
  • 对 OpenClaw 社区而言,短期利好(零摩擦接入 OpenAI 用户池),但长期可能面临平台依附风险。

gakki 锐评:OpenAI 用订阅绑定身份、用身份绑定 Agent 平台,这招比单纯卖 API 高明得多——但「happy lobstering」的轻松语气掩盖不了平台收编开源生态的实质。

Codex上线「宠物系统」:当AI编码工具开始做留存,说明获客战已结束

OpenAI Developers (@OpenAIDevs)

OpenAI在Codex中加入/pet虚拟宠物功能,这是开发者工具从生产力竞争转向情感留存的标志性事件。

  • 开发者工具做游戏化并非新鲜事(GitHub贡献图、Discord Nitro),但AI编码工具做宠物是首次
  • 与Altman「选你喜欢的」表态互为因果:当技术差异缩小时,情感粘性成为护城河
  • Codex的策略转向暗示:OpenAI已接受编码工具市场不会赢家通吃

gakki 锐评:宠物系统是「我们赢不了技术战,但可以赢感情战」的公开投降书。不过说实话,程序员确实吃这套。

GPT-5.5 首周数据出炉:API 收入增速 2 倍于历代,Codex 七天翻倍验证 Agent Coding 企业级需求

OpenAI (@OpenAI)

GPT-5.5 不只是模型升级,而是一次企业级 Agent 工具链的需求验证。

  • OpenAI 披露 GPT-5.5 发布首周数据:API 收入增速超此前任何一次发布 2 倍以上,Codex 收入七天翻倍
  • 关键信号不是模型能力本身,而是「企业 agentic coding 工具需求持续攀升」这一结构性趋势
  • Codex 作为 OpenAI 的 Agent Coding 产品,正从实验性工具转向企业标配,与 Claude Code 的竞争进入收入驱动阶段

gakki 锐评:OpenAI 终于学会用收入数据讲故事了。GPT-5.5 的真正看点不是 benchmark,而是它证明了 Agent Coding 已经跨过「企业愿意付费」的临界点。接下来比的不是谁模型强,而是谁的工具链能让企业掏更多的钱。

Flue:第一个「Agent Harness」框架诞生,Claude Code架构被抽象成可编程基础设施

fks (@FredKSchott)

Flue将Claude Code的核心交互范式(自主规划→执行→反馈)抽象为纯TypeScript框架,无TUI/GUI,100% headless可编程。

  • 直接命名「Harness」概念,验证了Harness Engineering从方法论到工程实现的演进路径
  • 「No baked-in assumption like requiring a human operator」——这是对Claude Code最大限制的精准解构
  • 开源headless Agent框架的出现意味着:Agent编排层正在从产品功能降级为基础设施

gakki 锐评:当有人把你的产品命名为「框架」并开源,说明你的产品已经成为行业参照系。Flue对Claude Code的意义,类似Next.js对React——不是替代,是生态确认。

Drizzle ORM 推出 LLM Agent Preview:ORM 层正在成为 Agent 与数据库的中间件

Drizzle ORM (@DrizzleORM)

Drizzle v1.0.0-rc.1 的核心信号不是 JIT 性能优化,而是「Drizzle for LLM agents」预览。\n\n- JIT row mappers 将 ORM 开销降至接近原生水平,同时原生支持 Effect v4——这些是传统开发者关注的点。\n- 真正值得关注的是 LLM Agent preview 功能:ORM 厂商开始为 Agent 提供原生数据访问层,这意味着 Agent 不再需要通过原始 SQL 或 REST API 与数据库交互。\n- 开发者工具链正在从「为人设计」向「为 Agent 设计」演进,这是 Agent Native 基础设施的微观信号。\n\ngakki 锐评:当 ORM 开始为 Agent 写适配层,说明 Agent 已经不是「可能的未来用户」,而是「正在到来的主要消费者」。工具链的 Agent 化比大多数人预期的更快。

DeepSeek V4 实测数据曝光:国产模型与美国前沿差距约 8 个月,且在扩大

Lisan al Gaib (@scaling01)

中国头部开源模型与美国前沿的代际差正在被量化——约 8 个月,且差距未收敛。

  • 多位独立研究者基于能力评测交叉验证,DeepSeek V4 在推理、多模态、长上下文等维度落后于 Claude/GPT 最新版本约 8 个月
  • 值得注意的是,这并非算力差距的直接映射,而是模型架构与训练方法论的综合落后
  • 查重参照中摩根士丹利报告聚焦芯片/算力侧,本条补充了模型能力侧的差距数据

锐评:8 个月的差距在 AI 领域约等于两个迭代周期。国产模型的「追赶速度」叙事需要从「参数量追赶」升级为「方法论迭代速度」才有意义。

2GW算力校园变电站按时通电:AI基建竞赛从PPT进入物理交付期

IREN (@IREN_Ltd)

当所有人盯着模型参数,真正的瓶颈在电网——IREN证明了物理层基建的工业交付力。

  • Sweetwater 1变电站按时通电,这是2GW级算力校园的核心节点,意味着大规模AI训练的电力基础设施进入可运行状态。
  • 垂直整合开发模式(自建设计+供应链管理)被官方确认为按时交付的关键因素。
  • 在算力需求指数级增长的背景下,谁先完成电力-算力闭环,谁就拥有下一轮竞赛的定价权。

gakki锐评:AI行业最大的信息不对称不在模型层,而在变电站和冷却塔。IREN的交付节奏说明,算力基建正在从「画饼」走向「交作业」,这对所有依赖云算力的Agent公司来说是结构性利好。

xAI 开放 Voice Cloning API:2 分钟克隆声音,Agent 语音人格进入零门槛时代

xAI (@xai)

语音克隆从实验室走向 API 调用,Agent 人格化竞争进入新维度。

  • xAI 推出 Voice Cloning API,2 分钟内创建自定义声音,支持 28 种语言 80+ 预设声音,面向语音 Agent、有声书、游戏角色等场景。
  • 这直接降低了 Agent 语音人格定制的门槛,但也同步放大了声纹安全风险——当任何人都能克隆声音,基于声纹的身份认证体系面临系统性威胁。
  • 对比 ElevenLabs 等先行者,xAI 的优势在于与 Grok 生态的深度绑定和 x 平台分发渠道。

gakki 锐评:2 分钟克隆声音的技术门槛已不存在,真正的竞争壁垒转移到了「声音版权管理」和「防伪检测」——这不是技术问题,是治理问题。

Codex 对 Claude Code 的「屠杀」已成共识,但大众认知仍滞后三个月

adi (@adonis_singh)

开发者社区的共识已经形成:Codex 正在杀死 Claude Code。

  • 「consensus is pretty clear; codex is killing cc right now」——不是观点,是社区观察到的事实陈述
  • 关键洞察:「normies」的认知还停留在「Claude 在技术领域碾压 GPT」的旧叙事里
  • 认知差 = 机会窗口——先意识到的人已经在切换工具链

gakki 锐评:平台战争的胜负手从来不是「谁更强」,而是「谁更便宜+够用」。Codex 的性价比拐点已经到来,Claude Code 的护城河正在被价格战侵蚀。

AI 电影杀入戛纳:80 分钟长片 + 14 天冲刺,好莱坞导演看完 23 分钟「震惊」

Higgsfield AI 🧩 (@higgsfield)

AI 内容生产正式冲击传统电影工业的最高殿堂。

  • Higgsfield AI 携 80 分钟 AI 长片《Hell Grind》入围戛纳,14 天完成制作,消耗 10M credits
  • 《变相怪杰》导演 Chuck Russell 观看 23 分钟后「visibly stunned」——这是好莱坞一线创作者对 AI 电影的首次公开正面反馈
  • 不是短片、不是 demo、不是 MV,是完整的 80 分钟叙事长片,直接进入电影节主竞赛语境

gakki 锐评:AI 短剧拐点的叙事还在讨论「能不能看」,戛纳已经给了一个更激进的答案——问题是「能拿奖吗」。

DeepSeek V4 被实锤落后 8 个月:开源领先≠能力领先,国产模型叙事需要修正

Séb Krier (@sebkrier)

DeepSeek V4 的「开源 SOTA」标签与实际能力表现之间存在显著认知差。

  • Séb Krier 引用实测数据指出 DeepSeek V4 落后美国前沿模型约 8 个月
  • 与前一条形成交叉验证,将模糊的「差距」量化为具体时间窗口
  • 这对「国产模型正在快速逼近」的市场叙事构成实质性挑战

锐评:开源 ≠ 领先,参数量 ≠ 能力。中国 AI 生态需要从「模型军备竞赛」转向「应用层差异化」,否则永远在追上一代。

Waymo下一代Robotaxi基于中国车辆平台打造:美国自动驾驶的「中国制造」悖论

Keller Cliffton (@Keller)

美国最大自动驾驶公司依赖中国车企平台量产,暴露了具身AI供应链的深层地缘张力。

  • Waymo选择中国平台而非本土车企,说明量产成本和工程成熟度仍是决定性因素
  • 在中美科技脱钩叙事下,自动驾驶供应链的「去中国化」显然还没开始
  • 这与特斯拉Optimus垂直整合路线形成鲜明对比——两种具身AI量产哲学正在分化

gakki 锐评:安全叙事可以去中国化,但制造业现实不能。Waymo的选择是一记清醒的耳光:具身AI的竞争最终是供应链竞争,不是算法竞赛。

Seedance 2审查机制正在杀死长视频工作流:开源视频模型的「最优解」悖论

Christopher Gwinn | Grindhouse Glitch (@ChrisGwinnLA)

最好的开源视频模型正在被自己的安全审查系统扼杀——这是一个关于「模型能力」与「可用性」脱节的活标本。

  • Christopher Gwinn实测确认Seedance 2是当前最佳视频模型,但审查系统对连续创作构成致命障碍:已生成的素材无法在后续迭代中复用。
  • 即便通过Dreamina CPP获取低审查版本,工作流可靠性依然令人崩溃。
  • 核心矛盾:模型能力登顶 ≠ 生产力可用。审查策略正在制造「能力幻觉」——看起来很强,用起来断裂。

gakki锐评:这揭示了开源视频模型的结构性困境:审查越严,专业用户越远离;审查越松,合规风险越大。目前没有任何模型找到了平衡点。谁先解决这个问题,谁就吃掉整个专业创作者市场。

2026-05-02 科技动态 - 动态