Back

2026-05-10 科技动态

今日要点

  • GPT Images 2生成3D生物结构+Gemini编码:多模态工具链的「组合式创作」新范式
  • Antirez 用几千行 C 代码让 DeepSeek V4 Flash 在 MacBook 上跑 1M 上下文:算力民主化从口号变现实
  • 全球南方拥抱中国开源 AI:技术扩散正在重塑地缘竞争的衡量标准
  • Codex技能累积效应:技能越多,提示越少
  • Ansem观察:Base链在Crypto×AI赛道持续领跑,基础设施先发优势显现

专题追踪更新

  • Claude Code 负责人自曝:前六个月几乎无人用,Opus 4 才是转折点Claude Code 的真正引爆点不是产品本身,而是模型能力的临界突破。 · 专题页 · 原文
  • RouteMoA:轻量路由砍掉多 Agent 协作 90% 成本,MoA 架构迎来工程化拐点多 Agent 协作的成本瓶颈正在被轻量路由策略打破,而不是靠堆更多模型。 · 专题页 · 原文
  • Antirez 用几千行 C 代码让 DeepSeek V4 Flash 在 MacBook 上跑 1M 上下文:算力民主化从口号变现实Redis 创始人用极致系统工程证明:2-bit 非对称量化足以让前沿 MoE 模型在消费级硬件上跑完整 Agent 循环。 · 专题页 · 原文
  • 清华突破 Dijkstra 41年理论最优:最短路径算法的排序屏障被绕过排序屏障被绕过,Dijkstra 不再是天花板。 · 原文
  • Jim Fan宣告VLA时代终结、WAM登场:具身智能从「看懂」转向「物理交互」VLA到WAM的切换,标志具身AI从感知理解进入物理操控的新范式。 · 专题页 · 原文

X AI 趋势速览

动画师仅用数小时打造搞笑AI鸽子穿越短片

**AI 摘要:**电影制作人 Marko Slavnic 使用 RunwayML 的 Seedance 2.0 创作了这段视频,从鸽子图片和角色设定图开始,仅用几小时便完成了简单剪辑。短片讲述了一群表情丰富的鸽子误把掉落的设备当成手机,按下"TIME"按钮后惊讶地变身的故事。AI 爱好者称赞其皮克斯般的魅力和极快的制作速度,而传统动画师则质疑这是否算真正的动画——Slavnic 回应说无论怎么做都会有人批评,他鼓励每个人都去做自己热爱的事。

Marko slavnic (@Markoslavnic):The quality of animation you can create on your own is truly amazing. We really are just limited by our imaginations at this point. Go tell your story!

Made in @runwayml in a few hours and a handful of gens. https://t.co/ksrfXtTQnq

❤️ 3222🔄 272💬 244查看趋势

Anthropic 工程师主张:AI 输出应使用 HTML 而非 Markdown

**AI 摘要:**在5月8日的一篇热门帖子中,Shihipar 解释说,Markdown 在处理较长的 AI 输出(如计划和代码审查)时显得力不从心,难以快速浏览。而 HTML 提供了更丰富的格式——表格、可缩放矢量图、可拖拽看板等——可在浏览器中打开,显著提升信息密度。他分享了20个案例,从带颜色标注的PR审查到交互式演示文稿,迅速引发了 Simon Willison 等开发者的快速尝试,后者制作了一份生动的Python漏洞解析说明。尽管有人指出 HTML 代码冗长、编辑不便,但早期使用者普遍认为它能显著提升人机协作的清晰度。

Thariq (@trq212):Using Claude Code: The Unreasonable Effectiveness of HTML

❤️ 9765🔄 1132💬 638查看趋势

百度发布文心5.1,前沿性能仅需6%成本

**AI 摘要:**该模型源自文心大模型5.0,通过弹性预训练技术在单次训练中动态调整深度、宽度和稀疏度,将总参数量压缩至原来的三分之一,活跃参数减半。它在智能体任务上表现出色,在τ³-bench等基准测试中超越DeepSeek-V4-Pro,在GPQA和MMLU-Pro上得分接近榜首,AIME26数学测试取得99.6分,仅次于Gemini 3.1 Pro。在Arena Search排行榜上,以近1900张选票获得1223分,位列全球第四,领跑所有中国模型。该模型已在文心一言、百度AI Studio和千帆API上线。

Jackson Hinkle 🇺🇸 (@jacksonhinklle):🇨🇳 China quietly wins AI race with open-source models.

Practically free AI models from China are set to become the world standard as the Global South seeks low-cost, dependable solutions, while the West competes on premium benchmarks https://t.co/2c9UQsp2Bp

❤️ 2116🔄 427💬 72查看趋势

Base 在加密货币与 AI 融合创新领域崭露头角

**AI 摘要:**Base 于 2023 年上线,目前总锁仓价值达 130 亿美元,以每笔交易低于一美分的极低手续费和以太坊级别的安全性脱颖而出。Coinbase 的 AgentKit 等工具让自主 AI 代理能够独立进行交易、赚取收益和完成支付,驱动了 Virtuals Protocol 等项目——其 AI 代理社区已创收 400 万美元,完成了 227 万次任务。Jesse Pollak 等建设者和社区成员对蓬勃发展的创新充满热情,包括用于 AI git 提交的 gitlawb 和已上线智能合约的 clawdbotatg,尽管也有人提到了 Bittensor 或 Solana 等竞争对手。

Ansem (@blknoiz06):Base has been pretty consistent with being ahead of the curve on crypto x AI

❤️ 955🔄 64💬 291查看趋势

比特币交易者关注五月收盘寻找熊市信号

**AI 摘要:**Crypto Rover 分享了一张图表,显示在2014、2018和2022等熊市年份中,比特币从未出现过连续三个月收阳的情况。今年1月和2月收跌后,3月和4月转为上涨,5月因此成为焦点——目前价格较2025年末126,000美元的高点仍低37%。一方面有人提醒自2024年4月减半以来已过去约750天,存在周期风险;另一方面,近25亿美元的ETF资金流入以及多项指标显示,熊市或许已接近底部。交易员正关注79,000美元的阻力位,历史规律与新增的机构需求形成博弈。

Crypto Rover (@cryptorover):Bitcoin never had 3 bullish months in a row during bear market.

NEVER.

Be ready for May to close red.

$BTC https://t.co/qcgTKN36Xq

❤️ 1095🔄 101💬 241查看趋势

详细内容

GPT Images 2生成3D生物结构+Gemini编码:多模态工具链的「组合式创作」新范式

Dilum Sanjaya (@DilumSanjaya)

图像生成与代码生成的工具链分离再组合,正在降低专业级可视化门槛。

  • 用GPT Images 2生成3D生物结构的视觉设计,Gemini 3.1 Pro负责交互代码
  • 两个不同模型各司其职,形成「设计+工程」的分工式AI创作流水线
  • 产出的是可交互的科学探索应用,不是静态图片

工具链组合的价值不在于单个模型多强,而在于「谁擅长什么」的判断力。这个案例说明:AI创作的竞争力正在从「用什么模型」转向「怎么编排模型」。

Antirez 用几千行 C 代码让 DeepSeek V4 Flash 在 MacBook 上跑 1M 上下文:算力民主化从口号变现实

阿绎 AYi (@AYi_AInotes)

Redis 创始人用极致系统工程证明:2-bit 非对称量化足以让前沿 MoE 模型在消费级硬件上跑完整 Agent 循环。

  • ds4 是纯 C 实现的推理引擎,仅几千行代码,专为 DeepSeek V4 Flash 设计
  • 核心创新:只对 MoE 中占 90% 体积的专家层做 2-bit 压缩,关键路径保持全精度
  • 实测可在 128GB MacBook Pro 上跑 1M 上下文的 coding agent,YC CEO Garry Tan 亲自转发背书

这不是「量化的胜利」,是「系统工程思维对暴力堆算力的降维打击」。当一个顶级黑客用几千行 C 代码做到大厂烧几十亿的事,算力民主化的叙事才真正从口号变成了现实。但 2-bit 量化在极端推理场景下的鲁棒性仍需更多验证。

全球南方拥抱中国开源 AI:技术扩散正在重塑地缘竞争的衡量标准

Jackson Hinkle 🇺🇸 (@jacksonhinklle)

中国开源模型以「准免费」姿态进入全球市场,benchmark 竞争之外的维度正在成为主战场。

  • 全球南方对低成本、可靠 AI 解决方案的需求正在推动中国开源模型的全球采用
  • 西方在 premium benchmark 上竞争,中国在可及性和成本上竞争
  • 地缘政治视角下的 AI 技术扩散正在改变「谁赢了」的定义

Jackson Hinkle 的叙事框架是政治化的,但底层信号是真实的——开源模型的全球采用率正在成为新的地缘政治指标。不过「quietly wins」过于简化,技术领先和市场采用是两回事。

Codex技能累积效应:技能越多,提示越少

Peter Steinberger 🦞 (@steipete)

技能累积降低提示门槛:Codex的"技能复利"效应

  • Peter Steinberger观察到,给Codex添加的技能越多,需要的提示就越少
  • 这反映了AI工具从"单次交互"向"持续学习"的范式转变
  • 技能生态正在成为Agent生产力的关键杠杆

gakki锐评:技能不是功能,是认知债务的偿还——每多一个技能,用户就少说一句话。

Ansem观察:Base链在Crypto×AI赛道持续领跑,基础设施先发优势显现

Ansem (@blknoiz06)

Base链在Crypto×AI交叉领域的持续投入正在形成基础设施护城河。

  • Base(Coinbase旗下L2)对AI Agent加密金融基础设施的布局被认为「领先曲线」
  • 这种先发优势可能定义Agent经济自主权的底层协议标准

gakki 锐评:链上AI基础设施的竞争本质是「谁先让Agent能花钱」——支付、身份、合约执行,每一层都是新的护城河。Base的持续投入值得关注,但需观察实际Agent活跃度而非叙事。

GPT Images 2 生成图像 + Gemini 3.1 Pro 写代码:3D 交互科学应用的工具组合范式

小互 (@xiaohu)

多模态工具的「混血组合」正在成为内容生产的新默认范式。

  • GPT Images 2 负责视觉生成,Gemini 3.1 Pro 负责代码逻辑,两者组合产出可交互 3D 科学探索应用
  • 不是单一模型的端到端能力,而是各取所长的工具链拼装——这比任何单模型升级都更值得关注
  • 效果「炸裂」的背后是 prompt 工程 + 多模型路由的熟练度在决定产出质量

工具组合能力正在成为新的生产壁垒。能用好 GPT Images 2 + Gemini 的人,和只会用一个模型的人,产出差距会指数级拉开。

Codex 跑久变笨的四招急救法:上下文管理是 Agent 可靠性的隐形基础设施

铁锤人 (@lxfater)

Codex 上下文污染导致性能衰减不是错觉,而是 Agent 工程的系统性问题。

  • 关闭 Process_narration 可省大量输出 token,减少无效信息对上下文的占用
  • 协调者模式:主 agent 只做编排,脏活卸给子 agent 的独立上下文窗口
  • 先列 task list 再动手,避免调试过程污染主上下文;强制代码库清洁不留垃圾
  • 实测每轮可省 40% 上下文消耗

Agent 工程的核心矛盾正在从「能不能做」转向「能不能持续做」。上下文管理不是优化技巧,而是 Agent 可靠性的基础设施层。

玉伯赌一个亿:AI 应用终局是 SaaS,不是 Agent 原生

Frank Wang 玉伯 (@lifesinger)

当所有人都在喊 Agent Native 时,前阿里产品负责人逆向押注 SaaS 复兴。

  • 玉伯公开判断 AI 应用终局是 SaaS,并愿意用"一个小目标"对赌——这不是随口一说,是产品哲学的路线站队
  • 隐含逻辑:SaaS 的结构化数据、权限管理、协作流程等"无聊的基础设施"在 AI 时代依然是刚需,Agent 只是入口层变化
  • 与当前主流的"Agent 替代一切"叙事形成直接对冲

gakki 锐评:玉伯的判断有价值的地方在于——他是少数从"产品结构"而非"技术能力"角度审视 AI 终局的人。SaaS 是否终局可以争论,但他指出的"AI 不会消灭结构化协作需求"这个底层逻辑,值得 Agent 布道者认真对待。

宝玉译文:裁员潮是AI商业价值未兑现的症状,而非终局

宝玉 (@dotey)

AI裁员的本质是「价值发现期」的阵痛,不是技术替代的终局。

  • 翻译内容指向一个核心判断:企业急于用AI降本,但尚未找到真正的商业价值放大路径
  • 裁员是短期财务压力驱动的「伪优化」,真正的AI商业化需要组织重构而非简单人力削减

gakki 锐评:裁员叙事容易沦为情绪出口,但真正值得追踪的是「哪些公司在裁员的同时完成了业务重构」——那才是AI商业价值兑现的信号。

字节全面收缩AI应用层:互联网规模效应在AI产品上失效,现金流才是真相

Frank Wang 玉伯 (@lifesinger)

字节战略收缩是AI创业的分水岭信号。

  • 字节将AI应用层聚焦豆包,硬件押注PICO+AI,原因是按2025年投入速度现金流撑不过2027年
  • 多家ARR过亿美元的AI应用公司默默裁员,百万粉博主Dan Koe的Eden产品也因烧钱太快停止迭代
  • 核心判断:用互联网思维做AI产品是死路,DAU等规模指标会成为有钱公司的绞索

玉伯的观察指向一个被忽视的真相:AI产品没有规模效应,「没钱烧」反而是看清真相的优势。这不是悲观论,是对「尊重经营、尊重时间」的重新校准。

清华突破 Dijkstra 41年理论最优:最短路径算法的排序屏障被绕过

铁锤人 (@lxfater)

排序屏障被绕过,Dijkstra 不再是天花板。

  • 清华团队将 Bellman-Ford 与递归部分排序结合,实现 O(m log^{2/3} n) 复杂度,官方意义超越 Dijkstra
  • 突破点在于「找最短路径不必先排序」的思路转换,绕过了 40 年来被认为不可逾越的数学排序屏障
  • 小图体感无差异,但在网页级、全球物流级大图场景下,差距是结构性的

这是理论计算机科学的真突破,不是 AI 圈的 hype。短期不会改变你的 GPS,但对大规模图优化(社交网络、推荐系统、物流调度)的底层算法选择会产生涟漪效应。

03年创业者线下摆摊部署龙虾+CC,百万营收验证 Agent 部署的「最后一公里」生意

天策 (@Leobai825)

Agent 工具的普及瓶颈不在技术,在于有人帮你装上并教会你用。

  • 天策团队线下摆摊免费部署 OpenClaw 和 Claude Code,通过 API Key 分销实现百万营收——这是 Agent 生态的地推模式
  • 三万人装机规模意味着 Agent 部署服务已出现真实规模化需求,而非纯社区自嗨
  • 全流程公开、鼓励复制的策略本身就是一个信号:Agent 部署正在从"技术活"变成"服务活"

gakki 锐评:这个案例的信息增量不在于"赚了多少钱",而在于它验证了一个被低估的市场缝隙——Agent 部署的"最后一公里"。当技术社区还在讨论 MCP 和 Skills 的架构优劣时,地推团队已经在用最朴素的方式解决"装不上、不会用"的问题。

歸藏发布PPT Skill预览:Agent技能包正在向内容生产全链路扩展

歸藏(guizang.ai) (@op7418)

Agent技能包从代码辅助延伸到内容创作全链路,是工具生态成熟的信号。

  • PPT Skill意味着Agent能力边界从「写代码」扩展到「做演示」,覆盖更多生产力场景
  • 更多主题和内容预览表明技能市集正在从单点工具向「内容生产线」演进

gakki 锐评:PPT生成是典型的「80分够用」场景——不需要完美,只需要比从零开始快10倍。Skill市集的价值不在于某个技能多惊艳,而在于可组合性。

Jim Fan宣告VLA时代终结、WAM登场:具身智能从「看懂」转向「物理交互」

宝玉 (@dotey)

VLA到WAM的切换,标志具身AI从感知理解进入物理操控的新范式。

  • 英伟达Jim Fan宣布VLA(Vision-Language-Action)时代结束,WAM(World Action Model)成为新方向
  • 这意味着机器人不再需要先「看懂再行动」,而是直接建模物理世界的因果关系
  • 对整个具身智能产业链的训练范式、数据需求、硬件适配都将产生连锁影响

范式切换往往是泡沫出清的信号。VLA路线过度依赖视觉-语言对齐,WAM直接面向物理因果——方向对了,但落地周期会比叙事更长。

Vibe Coding 的 UX 盲区:搜索最佳实践比瞎指挥 AI 更有效

向阳乔木 (@vista8)

Vibe Coding 的真正瓶颈不是代码生成,而是设计判断力的缺失。

  • 向阳乔木提出实用策略:让 AI 搜索参考最佳实践,而非凭空设计 UX 交互
  • 核心洞察:前人智慧结晶 > 不懂领域里的直觉指挥,这适用于所有非代码维度的 Vibe Coding
  • 暗示了一个更大的问题——Vibe Coding 能写代码,但 UX/产品设计的判断力仍需人类输入

Vibe Coding 的边界正在清晰化:代码可以 vibed,但设计决策需要 reference。搜索最佳实践这个 prompt 模式,本质上是用 AI 的检索能力补偿人类的领域知识缺口。