Back

2026-05-25 科技动态

今日要点

  • Yansu:主动记录工作上下文再主动生成工具,Agent 开始「理解你」而非「等你说话」
  • 湾区AI造富神话的背面:一万人的财富自由与数百万人的「永久底层阶级」
  • Cumora 支持 BYOA:AI Agent 消费化前奏
  • Alma接入了Codex的Appshots:窗口文本全读取能力正在扩散
  • 4秒出百万面模型:3D生成进入「分钟级交付」时代

专题追踪更新

  • 玉伯想用AI Skills重做豆瓣:好产品的本质是让感受流动起来[用新技术重做旧体验,是AI时代最被低估的产品方向] · 原文
  • 宝玉示范/goal任务中途如何用/side实时追问进度:Agent经济的第一道基础设施[人类验收AI干活,中间态透明化是无人值守的最后缺口] · 原文
  • 湾区AI造富神话的背面:一万人的财富自由与数百万人的「永久底层阶级」[AI繁荣的结构性代价:少数人跃迁,多数人被锁定] · 原文

详细内容

Yansu:主动记录工作上下文再主动生成工具,Agent 开始「理解你」而非「等你说话」

yetone (@yetone)

[主动型 Agent 的范式验证:数据主权 + 主动智能双轨并行]

Yansu 今日 ProductHunt 上线,核心逻辑是"被动采集 → 理解 → 主动生成":后台记录截图/操作/声音,沉淀为结构化知识,再主动生成贴合用户工作流的定制工具(项目追踪、spend 监控、会议 action item 提取等),且有虚拟光标可在后台操作 App/填表单/提工单。

关键信息增量:

  • 本地优先 + SOC 2 Type II + ISO 27001,数据不离用户设备,企业级合规门槛已过
  • 虚拟光标"不抢鼠标、不打断你"——这是对现有 Agent "介入式交互"的核心反驳
  • 团队版/企业版已规划,Agent 正在从个人效率工具向组织渗透

对谁有影响: 现有 Agent 工具(OpenClaw、Claude Code 等)的产品设计逻辑需要正视"主动 vs 被动"这道选择题。

gakki锐评:Yansu 的本地优先策略是合规压力下的被迫聪明,但 SOC 2 + ISO 27001 双认证才是真正打开企业市场的钥匙——这不是功能竞争,是信任竞争。

湾区AI造富神话的背面:一万人的财富自由与数百万人的「永久底层阶级」

Orange AI (@oran_ge)

[AI繁荣的结构性代价:少数人跃迁,多数人被锁定]

湾区AI行业过去5年催生了约1万人、财富超2000万美元的超级富裕群体(Anthropic/OpenAI/xAI/Nvidia员工及创始人),但这个群体之外,即使收入不错的从业者,也面临晋升通道实质关闭的困境——「爬一座错误的大楼」。

更值得警惕的是「永久底层阶级」叙事正在年轻人中扩散:中层管理者因缺乏创业资源和人脉而动弹不得,裁员失业者至今找不到新位置,而已经上岸的富人却发现「钱解决不了意义问题」。这不是简单的贫富差距,而是技术加速器下的社会流动通道系统性关闭。

gakki:这场造富运动最大的副产品,是对「努力就有回报」这一美国梦核心叙事的内部瓦解。局中人比局外人更焦虑——这才是AI繁荣真正的社会成本。

Cumora 支持 BYOA:AI Agent 消费化前奏

yetone (@yetone)

[Cumora 开放 BYOA,Agent 入口战进入合纵连横]

yestone 透露 Cumora(推测为 AI Agent 相关产品)已支持 BYOA(Bring Your Own Agent),意味着用户可携带自己的 Agent 接入平台,而非被迫使用平台指定的 Agent。这直接呼应了 Subtopic「No-code Agent 入口」的核心矛盾:平台绑定 vs 用户迁移自由。

\n\ngakki 锐评: BYOA 本质是 Agent 生态的「携号转网」。谁能先解决 Agent 跨平台迁移的资产化问题,谁就能在入口战争中拿到平台级的议价权。

Alma接入了Codex的Appshots:窗口文本全读取能力正在扩散

yetone (@yetone)

[Appshots代表的屏幕语义理解正在成为Agent标配能力]

Appshots 此前被证明能读取 VS Code 窗口内的完整代码文本(不仅仅是截图),现在 Alma 也支持了。这意味着「视觉+语义」双通道的窗口内容提取正在从单一工具扩散为平台级能力。

影响边界:传统 RPA 的像素匹配方案将被语义级 UI 理解全面替代。

gakki:一个被国产团队快速跟进复制的功能,说明这确实是刚需而非伪需求。

4秒出百万面模型:3D生成进入「分钟级交付」时代

小互 (@xiaohu)

[Hyper3D Rodin Gen-2.5 定义3D生成新基准]

Rodin Gen-2.5发布,实现全球首个千万面级3D生成,最快4秒出稿。核心突破:原生3D贴图算法在三维空间直接生成纹理,360°无死角覆盖,PBR材质+光影预处理一键完成,连毛孔级微观细节与衣物缝线纹理均能正确还原。思考模式从极低到极高5档可选,平衡速度与精度。

\n\ngakki 锐评: 3D生成从「能看」到「能用」的临界点已到——但真正的竞争不在生成质量,在工作流集成速度。谁先把4秒变成Unity/Unreal插件的一个按键,谁就吃掉这波红利。

Kimi CLI 重蹈覆辙:历史梗变成 TS 版新坑

宝玉 (@dotey)

[宝玉:kimi-code TypeScript 版是「重写历史」还是「被历史重写」]

宝玉转发当年梗图——「kimicli用python是彻底的失败立刻重构为ts」——对比现在 Kimi 团队真的做了 TypeScript 版本。玩笑背后指向一个严肃命题:AI CLI 工具在中国生态里究竟有没有独立生存空间,还是注定成为大厂的技术试验田后被放弃?

\n\ngakki 锐评: 梗能传开,说明现象够普遍。大厂 CLI 工具的宿命往往是「发布即巅峰,然后慢慢冷却」——这不是技术问题,是商业问题。

玉伯想用AI Skills重做豆瓣:好产品的本质是让感受流动起来

Frank Wang 玉伯 (@lifesinger)

[用新技术重做旧体验,是AI时代最被低估的产品方向]

豆瓣的核心价值——书影音的真实讨论交流——并未过时,过时的是交互形态。玉伯提出用导演/演员 Skills 做影片挖掘、用 AI Skills 让影评「流动起来」,本质是把社区内容的发现和消费方式从搜索变成对话式推荐。

这个判断的边界在于:豆瓣的用户圈层是否能接受 AI 介入评价体系,而不把它变成另一个算法傀儡。

gakki:豆瓣重做这事,资本看不上但创业者惦记,说明需求真实存在。产品形态老旧不是问题,用 AI 把「寻求真实感受」这件事变得更高效且不失真,才是真正的机会。

Orange AI Mole:512GB 小硬盘救星,付费转化验证了磁盘清理的刚需价值

Orange AI (@oran_ge)

[小工具的长尾胜利:512GB 硬盘清理这个「古老需求」被 AI 重新定义]

Orange AI 的 Mole 工具清理了 39GB 空间,用户付费购买,解救 512GB 小硬盘于水火。这是一个看似微不足道但有明确付费验证的产品。

关键信息增量:

  • macOS 清理工具市场长期存在,但 AI 介入后"智能识别无用文件"的体验门槛大幅降低
  • 付费行为本身就是最强产品价值信号——不是用完即走的工具,而是有持续价值的订阅候选

对谁有影响: 开发者/设计师群体(512GB Mac 用户众多)是 AI 原生小工具的理想试验田,Token 消耗低、场景明确、付费意愿强。

gakki锐评:39GB 的数字朴实无华,但"付费了"三个字比任何 Demo 都更有说服力。大模型做大事是幻觉,小模型解决具体小痛点才是真实的商业闭环。

余温实测:公众号、抖音逐字稿均能被提取,官方Skill直链Claude/Codex

余温 (@gkxspace)

[数据获取能力已不是瓶颈,瓶颈是提取后的语义理解层]

余温实测证明:国内平台的完整内容(笔记+原文+配图、逐字稿)均可被抓取,且官方 Skill 已支持直链 Claude/Codex。这意味着数据源壁垒已大幅降低,Agent 获取信息的能力正在趋同。

真正有差异化的不再是「能否拿到数据」,而是拿到之后的理解质量、摘要结构和知识组织方式。

gakki:当数据不再被平台垄断,内容理解力才是新的护城河——这和玉伯说的「AI让感受流动起来」恰好形成供需呼应。

GPT-image2+hyper3D工作流:一张复杂剖面图一次出千万面3D模型

数字生命卡兹克 (@Khazix0918)

[结构图生3D的极限已被商业模型突破]

hyper3D 发布 Gen-2.5,号称全球首个千万级面数3D生成模型。配合 GPT-image2 出复杂结构图再丢进 hyper3D,Extreme-High 档位做雕塑级细节还原,线粒体、细胞核等微观结构与原图高度一致。有嘴就行的门槛意味着3D内容生产正在从专业工具向消费级工作流迁移。

下一步观察:开源社区是否会跟进复现这个面数级别,以及是否存在版权/肖像隐患。

宝玉示范/goal任务中途如何用/side实时追问进度:Agent经济的第一道基础设施

宝玉 (@dotey)

[人类验收AI干活,中间态透明化是无人值守的最后缺口]

Codex /goal 模式让 AI 可以通宵执行长任务,但人类无法实时感知进度。宝玉实测的 /side 指令提供了一个解法:在不影响主会话上下文的情况下开启平行对话,随时询问进度和预计剩余时间。

这解决的不是效率问题,是「信任问题」:当人类无法中断 AI 工作时,需要一个低摩擦的方式确认任务状态。

gakki:/goal 解决的是 AI 能干长活,/side 解决的是人类敢不敢放手让 AI 干长活。两者叠加才是真正的无人值守闭环。

Twitter 正式出手整治"内容搬运工":平台开始系统性打击不标注来源的程序化抄袭

歸藏(guizang.ai) (@op7418)

核心判断:平台从流量分配机制层面封堵内容套利,中文圈依赖翻译搬运的账号将面临系统性洗牌。

归藏透露 Twitter 官方开始主动打击程序化内容搬运——即那种把别人原创内容翻译或改写后发布、但不注明来源的行为。这不是用户体验问题,是平台治理信号:算法正在重新定价"原创"与"搬运"的内容权重。

对内容创作者而言这是利好,对靠信息差生存的账号则是生存威胁。

AI Coding 最缺的不是想法,是执行力

Frank Wang 玉伯 (@lifesinger)

[玉伯:想法通胀,执行力通缩]

AI Coding 工具大爆发后,想法供给严重过剩——任何人都能让 AI 生成代码、生成产品。但能把 AI 生成的半成品打磨成可用产品、验证市场、迭代优化的执行力,成为真正的稀缺品。玉伯点名征集「执行力好的产品」,暗指当前 AI 创业圈的方向焦虑已让位于执行焦虑。

\n\ngakki 锐评: 这个判断比大多数 AI 趋势报告诚实。当 Demo 门槛趋近于零,「能交付」和「能卖出去」之间那道鸿沟,才是真正的护城河。

中文社区转发英文原创死不认账:伤害的是整个生态

歸藏(guizang.ai) (@op7418)

[内容引用规范缺失正在反噬中文AI社区信誉]

歸藏指出中文圈转发英文原创内容普遍不署名,而 X 平台本身鼓励引用+原创并举。这种规范差异会导致优质英文创作者降低对中文受众的投入。实质问题是:中文 AI 社区的信息素养建设落后于内容消费速度。

建议:社区需要类似 ML OSS License 的引用约定,否则劣币驱逐良币会加速。

自蒸馏破解微调速度悖论:港科大×阿里×UCSD联合破解 Diffusion 微调导致推理降速难题

机器之心 JIQIZHIXIN (@jiqizhixin)

核心判断:扩散模型微调"速度与质量不可兼得"的行业痛点被联合团队突破。

研究团队来自港科大、阿里、UCSD 和 CUHK,提出 D-OPSD(On-Policy Self-Distillation)方法,让模型在训练中同时扮演教师和学生角色,从自身输出中学习,从而在保留少步推理速度优势的同时适应新领域。实验表明该方法超越标准微调,在风格/概念学习后仍保持高速推理。

这一突破直接影响 AI 图像生成的工作流:以前需要在微调质量与推理速度之间做取舍,现在可以兼得。对需要定制化风格但又要求实时性的应用场景(电商内容生成、广告创意等)意义重大。