2026-05-26 科技动态

今日要点

HTML+实拍图小红书排版 Skill：绕过 AI 内容标识的新路径
宝玉：模型公司做Harness是白干，垂直工作流重构才是真正价值洼地
归藏预告PPT Skill：自动生成微信公众号+小红书封面和3:4图文组
向阳乔木：Youmind + GPT-image-2 提示词调试心得——AI味小了，适配 Agent 产品
Codex 驱动的图文生成 Skill：AI 自动识别图片内容并匹配版位

专题追踪更新

AI能完成80%工作，但最消耗精力的20%才是真正的20%：[AI处理能力与人类执行精力的非对称分布被明确感知] · 原文
宝玉：模型公司做Harness是白干，垂直工作流重构才是真正价值洼地：模型层终将commoditize，护城河在别处。 · 原文
xAI 正式入局 AI Coding 工具战：Grok Build 开放测试，对标 Claude Code/Codex：【一句话核心判断】 · 专题页 · 原文
AI开发流水线已形成闭环：需求/开发/测试/上线全链路无人化：**【AI正在成为AI的唯一用户】 · 专题页 · 原文
AI消灭了首版成本，却放大了软件工程的「后百版」复杂度诅咒：**【首版即商品化，后百版才是护城河】 · 原文

详细内容

HTML+实拍图小红书排版 Skill：绕过 AI 内容标识的新路径

歸藏(guizang.ai) (@op7418)

藏师傅发布小红书图文排版 Skill，完全使用 HTML 和实拍图片，不触发 AI 内容标注。AI 帮用户从高质量图片网站匹配主题图片，解决纯文字笔记的视觉单薄问题。

信息增量： 揭示了一个实际痛点：平台对 AI 内容的强制标识正在反向塑造内容生产者的技术选型——用 HTML 伪装成「手工排版」来规避检测。

影响： AI 内容标识政策的效果可能适得其反，反而推动了更复杂的内容伪装技术。

gakki：这是一个「猫鼠游戏」的信号——平台越标识，创作者越伪装，最终是技术成本的浪费而非内容质量的提升。

查看原文❤️ 219 · 🔄 18 · 💬 43

宝玉：模型公司做Harness是白干，垂直工作流重构才是真正价值洼地

宝玉 (@dotey)

模型层终将commoditize，护城河在别处。

宝玉指出基础Agent Harness已无投资价值——模型公司自带升级直接抹平中间层工作量。真正的机会是垂直领域：AI Native工作流重新设计、Human In Loop的UX交互重构、垂直高质量数据整理。这些是模型公司不愿意干、也干不了的事。

价值正在从「连接层」向「领域层」迁移。

查看原文❤️ 122 · 🔄 11 · 💬 28

归藏预告PPT Skill：自动生成微信公众号+小红书封面和3:4图文组

歸藏(guizang.ai) (@op7418)

内容生产线的自动化密度在快速提升。

归藏揭示PPT Skill的下一能力：输入文档自动生成微信公众号封面、小红书封面、小绿书图文以及小红书3:4组图。系统会自动处理截图素材并智能匹配。这意味着一个人+AI的内容生产线正在从「提示词调试」进化到「端到端交付」。

查看原文❤️ 110 · 🔄 5 · 💬 42

向阳乔木：Youmind + GPT-image-2 提示词调试心得——AI味小了，适配 Agent 产品

向阳乔木 (@vista8)

【一句话核心判断】

PPT 设计提示词正在形成独立的"AI 原生美学"范式——核心发现是给 AI 更多推理发挥空间，反而减少"AI 味"。

信息增量：

AI 味变小 = 提示词约束减少，模型有更多生成自由度
适配 Agent 产品 = 提示词设计开始区分"给人看"和"给 AI 执行"两个场景
Youmind 平台实战验证，非纯理论

边界：

偏向工具使用技巧，非行业判断
具体提示词在评论区，需跳转查看

gakki 锐评：这条信息量有限，但"给 AI 留推理空间"是一个反直觉但值得验证的假设——约束越少反而越自然，这暗示当前 AI 生成质量问题可能更多来自过度提示，而非模型能力不足。

查看原文❤️ 61 · 🔄 4 · 💬 20

Codex 驱动的图文生成 Skill：AI 自动识别图片内容并匹配版位

歸藏(guizang.ai) (@op7418)

藏师傅展示小红书组图生成器 Skill 配合 Codex 使用的效果：上传一张拼接图，AI 自动识别每张子图内容，匹配对应页数位置，并在下方格子标注，内容完全对齐。

信息增量： 展示了 Skill + Codex 的实际协作能力——不是简单的「上传图片生成文案」，而是跨模态的内容理解和版位编排自动化。

影响： 内容生产流水线的半自动化已到可用水准，降低了小红书创作者的排版门槛。

gakki：图文的「感知-理解-排版」闭环正在形成，但同质化内容泛滥的问题可能会更严重。

查看原文❤️ 47 · 🔄 7 · 💬 13

baoyu-infographic Skill在Hermes Agent落地：SKILL.md正在从概念到生产验证

宝玉 (@dotey)

**【Skill作为AI工作流原子单元的生产级验证】

宝玉演示了Hermes Agent内置的baoyu-infographic Skill生成信息图的效果。这是SKILL.md规范在真实多Agent协作场景中的实际落地。

相比单纯的skill定义文档，这说明Skills生态正在从「编写规范」进化到「生产验证」阶段——可组合性、跨Agent调用、标准化接口开始接受真实场景检验。

gakki：这是内部工具演示，信息来源单一，实际效果需要独立验证。但SKILL.md作为行业标准的趋势正在从倡导期进入落地期。

查看原文❤️ 44 · 🔄 4 · 💬 12

Agent应用与传统App的本质差异：人在操作App vs Agent自主操作App

宝玉 (@dotey)

Agent 应用和传统 App+AI 的核心差别在于执行主体。传统模式是人操作 App、AI 辅助；Agent 模式是人指挥 Agent 去操作 App/CLI，Agent 自主完成。以微软早期 Copilot 为例，只能问答无法操作 PPT；而现在的 Codex 可以直接生成或修改 Slides，全程无需人手动操作 PowerPoint。

信息增量： 这条清晰划分了「AI 辅助工具」与「AI Agent 应用」的范式边界——前者是人机协作，后者是委托代理。

影响： 对产品设计和估值逻辑有直接影响。能自主操作的 Agent 应用替代的是「操作层」而非「决策层」，这意味着工具类 SaaS 的护城河比想象中更快被侵蚀。

gakki：宝玉的框架很清晰，但这个判断的边界在于——它描述的是当前 Agent 的能力上限，而非 Agent 的能力边界。随着 Agent 记忆和工具调用稳定性的提升，「指挥」与「操作」的摩擦会持续降低。

查看原文❤️ 33 · 🔄 5 · 💬 18

教宗《伟大人性》通谕：效率霸权时代，一张人脸仍是历史中心

Michael Anti (@mranti)

[ 宗教领袖 4.4 万词 AI 论纲，被芝加哥学派研读 ]

教宗良十四世发布《伟大人性》通谕，以「人是按神的样子所造」为中间逻辑，论证 AI 时代信仰的关键是「保持伟大人性」，明确反对超人类主义。核心金句：「即使机器在效率上超越一切，一张渴望被注视的人脸仍然是我们历史的中心。」通谕迅速被各大科技公司和 AI 研究者研读，Michael Anti 评价「好像在读芝加哥大学博士论文」。

gakki：宗教叙事为技术焦虑提供了最古老的庇护所——但当梵蒂冈通谕需要被 AI 研究者「研读」时，它本质上已变成一份哲学合规文件。

查看原文❤️ 26 · 🔄 10 · 💬 7

AI 涨价套路：让销售降价创造就业，羊毛出在猪身上

Orange AI (@oran_ge)

[ AI 订阅涨价的真实剧本：先抬价，再演戏 ]

@9hills 揭露 AI 公司的经典定价剧本——先涨价，再安排销售来「帮你申请折扣」，钱最终流向销售部门，完成了「创造就业」的政府 KPI。至于谁在买单？当然是年度预算没花完的企业 IT 采购。

gakki：这套玩法的本质是「价格歧视的戏剧化」——愿意砍价的才是真目标客户，不砍价的直接贡献利润。订阅经济的精髓不是按需付费，是让付款人产生「我赢」的错误感知。

查看原文❤️ 32 · 🔄 0 · 💬 1

微信群消息按话题跨群聚合：IM正在成为轻量知识管理入口

向阳乔木 (@vista8)

**【聊天记录的结构化需求正在被IM层解决】

向阳乔木展示了一个跨微信群按话题聚合消息的工具，解决了群聊信息的碎片化和回溯难题。这是典型的「用LLM做信息再组织」场景——不是聊天机器人，是聊天数据的语义检索与聚合。

信息增量有限（demo展示），但方向值得注意：IM平台正在从「通讯工具」进化为「个人知识流」的入口，这与Notion AI、RAG的方向殊途同归。

gakki：工具本身有价值，但中文语境下微信数据的可获取性是硬伤——这类工具的规模化取决于平台开放程度。

查看原文❤️ 26 · 🔄 0 · 💬 14

AI消灭了首版成本，却放大了软件工程的「后百版」复杂度诅咒

Orange AI (@oran_ge)

**【首版即商品化，后百版才是护城河】

Orange AI 提出了一个反直觉的软件工程观察：AI让「做出第一版」的门槛趋近于零，但后续100个版本的迭代成本反而递增——越往后越难。

这不是新观点，但结合近期AI编程工具的爆发，这个观察的内涵变了：vibe coding阶段门槛归零，但当产品进入真实用户、长尾场景、企业合规要求时，AI工具的边际效用快速衰减，复杂度重新暴露。

gakki：这条判断的边界在于——它描述的是「AI辅助开发」而非「AI自主开发」。百版难题本质是需求蔓延和上下文积累问题，对AI来说同样存在，只是形态不同。

查看原文❤️ 25 · 🔄 0 · 💬 13

Skill 不装进 Agent.md 等于没装：向阳乔木披露触发率翻倍的实际配置

向阳乔木 (@vista8)

[ Skill 安装率 ≠ 触发率：写入 Agent.md 才是正确打开方式 ]

向阳乔木实测发现，只安装 Skill 还不够——需要把 Skill 写入 Agent.md（相当于配置到系统提示词里），才能在日常开发设计中被优先调用。这套配置能让 Skill 从「备用工具」升级为「第一反应」。

gakki：Agent.md 是 Skill 的「权限边界」——不写进去，Skill 就是游客；写进去，才是正式员工。背后反映的是 Agent 工作流从「工具调用」向「系统级集成」的架构迁移。

查看原文❤️ 21 · 🔄 2 · 💬 4

Youmind上线PPT提示词工具：视觉叙事正成为AI内容生产的下一个量产出口

向阳乔木 (@vista8)

**【提示词即设计工具的时代来了】

向阳乔木发布了一套完整的PPT设计提示词框架，核心主张是「AI自主完成内容理解→结构决策→视觉叙事」，无需用户二次干预。同步支持生成Midjourney图像提示词。

信息增量：这套提示词的设计思路（封面页/内容页/结束页的分类决策模型）比工具本身更有价值——它代表了一种新的内容生产分工：人类定方向，AI做执行，设计决策被参数化。

gakki：提示词工程化的趋势很明显，但这套框架主要面向「有审美判断力的用户」，对纯小白仍存在prompt调用能力的隐性门槛。

查看原文❤️ 18 · 🔄 2 · 💬 1

AI 评论的 prompt 为何总是一样的：「不是而是」和破折号是标配

Orange AI (@oran_ge)

[ AI 评论的模板病：翻译腔正在污染中文互联网 ]

Orange AI 吐槽 AI 生成的评论内容存在固定模板：把原文翻译腔重述、滥用破折号、坚持「不是 X 而是 Y」句式，篇幅冗长却毫无增量。批评指向 AI 输出的同质化和不走心。

gakki：模板化是 LLM RLHF 训练的副作用—— Reward Model 学会的是「看起来专业」，而不是「有观点」。这种评论会在各平台大量繁殖，最终倒逼人类读者进化出识别 AI 腔的本能。

查看原文❤️ 18 · 🔄 0 · 💬 11

CASCADE框架：让LLM Agent在部署后继续学习，用上下文 bandit 平衡探索与利用

机器之心 JIQIZHIXIN (@jiqizhixin)

[ episodic memory 让 LLM Agent 学会「吃一堑长一智」]

吉林大学、伦敦国王学院、UCL 联合提出 CASCADE 框架，核心创新是把经验复用建模为上下文多臂老虎机（contextual bandit），让模型在「复用已知成功经验」和「探索新策略」之间自适应平衡。实验覆盖 16 个任务（医疗诊断、代码生成、具身交互等），证明 episodic memory 能在部署后持续改善决策质量。

这意味着 AI Agent 的学习不再局限于训练期，部署后的真实交互经验成为第二战场。

gakki：上下文 bandit 机制把经验复用从被动存储变成主动策略选择，这是记忆系统从「仓库」升级为「决策参与者」的关键一步——但 episodic memory 的信度问题（如何防止错误经验自我强化）仍是隐患。

查看原文❤️ 15 · 🔄 2 · 💬 1