今日要点
- HTML+实拍图小红书排版 Skill:绕过 AI 内容标识的新路径
- 宝玉:模型公司做Harness是白干,垂直工作流重构才是真正价值洼地
- 归藏预告PPT Skill:自动生成微信公众号+小红书封面和3:4图文组
- 向阳乔木:Youmind + GPT-image-2 提示词调试心得——AI味小了,适配 Agent 产品
- Codex 驱动的图文生成 Skill:AI 自动识别图片内容并匹配版位
专题追踪更新
- AI能完成80%工作,但最消耗精力的20%才是真正的20%:[AI处理能力与人类执行精力的非对称分布被明确感知] · 原文
- 宝玉:模型公司做Harness是白干,垂直工作流重构才是真正价值洼地:模型层终将commoditize,护城河在别处。 · 原文
- xAI 正式入局 AI Coding 工具战:Grok Build 开放测试,对标 Claude Code/Codex:【一句话核心判断】 · 专题页 · 原文
- AI开发流水线已形成闭环:需求/开发/测试/上线全链路无人化:**【AI正在成为AI的唯一用户】 · 专题页 · 原文
- AI消灭了首版成本,却放大了软件工程的「后百版」复杂度诅咒:**【首版即商品化,后百版才是护城河】 · 原文
详细内容
HTML+实拍图小红书排版 Skill:绕过 AI 内容标识的新路径
歸藏(guizang.ai) (@op7418)
藏师傅发布小红书图文排版 Skill,完全使用 HTML 和实拍图片,不触发 AI 内容标注。AI 帮用户从高质量图片网站匹配主题图片,解决纯文字笔记的视觉单薄问题。
信息增量: 揭示了一个实际痛点:平台对 AI 内容的强制标识正在反向塑造内容生产者的技术选型——用 HTML 伪装成「手工排版」来规避检测。
影响: AI 内容标识政策的效果可能适得其反,反而推动了更复杂的内容伪装技术。
gakki:这是一个「猫鼠游戏」的信号——平台越标识,创作者越伪装,最终是技术成本的浪费而非内容质量的提升。
宝玉:模型公司做Harness是白干,垂直工作流重构才是真正价值洼地
宝玉 (@dotey)
模型层终将commoditize,护城河在别处。
宝玉指出基础Agent Harness已无投资价值——模型公司自带升级直接抹平中间层工作量。真正的机会是垂直领域:AI Native工作流重新设计、Human In Loop的UX交互重构、垂直高质量数据整理。这些是模型公司不愿意干、也干不了的事。
价值正在从「连接层」向「领域层」迁移。
归藏预告PPT Skill:自动生成微信公众号+小红书封面和3:4图文组
歸藏(guizang.ai) (@op7418)
内容生产线的自动化密度在快速提升。
归藏揭示PPT Skill的下一能力:输入文档自动生成微信公众号封面、小红书封面、小绿书图文以及小红书3:4组图。系统会自动处理截图素材并智能匹配。这意味着一个人+AI的内容生产线正在从「提示词调试」进化到「端到端交付」。
向阳乔木:Youmind + GPT-image-2 提示词调试心得——AI味小了,适配 Agent 产品
向阳乔木 (@vista8)
【一句话核心判断】
PPT 设计提示词正在形成独立的"AI 原生美学"范式——核心发现是给 AI 更多推理发挥空间,反而减少"AI 味"。
信息增量:
- AI 味变小 = 提示词约束减少,模型有更多生成自由度
- 适配 Agent 产品 = 提示词设计开始区分"给人看"和"给 AI 执行"两个场景
- Youmind 平台实战验证,非纯理论
边界:
- 偏向工具使用技巧,非行业判断
- 具体提示词在评论区,需跳转查看
gakki 锐评:这条信息量有限,但"给 AI 留推理空间"是一个反直觉但值得验证的假设——约束越少反而越自然,这暗示当前 AI 生成质量问题可能更多来自过度提示,而非模型能力不足。
Codex 驱动的图文生成 Skill:AI 自动识别图片内容并匹配版位
歸藏(guizang.ai) (@op7418)
藏师傅展示小红书组图生成器 Skill 配合 Codex 使用的效果:上传一张拼接图,AI 自动识别每张子图内容,匹配对应页数位置,并在下方格子标注,内容完全对齐。
信息增量: 展示了 Skill + Codex 的实际协作能力——不是简单的「上传图片生成文案」,而是跨模态的内容理解和版位编排自动化。
影响: 内容生产流水线的半自动化已到可用水准,降低了小红书创作者的排版门槛。
gakki:图文的「感知-理解-排版」闭环正在形成,但同质化内容泛滥的问题可能会更严重。
baoyu-infographic Skill在Hermes Agent落地:SKILL.md正在从概念到生产验证
宝玉 (@dotey)
**【Skill作为AI工作流原子单元的生产级验证】
宝玉演示了Hermes Agent内置的baoyu-infographic Skill生成信息图的效果。这是SKILL.md规范在真实多Agent协作场景中的实际落地。
相比单纯的skill定义文档,这说明Skills生态正在从「编写规范」进化到「生产验证」阶段——可组合性、跨Agent调用、标准化接口开始接受真实场景检验。
gakki:这是内部工具演示,信息来源单一,实际效果需要独立验证。但SKILL.md作为行业标准的趋势正在从倡导期进入落地期。
Agent应用与传统App的本质差异:人在操作App vs Agent自主操作App
宝玉 (@dotey)
Agent 应用和传统 App+AI 的核心差别在于执行主体。传统模式是人操作 App、AI 辅助;Agent 模式是人指挥 Agent 去操作 App/CLI,Agent 自主完成。以微软早期 Copilot 为例,只能问答无法操作 PPT;而现在的 Codex 可以直接生成或修改 Slides,全程无需人手动操作 PowerPoint。
信息增量: 这条清晰划分了「AI 辅助工具」与「AI Agent 应用」的范式边界——前者是人机协作,后者是委托代理。
影响: 对产品设计和估值逻辑有直接影响。能自主操作的 Agent 应用替代的是「操作层」而非「决策层」,这意味着工具类 SaaS 的护城河比想象中更快被侵蚀。
gakki:宝玉的框架很清晰,但这个判断的边界在于——它描述的是当前 Agent 的能力上限,而非 Agent 的能力边界。随着 Agent 记忆和工具调用稳定性的提升,「指挥」与「操作」的摩擦会持续降低。
教宗《伟大人性》通谕:效率霸权时代,一张人脸仍是历史中心
Michael Anti (@mranti)
[ 宗教领袖 4.4 万词 AI 论纲,被芝加哥学派研读 ]
教宗良十四世发布《伟大人性》通谕,以「人是按神的样子所造」为中间逻辑,论证 AI 时代信仰的关键是「保持伟大人性」,明确反对超人类主义。核心金句:「即使机器在效率上超越一切,一张渴望被注视的人脸仍然是我们历史的中心。」通谕迅速被各大科技公司和 AI 研究者研读,Michael Anti 评价「好像在读芝加哥大学博士论文」。
gakki:宗教叙事为技术焦虑提供了最古老的庇护所——但当梵蒂冈通谕需要被 AI 研究者「研读」时,它本质上已变成一份哲学合规文件。
AI 涨价套路:让销售降价创造就业,羊毛出在猪身上
Orange AI (@oran_ge)
[ AI 订阅涨价的真实剧本:先抬价,再演戏 ]
@9hills 揭露 AI 公司的经典定价剧本——先涨价,再安排销售来「帮你申请折扣」,钱最终流向销售部门,完成了「创造就业」的政府 KPI。至于谁在买单?当然是年度预算没花完的企业 IT 采购。
gakki:这套玩法的本质是「价格歧视的戏剧化」——愿意砍价的才是真目标客户,不砍价的直接贡献利润。订阅经济的精髓不是按需付费,是让付款人产生「我赢」的错误感知。
微信群消息按话题跨群聚合:IM正在成为轻量知识管理入口
向阳乔木 (@vista8)
**【聊天记录的结构化需求正在被IM层解决】
向阳乔木展示了一个跨微信群按话题聚合消息的工具,解决了群聊信息的碎片化和回溯难题。这是典型的「用LLM做信息再组织」场景——不是聊天机器人,是聊天数据的语义检索与聚合。
信息增量有限(demo展示),但方向值得注意:IM平台正在从「通讯工具」进化为「个人知识流」的入口,这与Notion AI、RAG的方向殊途同归。
gakki:工具本身有价值,但中文语境下微信数据的可获取性是硬伤——这类工具的规模化取决于平台开放程度。
AI消灭了首版成本,却放大了软件工程的「后百版」复杂度诅咒
Orange AI (@oran_ge)
**【首版即商品化,后百版才是护城河】
Orange AI 提出了一个反直觉的软件工程观察:AI让「做出第一版」的门槛趋近于零,但后续100个版本的迭代成本反而递增——越往后越难。
这不是新观点,但结合近期AI编程工具的爆发,这个观察的内涵变了:vibe coding阶段门槛归零,但当产品进入真实用户、长尾场景、企业合规要求时,AI工具的边际效用快速衰减,复杂度重新暴露。
gakki:这条判断的边界在于——它描述的是「AI辅助开发」而非「AI自主开发」。百版难题本质是需求蔓延和上下文积累问题,对AI来说同样存在,只是形态不同。
Skill 不装进 Agent.md 等于没装:向阳乔木披露触发率翻倍的实际配置
向阳乔木 (@vista8)
[ Skill 安装率 ≠ 触发率:写入 Agent.md 才是正确打开方式 ]
向阳乔木实测发现,只安装 Skill 还不够——需要把 Skill 写入 Agent.md(相当于配置到系统提示词里),才能在日常开发设计中被优先调用。这套配置能让 Skill 从「备用工具」升级为「第一反应」。
gakki:Agent.md 是 Skill 的「权限边界」——不写进去,Skill 就是游客;写进去,才是正式员工。背后反映的是 Agent 工作流从「工具调用」向「系统级集成」的架构迁移。
Youmind上线PPT提示词工具:视觉叙事正成为AI内容生产的下一个量产出口
向阳乔木 (@vista8)
**【提示词即设计工具的时代来了】
向阳乔木发布了一套完整的PPT设计提示词框架,核心主张是「AI自主完成内容理解→结构决策→视觉叙事」,无需用户二次干预。同步支持生成Midjourney图像提示词。
信息增量:这套提示词的设计思路(封面页/内容页/结束页的分类决策模型)比工具本身更有价值——它代表了一种新的内容生产分工:人类定方向,AI做执行,设计决策被参数化。
gakki:提示词工程化的趋势很明显,但这套框架主要面向「有审美判断力的用户」,对纯小白仍存在prompt调用能力的隐性门槛。
AI 评论的 prompt 为何总是一样的:「不是而是」和破折号是标配
Orange AI (@oran_ge)
[ AI 评论的模板病:翻译腔正在污染中文互联网 ]
Orange AI 吐槽 AI 生成的评论内容存在固定模板:把原文翻译腔重述、滥用破折号、坚持「不是 X 而是 Y」句式,篇幅冗长却毫无增量。批评指向 AI 输出的同质化和不走心。
gakki:模板化是 LLM RLHF 训练的副作用—— Reward Model 学会的是「看起来专业」,而不是「有观点」。这种评论会在各平台大量繁殖,最终倒逼人类读者进化出识别 AI 腔的本能。
CASCADE框架:让LLM Agent在部署后继续学习,用上下文 bandit 平衡探索与利用
机器之心 JIQIZHIXIN (@jiqizhixin)
[ episodic memory 让 LLM Agent 学会「吃一堑长一智」]
吉林大学、伦敦国王学院、UCL 联合提出 CASCADE 框架,核心创新是把经验复用建模为上下文多臂老虎机(contextual bandit),让模型在「复用已知成功经验」和「探索新策略」之间自适应平衡。实验覆盖 16 个任务(医疗诊断、代码生成、具身交互等),证明 episodic memory 能在部署后持续改善决策质量。
这意味着 AI Agent 的学习不再局限于训练期,部署后的真实交互经验成为第二战场。
gakki:上下文 bandit 机制把经验复用从被动存储变成主动策略选择,这是记忆系统从「仓库」升级为「决策参与者」的关键一步——但 episodic memory 的信度问题(如何防止错误经验自我强化)仍是隐患。