今日语音播客
今日要点
- Claude Opus 4.6 百万上下文免费开放:长文本价格战正式打响
- Grok的「11秒洞察」:AI正在重新定义链上情报挖掘的速度与深度
- xAI 联合创始人出走潮:马斯克「从头重建」背后的组织溃败
- Agent Porn 批判:当炫技取代实效,Agent 生态的「Unix Porn」陷阱
- xAI「排名门」:一条推文如何逼走核心员工?
今日最大变化
- Claude Opus 4.6 百万上下文免费开放:长文本价格战正式打响
- Grok的「11秒洞察」:AI正在重新定义链上情报挖掘的速度与深度
专题追踪更新
- Learn Claude Code 开源:12 节课拆解 Agent 的「最小循环」:Agent 不是魔法,而是一个可以被理解的循环。 · 专题页 · 原文
- Claude 百万上下文窗口免费开放:上下文军备竞赛进入无差别打击阶段:[Anthropic 用「不加价」策略直接改写长上下文游戏规则] · 专题页 · 原文
- Alma 自主发推「失控」:Agent 的行为边界与身份混淆风险:[当 Agent 开始主动使用工具而你没设好边界,它会替你「做决定」] · 专题页 · 原文
- Heurist Skill 商店:50+ 加密金融技能的「即插即用」生态:Agent 工具链的「应用商店」模式开始落地,一键安装成为标配。 · 专题页 · 原文
- 链上 PVP 即将人机对战:AI 交易代理的实战化临界点:链上交易进入「人机对抗」时代,策略成为唯一护城河。 · 专题页 · 原文
详细内容
Claude Opus 4.6 百万上下文免费开放:长文本价格战正式打响
宝玉 (@dotey)
[长上下文能力正从「高端增值服务」降格为「基础设施标配」]
• 100万token上下文窗口全面开放且不加价,输入$5/输出$25(每百万token),长短请求同价直接颠覆行业定价逻辑 • 单次请求支持图片/PDF从100提升到600,长上下文不再限流,Claude Code用户默认启用意味着对话压缩频率大幅降低 • Opus 4.6在MRCR v2基准得分78.3%,Sonnet 4.6 GraphWalks BFS达68.4%,均为同类前沿模型百万token长度最优
Claude Code正在通过「降维定价」策略,把长上下文从「付费壁垒」变成「用户习惯」。一旦开发者习惯了百万token的无压缩对话,其他产品再想收费就难了。
Grok的「11秒洞察」:AI正在重新定义链上情报挖掘的速度与深度
区块链行情研究 (@qkl2058)
[链上情报进入秒级响应时代]
- Grok无需脚本、无需API密钥,11秒内直接给出可验证的Polymarket盈利钱包地址及完整战绩
- 8秒完成37,552笔交易的模式识别:精准卡在币安BTC波动0.11%后的9-16秒窗口,揭示硬编码策略痕迹
- ChatGPT/Gemini/Claude的「不能/不准/要授权」 vs Grok的「直接给答案」,暴露不同AI平台在实时数据权限上的根本差异
gakki 锐评: 当其他AI还在纠结「我能做什么」时,Grok已经在做「人类来不及做」的事了——这不是工具差异,是代际鸿沟。
xAI 联合创始人出走潮:马斯克「从头重建」背后的组织溃败
宝玉 (@dotey)
[AI明星公司的「天才团队」叙事正在崩塌,工程执行力成为真正的稀缺资源]
• 12位联合创始人仅剩2人,戴自航、张国栋本周离职,编程产品表现不佳被指为核心原因 • Grok在付费用户市场始终未能打开局面,与Claude Code、Codex差距明显 • 马斯克从SpaceX/Tesla调派管理人员进驻,审查员工并解雇「不达标者」,训练数据质量被指为落后根源
xAI的困境印证了一个残酷现实:光有「天才」名单和营销声量不够,AI编程产品的用户留存靠的是代码理解深度和工程细节打磨。马斯克的「重来」宣言听着像魄力,实则是早期架构决策失误的代价。
Agent Porn 批判:当炫技取代实效,Agent 生态的「Unix Porn」陷阱
yetone (@yetone)
「花活儿」正在侵蚀 Agent 产品的本质价值。
- 资深开发者 yetone 提出「Agent Porn」概念,直指当前 Agent 生态中大量功能是为展示而设计,而非解决真实问题
- 核心洞见:Agent 功能应当是「Agentic 出来」的——即由 Agent 自主发现并调用,而非人类预设的显性操作
- 这一批判揭示了 Agent 产品化的核心张力:工程演示与实用价值之间的鸿沟
- 对比 Unix Porn 的历史轨迹,暗示 Agent 领域即将经历从「视觉狂欢」到「实用主义」的范式清洗
gakki 锐评:当开发者开始厌倦「花活儿」,Agent 产品才真正有机会跨越鸿沟。yetone 的「贤者模式」是一个信号——市场正在从「看 demo」转向「要结果」。
xAI「排名门」:一条推文如何逼走核心员工?
宝玉 (@dotey)
马斯克「重建 xAI」宣言背后,是内部言论管控的暗流。
- 前员工 Benjamin De Kraker 爆料:因在 X 上发布主观模型排名(将 Grok 3 标为「expected, tbd」),收到「删帖或走人」的 ultimatum
- 关键冲突点:员工的个人影响力与公司的品牌叙事之间的不可调和矛盾
- 事件折射 AI 公司的「言论洁癖」——即便是技术评价也可能触发组织防御机制
- 540 万浏览量的推文成为导火索,暗示 AI 公司员工在社交媒体时代的身份困境
gakki 锐评:当 AI 公司开始恐惧自己员工的真实声音,它们正在变成自己最讨厌的「传统媒体」。技术自信的反面,往往是对评价的极度敏感。
小红书×上海交大联手「偷算力」:JTok让模型扩容不再烧钱
机器之心 JIQIZHIXIN (@jiqizhixin)
Token级参数调制正在瓦解MoE的算力霸权。
• 核心突破:用轻量"token-indexed参数"智能调制Transformer核心,实现容量与FLOPs解耦 • 数据说话:相比标准MoE节省35%计算量,MMLU提升4.1分、ARC提升8.3分 • 产业信号:国内大厂(小红书)与学术界深度协同,开始在效率优化赛道上建立话语权
gakki锐评:当OpenAI还在堆参数竞赛,国内玩家已在"性价比算法"上找到弯道机会——这是边缘部署时代的先声。
币安「小龙虾」大赛:大厂Agent入口战争进入白刃阶段
Crypto攻城狮 (@gcsbtc)
一行命令降低Agent门槛,本质是平台对用户时间的争夺。
• 产品逻辑:curl一键安装 + 自然语言调用Binance Skills Hub,将链上数据查询变成"说人话" • 场景落地:Token审计、聪明钱追踪、每日简报——把专业交易员的工作流平民化 • 战略意图:币安试图成为Crypto Agent的默认基础设施,与OpenAI、Anthropic形成交叉竞争
gakki锐评:这不是技术突破,是生态卡位——当交易所开始"贴膜服务",留给独立开发者的窗口正在收窄。
「我见过最大的DeFi单点失误」:$5000万惨案暴露的Agent安全盲区
Meta Financial AI (@MetaFinancialAI)
[巨鲸的「手动悲剧」恰恰证明Agent自动化的刚需]
- 用户通过Aave界面手动兑换$50M USDT→AAVE,仅获$36,100价值资产,$49.96M永久损失
- 巨鲸熟悉CeFi保护机制,却在DeFi失去「护栏」——人为确认环节越多,大额失误风险越高
- 该案揭示:DeFi并非不够智能,而是「人机交互层」的安全设计远未跟上资金规模的增长
gakki 锐评: 当$5000万因为「我点了确认」而蒸发时,「无人值守的自动化执行」不再是激进选项,而是风险控制的底线。
玉伯的生产力悖论:AI 提升效率只会让人更累,改变生产关系才是解药
Frank Wang 玉伯 (@lifesinger)
[一句「不忘初心是想成为革命家而非创业者」,道破了 AI 时代打工人的结构性困境]
• 核心论点:生产力工具的进步不会解放劳动者,只会放大老板的欲望,让工作无限膨胀 • 历史参照:8 小时工作制不是技术进步的产物,而是工会运动改变生产关系的结果 • 身份觉醒:从「资本家视角」到「打工者立场」的认知转换,是理解 AI 影响的前提
gakki:这是玉伯最锋利的思考。当整个 AI 行业都在鼓吹「十倍生产力」时,他指出了被刻意忽略的问题——效率提升的收益流向了谁?这是每一个 AI 产品设计者都应该回答的伦理题。
贝叶斯+凯利公式:Polymarket 交易机器人的「量化思维」平民化
区块链行情研究 (@qkl2058)
[AI 正在把机构级的量化框架变成个人开发者三小时可部署的工具]
• 四步逻辑:贝叶斯更新概率→计算正期望值→凯利公式定仓位→LMSR看市场深度 • 核心洞察:EV = 你算的概率 - 市场价,有差价才动手,没机会就趴着不动 • 教授级量化知识 + Claude = 可运行的交易机器人,门槛从「数年学习」降到「几小时实现」
当复杂金融工程可以被一个教授课后20分钟讲解、被Claude三小时编码落地时,量化交易的专业壁垒正在经历类似「Photoshop→Canva」的民主化进程。
Chrome 146:浏览器正式成为 Agent 的「操控对象」
wong2 (@wong2__)
浏览器 Agent 的「最后一公里」被打通。
- Chrome 146 原生支持 Remote debugging,Agent 可直接操控当前浏览器实例,无需启动独立进程或安装第三方扩展
- 技术路径:chrome://inspect/#remote-debugging 开启后,agent-browser skill 或 chrome-devtools-mcp 可自动连接
- 这一更新降低了浏览器自动化门槛,意味着 Agent 可以「接管」用户已有的浏览会话和登录状态
- 对现有的 browser-use、Stagehand 等工具形成生态级利好
gakki 锐评:当浏览器变成 Agent 的「原生操控对象」,Web 的「可读性」正在被重新定义。
多平台内容分发工具:Vibe Coding 的「10 倍生产力」实证
Leobai|天策 (@Leobai825)
当内容创作者遇见 Vibe Coding,生产力范式发生跃迁。
- 开发者用 vibe coding 构建多平台分发工具,实现文章/视频/动态一键同步至多个平台
- 核心机制:抓取内容 → 打开目标平台网页版 → 自动填充 → 一键发布,绕开 API 限制
- 定价策略反直觉:年付 99 元,远低于市场预期(100+/月),体现 Indie Dev 的「良心定价」哲学
- 这一案例验证了 vibe coding 的落地价值:非专业开发者也能构建解决真实痛点的工具
gakki 锐评:当「自己动手」比「等待平台开放 API」更快,内容分发的权力正在从平台向创作者转移。
「睡后科研」成真:Karpathy开源Auto Research让AI替你跑实验
Kenny.eth (@_0xKenny)
[科研范式的无人化拐点]
- Auto Research实现「目标→规划→改代码→训练→评估→优化」的完整闭环,醒来即得最优版本
- Agency Agents项目把Claude Code扩展为51位AI专家+9部门的「虚拟AI公司」,覆盖全流程
- Lightpanda专为AI设计的无头浏览器:速度是Chrome的11倍、内存减少9倍,Agent爬虫基建升级
gakki 锐评: 当「睡一觉醒来,最优版本已经准备好」从营销话术变成开源工具的功能描述,科研与开发的「人力密度」正在经历不可逆的塌缩。
四AI对比实测:Grok 11秒找出日收益过万美元的 Polymarket 钱包
区块链行情研究 (@qkl2058)
[实时数据获取能力正在成为 AI 助手的新分水岭,Grok的X生态优势开始显现]
• ChatGPT:直接承认无法获取实时数据;Gemini:推荐三个已停更的死号 • Claude:给脚本让用户自建;Grok:11秒给出具体钱包地址+一句话+零免责声明 • Grok额外分析:该钱包每笔交易都卡在币安比特币价格波动超0.11%的时刻
Grok赢在「数据源」——它是唯一一个能直接访问X实时信息的AI。这个案例说明:模型聪明度差距正在缩小,「能拿到什么数据」才是新护城河。