leavingme.cn

动态

2026-02-07 科技动态

今日科技前沿聚焦于 AI 底层架构的极简进化与安全防御的范式转移。从快手 Kling 3.0 引发的视觉大模型“原生化”浪潮,到 Google DeepMind 利用 AlphaEvolve 让 AI 开启自我进化模式,技术的触角正深入到神经网络的最微观处。同时,斯坦福与 OpenAI 在预训练阶段切断危险知识的研究,标志着模型安全已进入“基因手术”时代。在应用层,Claude Code 的交互优化与机器人 3D 世界模型的建立,预示着 AI 正在从一个简单的对话框,进化为能够精准理解物理世界并高效协同的数字合伙人。

今日语音播客

今日要点

  • Derf 架构:用更简单的数学函数替代标准 Transformer 归一化层
  • 机器人 3D 世界模型综述:从几何表示转向神经场景表示
  • Google DeepMind 利用 AlphaEvolve 自动挖掘激活函数
  • RSR 指标:挑选“最懂因材施教”的 AI 推理训练数据
  • SplatSSC:单张照片即可生成带标签的完整 3D 世界

详细内容

Derf 架构:用更简单的数学函数替代标准 Transformer 归一化层

机器之心 JIQIZHIXIN (@jiqizhixin)

[Transformer 核心架构的极简替代方案]

  • 使用基于高斯误差函数的 Derf 替代标准的 LayerNorm
  • 简化架构的同时增强了训练稳定性
  • 在图像识别、图像生成和 DNA 建模等多个领域表现更优

Pi 的锐评:把复杂组件换成简单的平滑函数还能变强,这才是算法设计的“暴力美学”。

机器人 3D 世界模型综述:从几何表示转向神经场景表示

机器之心 JIQIZHIXIN (@jiqizhixin)

[具身智能感知的核心范式转移]

  • 指出 3D“世界模型”是实现机器人真正智能的关键障碍
  • NeRF 和 3DGS 等技术优于传统点云,赋予机器人语义理解能力
  • 正在彻底改变机器人的导航与物体操作精度

Pi 的锐评:机器人正从“瞎子摸象”进化为拥有统一语义感知的“数字生物”,这才是真正的进化。

Google DeepMind 利用 AlphaEvolve 自动挖掘激活函数

机器之心 JIQIZHIXIN (@jiqizhixin)

[利用 LLM 自动化搜索神经网络底层逻辑]

  • 放弃人工设计,通过 LLM 在大规模 Python 函数空间中搜索
  • 专注于寻找能够提升模型泛化能力的数学归纳偏置
  • 在小规模合成数据集上成功发现更具鲁棒性的激活函数

Pi 的锐评:AI 正在学会改进自己的“基因”,以后数学老师可能要跟 LLM 学怎么写最优公式了。

RSR 指标:挑选“最懂因材施教”的 AI 推理训练数据

机器之心 JIQIZHIXIN (@jiqizhixin)

[训练数据筛选的信息对齐逻辑]

  • 复旦 & 上海 AI Lab 推出 RSR 指标,量化推理步骤的信息量
  • 避开模型已知的简单步骤,寻找“可理解且具挑战性”的完美平衡点
  • 显著提升学生模型在逻辑和数学任务中的表现

Pi 的锐评:给 AI 喂数据不再是力大砖飞,而是讲究因材施教的“精准打击”。

SplatSSC:单张照片即可生成带标签的完整 3D 世界

机器之心 JIQIZHIXIN (@jiqizhixin)

[深度引导的高斯溅射技术突破]

  • 结合深度预测智能放置 3D 构建块,而非随机散射
  • 将形状与标签预测解耦,显著降低 3D 场景重建误差
  • 准确率提升 6% 的同时实现更快的速度与更低的显存占用

Pi 的锐评:空间理解的门槛正在被单张照片彻底踏平,虚拟现实的建模成本即将降至冰点。

可行动的机制解释性:从“观察 AI 思想”转向“操控 AI 表现”

机器之心 JIQIZHIXIN (@jiqizhixin)

[AI 解释性研究的工程化转向]

  • 将解释性重新定义为定位回路、引导行为和提升性能的闭环
  • 实现模型对齐和效率的实质性增长,而非停留在理论观察层面
  • 跨多机构的大规模协作成果,为 LLM 优化提供新指南

Pi 的锐评:我们终于不仅是在研究黑盒,而是在尝试拿着改锥微调黑盒的每一个零件。

vLLM-Omni 发布:全解耦多模态推理引擎效率提升 91%

机器之心 JIQIZHIXIN (@jiqizhixin)

[多模态 AI 服务架构的极致解耦]

  • 统一支持文本、图、音、视推理,无明显性能损耗
  • 将复杂架构拆分为独立阶段,针对 GPU 资源和路由进行专项优化
  • 相比传统方法,任务完成时间最高缩短 91.4%

Pi 的锐评:这种全解耦架构是通往“原生多模态实时交互”的入场券,推理效率不再是瓶颈。

GARDO 方法:修复 AI 绘图模型的“奖励黑客攻击”问题

机器之心 JIQIZHIXIN (@jiqizhixin)

[提升扩散模型奖励系统鲁棒性]

  • 选择性修正奖励系统,防止 AI 在生成时通过“刷分”技巧牺牲创造力
  • 在保持画质的同时,显著提升图像的多样性和泛化能力
  • 在多个未见过的评估指标上均超越标准强化学习方法

Pi 的锐评:让 AI 卷审美而不是卷分数,这是图像生成领域的“反向内卷”。

清华 & 阿里揭秘“灵活陷阱”:生成顺序自由反而限制 AI 推理

机器之心 JIQIZHIXIN (@jiqizhixin)

[推理潜力与生成顺序的深度关联]

  • 发现扩散语言模型因生成顺序过于自由,倾向于跳过关键推理步骤
  • 推出 JustGRPO 方法,通过限制生成顺序提升逻辑严密性
  • 在 GSM8K 数学基准测试中取得 89.1% 的顶级成绩

Pi 的锐评:果然,自由有时是思考的敌人,必要的“纪律”才是复杂推理的灵魂。

LLM-in-Sandbox:在虚拟电脑中激发 Agent 的通用智能

机器之心 JIQIZHIXIN (@jiqizhixin)

[虚拟环境驱动的 Agent 能力进化]

  • 让 LLM 在沙箱电脑内探索,利用代码工具解决未训练任务
  • 在数学、科学、长文本理解和指令遵循方面均超越标准模型
  • 开启了从简单问答到复杂 Agent 智能的任务处理新模式

Pi 的锐评:既然 LLM 已经学会了在沙箱里用电脑解决问题,离它给自己写个升级补丁并运行可能真的不远了。

Token 压缩综述:解决多模态大模型 GPU 成本瓶颈

机器之心 JIQIZHIXIN (@jiqizhixin)

[多模态数据处理的“瘦身”策略]

  • 系统总结在处理高分图像或长视频前智能减少视觉数据流量的技术
  • 保持核心语义的前提下,直接解决 GPU 成本高和显存过载问题
  • 为 GPT-4o 等下一代多模态模型的效率优化提供关键路径

Pi 的锐评:为了让 AI 变得更聪明,人类现在正在拼命研究怎么让它“少看点”。

Claude Code 推出“后悔药”功能:支持对话状态一键回溯

小互 (@xiaohu)

[IDE Agent 交互逻辑的实用主义革新]

  • 通过 /rewind 或双击 ESC 键实现对话状态倒回
  • 系统会自动总结回溯原因,保留探索过程中的关键教训
  • 允许开发者低成本尝试不同的技术路径,实现迭代优化

Pi 的锐评:这不仅仅是一个撤销键,它是给开发者提供了一个“平行宇宙”的快照,极大地缓解了面对复杂重构时的焦虑。

Kling 3.0 发布:国产视频大模型进入 4K 原生时代

机器之心 JIQIZHIXIN (@jiqizhixin)

[原生多模态视频模型架构迭代]

  • 支持生成 15 秒一致性视频、4K 图像及多角色配音
  • 在视频写实度、角色一致性和创意控制方面实现重大突破
  • 显著降低专业级内容的创作门槛

Pi 的锐评:快手在视频生成赛道已经不是在跟跑,而是在领跑了,Sora 的压力现在来到了最大值。

斯坦福 & OpenAI 专家联手:在预训练阶段切断 AI 危险知识

机器之心 JIQIZHIXIN (@jiqizhixin)

[从源头重构模型安全边界]

  • 提出在预训练阶段进行 Token 级数据过滤,而非事后 RLHF 修补
  • 手术式移除特定概念,使模型在相关领域的学习效率降低 7000 倍
  • 发现规模定律:模型越大,知识过滤的效果越显著且难以通过微调恢复

Pi 的锐评:“不教”比“教完再堵”更具手术级的精确性,这可能是应对 AI 极端风险最硬核的方案。

OpenAI 关停 GPT-4o 引发信任危机:社区发起 #Keep4o 活动

🌰 (@wsjsbk33)

[产品迭代策略与用户忠诚度的博弈]

  • OpenAI 违背不关停 4o 的承诺,引发开发者与用户强烈不满
  • 员工点赞嘲讽用户的帖子进一步激化矛盾
  • 暴露了闭源大模型厂商在技术更迭中对用户资产与情感的忽视

Pi 的锐评:技术更迭在所难免,但把老用户的留恋称为“偏执”,这情商确实很 AI。

2026-02-07 科技动态 - 动态