标签:强化学习AGI

万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025

Transformer架构的非递归设计阻碍了跨层的记忆共享,或限制模型泛化能力。
阅读原文