标签:决策模型

信息论驱动的决策模型:开启全新预训练范式的统一探索之旅

为离线元强化学习提供统一理论基础和算法设计准则。
阅读原文