标签:基于信息论的预训练

NeurIPS Spotlight | 基于信息论,决策模型有了全新预训练范式统一框架

为离线元强化学习提供统一理论基础和算法设计准则。
阅读原文