标签:数据驱动决策

LongReward – 清华、中科院、智谱AI联合推出提升长文本大语言模型性能的方法

LongReward是清华大学、中国科学院、智谱AI联合推出的,基于AI反馈改进长文本大型语言模型(LLMs)性能的方法。LongReward从有用性、逻辑性、忠实性和完整性...
阅读原文
12