AIGC动态

连续思维链:颠覆LLM推理的新纪元!

该研究可以通过梯度下降进行端到端的优化,因为连续思维是完全可微的。
阅读原文

NeurIPS 2024 | LLM智能体真能模拟人类行为吗?答案有了

本文为理解LLM与人类之间的对齐开辟了新方向。
阅读原文

数字比你想得更复杂——一文带你了解大模型数字处理能力的方方面面

本文提出了一系列独立于数学问题和常识问题之外的数字理解和处理任务。
阅读原文

揭开ReFT技术的神秘面纱:OpenAI强化微调背后的秘密武器

ReFT技术:一种既简单又高效的方法,旨在增强LLMs在推理领域的泛化能力。
阅读原文

机器人可靠性新纪元:如何将RL与控制技术结合,实现99.9%的完美表现?

真实世界,才是检验机器人 Learning 有效性的终极考场。
阅读原文