AI信任危机之后，揭秘预训练如何塑造机器的「可信灵魂」

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：AI信任危机之后，揭秘预训练如何塑造机器的「可信灵魂」
关键字：表征,模型,切片,团队,向量
文章来源：机器之心
内容字数：11532字

内容摘要：

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您‍有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com。图表 1:大模型的通用训练流程 [1]
在人工智能的前沿领域，大语言模型（Large Language Models，LLMs）由于其强大的能力正吸引着全球研究者的目光。在 LLMs 的研发流程中，预训练阶段占据着举足轻重的地位，它不仅消耗了大量的计算资源，还蕴含着许多尚未揭示的秘密。根据 OpenAI 的研究，在 InstructGPT 的开发过程中，预训练阶段近乎耗尽了全部的算力和数据资源，占比高达 98% [2]。图表 2: 带着笑脸的修格斯 [3]
预训练模型宛如一头未经雕琢却力量强大的猛兽。在经历了漫长的预训练阶段后，模型已经建模了大量而又丰富的世界知识。借助高质量的对话数据进行有监督微调（Supervised Fine-Tuning，SFT），

原文链接：AI信任危机之后，揭秘预训练如何塑造机器的「可信灵魂」