《Python 机器学习》作者新作:从头开始构建大型语言模型,代码已开源

AIGC动态5个月前发布 机器之心
13 0 0

《Python 机器学习》作者新作:从头开始构建大型语言模型,代码已开源

AIGC动态欢迎阅读

原标题:《Python 机器学习》作者新作:从头开始构建大型语言模型,代码已开源
关键字:机器,指令,模型,新书,人工智能
文章来源:机器之心
内容字数:0字

内容摘要:


机器之心报道
机器之心编辑部自 ChatGPT 发布以来,大型语言模型(LLM)已经成为推动人工智能发展的关键技术。
近期,机器学习和 AI 研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又写了一本新书 ——《Build a Large Language Model (From Scratch)》,旨在讲解从头开始构建大型语言模型的整个过程,包括如何创建、训练和调整大型语言模型。最近,Sebastian Raschka 在 GitHub 上开源了这本新书对应的代码库。项目地址:https://github.com/rasbt/LLMs-from-scratch/tree/main?tab=readme-ov-file
对 LLM 来说,指令微调能够有效提升模型性能,因此各种指令微调方法陆续被提出。Sebastian Raschka 发推重点介绍了项目中关于指令微调的部分,其中讲解了:
如何将数据格式化为 1100 指令 – 响应对;
如何应用 prompt-style 模板;
如何使用掩码。《Build a Large Language Model


原文链接:《Python 机器学习》作者新作:从头开始构建大型语言模型,代码已开源

联系作者

文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...