大模型微调到底有没有技术含量？

AIGC动态2年前 (2024)发布智猩猩AGI

大模型微调到底有没有技术含量？

AIGC动态欢迎阅读

原标题：大模型微调到底有没有技术含量？
关键字：知乎,模型,数据,做法,能力
文章来源：智猩猩AGI
内容字数：0字

内容摘要：

大模型时代最火AI芯片峰会来啦！！9月6-7日，由芯东西联合主办的2024全球AI芯片峰会将在北京举行。峰会设有数据中心AI芯片、智算集群等7大板块。目前，AMD人工智能事业部高级总监王宏强，云天励飞副总裁、芯片业务线总经理李爱军，清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声等25+嘉宾/企业已确认出席并演讲。扫名～今天给大家带来知乎好友@ybq的一篇回答-大模型微调到底有没有技术含量，或者说技术含量到底有多大？
知乎：https://www.zhihu.com/question/599396505/answer/3583853852
老生常谈的一句话吧：有没有技术含量取决于这个工作你怎么做，尤其是 llm 方向，上手门槛相比传统 NLP 变得更低了。
我举一些例子吧，针对大模型微调的几个重要环节，我列举的每一种做法大概率都能完成最终目标，甚至说训出来的模型效果都没什么差别。但对个人能力成长的帮助就大不相同了。
01数据工作做法 1 : 继承实验室或者同事的训练数据，拿到之后也不 check 一下数据质量，直接放进去训。
做法 2 : 下载一个开源数据，构建“system

原文链接：大模型微调到底有没有技术含量？

联系作者

文章来源：智猩猩AGI
作者微信：
作者简介：

阅读原文

# AIGC动态 # 做法 # 数据 # 模型 # 知乎 # 能力

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

大模型微调到底有没有技术含量？

AIGC动态欢迎阅读

内容摘要：

联系作者

无一大模型及格！北大/通研院提出超难基准，专门评估长文本理解生成

AI编码无需人类插手！Claude工程师摔断右手，竟一周狂肝3000行代码

相关文章

暂无评论

大模型微调到底有没有技术含量？

AIGC动态欢迎阅读

内容摘要：

联系作者

无一大模型及格！ 北大/通研院提出超难基准，专门评估长文本理解生成

AI编码无需人类插手！Claude工程师摔断右手，竟一周狂肝3000行代码

相关文章

暂无评论

无一大模型及格！北大/通研院提出超难基准，专门评估长文本理解生成