干货! 一键领取超火的 20 个 LLM 中文数据集

AIGC动态1年前 (2023)发布 HyperAI超神经
11 0 0

干货! 一键领取超火的 20 个 LLM 中文数据集

AIGC动态欢迎阅读

原标题:干货! 一键领取超火的 20 个 LLM 中文数据
关键字:数据,中文,问答,华为,标签
文章来源:HyperAI超神经
内容字数:11753字

内容摘要:


HyperAI超神经自 ChatGPT 重磅推出以来,大语言模型 (large language Model, LLM) 以其卓越的学习能力在各个领域引起轰动。大模型的训练和调优离不开优质庞大的数据支撑,精心构建的数据集不仅为大模型提供了充分的燃料,还为大模型在垂直领域的应用和性能提升提供了可能。
本文整理了一些适用于大模型训练调优的热门中文公开数据集(按照首字母 A-Z 顺序排列),以供大家了解和使用。温馨提示:
本文列举的所有数据集,均可在 OpenBayes.com 平台一键 Input 直接在模型训练和部署中使用。
链接直达:
https://openbayes.com/console/public/datasets1Ape210K
中国小学水平数学问题* 发布机构:猿辅导 AI Lab、西北大学
* 相关标签:算术任务、文本生成
* 直接使用:https://hyper.ai/datasets/28445
Ape210K 是一个新的大规模和模板丰富的数学单词问题数据集,包含 210k 个中国小学水平的数学问题。每个问题都包含最佳答案和得出答案所需的方程式。2Belle 数据集


原文链接:干货! 一键领取超火的 20 个 LLM 中文数据集

联系作者

文章来源:HyperAI超神经
作者微信:HyperAI
作者简介:解构技术先进性与普适性,解读更前沿的 AIForScience 案例

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...