AIGC动态欢迎阅读
原标题:30 个优质 NLP 数据集和模型,一键使用 8 个 demo,建议收藏!| 超全大模型资源汇总
关键字:模型,数据,解读,系列,中文
文章来源:大数据文摘
内容字数:8335字
内容摘要:
大数据文摘受权转载自HyperAI超神经
近两年来,大模型的热度持续高涨,并且开始在更广泛的领域进行落地探索。随着行业整体的快速发展,越来越多的开源大模型涌入市场,进一步推动了上层应用的拓展。
对于开发者而言,挑选优质大模型和数据集对其后续的研发、模型微调至关重要。为了方便大家选择并下载适配开发需求的模型与数据集,HyperAI超神经为大家汇总了大模型相关资源:
* 优质公共数据集:15 个
* 优质开源模型:15 个
*优质教程精选:8 个
更多大模型资源,见官网:hyper.ai数据集精选1.seq-monkey 序列猴子开源数据集 1.0
序列猴子数据集是用于训练序列猴子模型的数据集,涉及领域包括:中文通用文本语料、古诗今译语料、文本生成语料。
直接使用:https://my5353.com/seqmon
2.IEPile 大规模信息抽取语料库
IEPile 是由浙江大学研发的大规模、高质量的双语(中英)信息抽取 (IE) 指令微调数据集,涵盖了医学、金融等多个领域。
直接使用:https://my5353.com/30064
3.LongAlign-10K 大模型长上下文对齐数
原文链接:30 个优质 NLP 数据集和模型,一键使用 8 个 demo,建议收藏!| 超全大模型资源汇总
联系作者
文章来源:大数据文摘
作者微信:BigDataDigest
作者简介:普及数据思维,传播数据文化
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...