2024 Meet AI Compiler 北京线下聚会定档!千万级指令微调数据集 InfinityInstruct 开源

2024 Meet AI Compiler 北京线下聚会定档!千万级指令微调数据集 InfinityInstruct 开源

AIGC动态欢迎阅读

原标题:2024 Meet AI Compiler 北京线下聚会定档!千万级指令微调数据集 InfinityInstruct 开源
关键字:解读,数据,报告,模型,图像
文章来源:HyperAI超神经
内容字数:0字

内容摘要:


高质量的指令数据是训练和优化大语言模型不可或缺的资源,是提升模型性能的基石。近日,北京智源人工智能研究院发布了千万级高质量指令微调数据集开源项目 InfinityInstruct ,包括基于开源数据集进行高质量筛选的数据,和通过数据合成方法构造的高质量指令数据。
本次大会开源了首批 300 万条经过模型验证的高质量中英文指令数据集 InfInstruct-3M,现已上线 hyper.ai 官网。大家可以使用该数据集,再结合自有应用数据微调基础模型,即可快速打造高质量专属中英双语对话模型。
6 月 10 日-6 月 14 日,hyper.ai 官网更新速览:
* 优质公共数据集:10 个
*优质教程精选:2 个
* 社区文章精选:4 篇
* 热门百科词条:5 条
* 6-7 月截稿顶会:5 个
访问官网:hyper.ai公共数据集精选1.InfInstruct-3M 启动千万级指令微调数据集
该数据集是由北京智源人工智能研究院推出的,该项目的目标是开发一个包含数百万条指令的数据集,以支持大型语言模型的指令跟踪能力,进而提升模型性能。此版本为 InfinityInstruct-3M 指令数


原文链接:2024 Meet AI Compiler 北京线下聚会定档!千万级指令微调数据集 InfinityInstruct 开源

联系作者

文章来源:HyperAI超神经
作者微信:HyperAI
作者简介:解构技术先进性与普适性,报道更前沿的 AIforScience 案例

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...