中电信AI大模型TeleChat-12B评测:使用3T tokens预训练,已开源!

AIGC动态4个月前发布 算法邦
5 0 0

中电信AI大模型TeleChat-12B评测:使用3T tokens预训练,已开源!

AIGC动态欢迎阅读

原标题:中电信AI大模型TeleChat-12B评测:使用3T tokens预训练,已开源!
关键字:模型,数据,代码,方面,指令
文章来源:算法邦
内容字数:6572字

内容摘要:


直播预告 | 5月14日晚7点,「智猩猩、AI新青年讲座」第235讲正式开讲,慕尼黑工业大学视觉实验室陈振宇博士将直播讲解《三维室内场景纹理图生成》欢迎扫码报名~01前言2月份的时候评测过TeleChat-7B大模型,见星辰AI大模型TeleChat-7B评测。最近中电信 AI 科技有限公司针对TeleChat-7B进行了性能升级,并开源了一个更大的模型TeleChat-12B,受邀对这个大模型进行新的评测。本文主要关注TeleChat-7B在做一些文学创作和代码生成方面相比于TeleChat-7B的提升。TeleChat-7B不仅在模型结构上有所微调,而且相比于TeleChat-7B的1.5T Tokens,TeleChat-12B使用了3T Tokens进行预训练,取得了更好的性能结果。下面红框部分是TeleChat-12B相比于TeleChat-7B在通用能力,推理和代码能力,语言理解能力等维度的数据集上的性能提升:
在这里插入图片描述
02TeleChat-12B相比于TeleChat-7B的差异点TeleChat-12B和TeleChat-7B均开源在https://gith


原文链接:中电信AI大模型TeleChat-12B评测:使用3T tokens预训练,已开源!

联系作者

文章来源:算法邦
作者微信:allplusai
作者简介:智猩猩矩阵账号之一,聚焦生成式AI,重点关注模型与应用。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...