中电信AI大模型TeleChat-12B评测：使用3T tokens预训练，已开源！

AIGC动态2年前 (2024)发布算法邦

AIGC动态欢迎阅读

原标题：中电信AI大模型TeleChat-12B评测：使用3T tokens预训练，已开源！
关键字：模型,数据,代码,方面,指令
文章来源：算法邦
内容字数：6572字

内容摘要：

直播预告 | 5月14日晚7点，「智猩猩、AI新青年讲座」第235讲正式开讲，慕尼黑工业大学视觉实验室陈振宇博士将直播讲解《三维室内场景纹理图生成》欢迎扫名~01前言2月份的时候评测过TeleChat-7B大模型，见星辰AI大模型TeleChat-7B评测。最近中电信 AI 科技有限公司针对TeleChat-7B进行了性能升级，并开源了一个更大的模型TeleChat-12B，受邀对这个大模型进行新的评测。本文主要关注TeleChat-7B在做一些文学创作和代码生成方面相比于TeleChat-7B的提升。TeleChat-7B不仅在模型结构上有所微调，而且相比于TeleChat-7B的1.5T Tokens，TeleChat-12B使用了3T Tokens进行预训练，取得了更好的性能结果。下面红框部分是TeleChat-12B相比于TeleChat-7B在通用能力，推理和代码能力，语言理解能力等维度的数据集上的性能提升：
在这里插入图片描述
02TeleChat-12B相比于TeleChat-7B的差异点TeleChat-12B和TeleChat-7B均开源在https://gith

原文链接：中电信AI大模型TeleChat-12B评测：使用3T tokens预训练，已开源！