Turbo S未来将成为腾讯混元系列衍生模型的核心基座~
原标题:腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线
文章来源:AI前线
内容字数:2334字
腾讯混元Turbo S大模型发布:秒回、降本、对标GPT-4
2月27日,腾讯正式发布了其自研的快思考大模型混元Turbo S。该模型在速度、成本和性能上均有显著提升,并对标DeepSeek V3、GPT-4o、Claude 3.5等业界领先模型。
速度提升:秒回体验
与之前的“慢思考”模型不同,混元Turbo S实现了“秒回”,吐字速度提升一倍,首字时延降低44%。这得益于其创新的模型架构。
成本降低:部署门槛更低
通过Hybrid-Mamba-Transformer融合模式,混元Turbo S降低了计算复杂度和缓存占用,大幅降低了训练和推理成本。这是工业界首次成功将Mamba架构无损地应用在超大型MoE模型上,实现了显存与计算效率的双重优化。
性能提升:对标行业领先模型
在多个公开Benchmark上,混元Turbo S在知识、数学、推理等多个领域展现出与DeepSeek V3、GPT-4o、Claude 3.5等领先模型相当的效果。通过长短思维链融合,该模型在保持文科类问题快思考体验的同时,显著提升了理科推理能力。
应用前景:成为腾讯混元系列核心基座
作为旗舰模型,Turbo S将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。基于Turbo S,腾讯已自研了推理模型T1,并计划很快上线其API。
商业化:价格大幅下降
目前,开发者和企业用户可以在腾讯云上通过API调用混元Turbo S,并可享受一周免费试用。其定价也大幅下降,输入价格为0.8元/百万tokens,输出价格为2元/百万tokens。
文章还提及了AI对软件工程师就业的影响,以及3月3日晚将举办的关于AI对工程师就业及核心竞争力再定义的直播讨论。
总而言之,腾讯混元Turbo S的发布标志着国内大模型技术取得了新的突破,其在速度、成本和性能上的提升,将进一步推动大模型的应用和普及。
联系作者
文章来源:AI前线
作者微信:
作者简介:面向AI爱好者、开发者和科学家,提供大模型最新资讯、AI技术分享干货、一线业界实践案例,助你全面拥抱AIGC。