YAYI-Ultra – 中科闻歌推出的混合专家模型
YAYI-Ultra 是中科闻歌推出的企业级大语言模型的旗舰产品,具备卓越的多领域专业能力及多模态内容生成能力。该模型可覆盖数学、编程、金融、舆情、中医和安全等多个领域,旨在缓解垂直领域迁移时常见的“跷跷板”现象。
YAYI-Ultra是什么
YAYI-Ultra(雅意)是中科闻歌研发的顶尖企业级大语言模型,拥有强大的跨领域专业能力和多模态内容生成技术。它支持长达128k的输入和更广泛的上下文窗口,具备超过1000万对图文数据的多模态能力。YAYI-Ultra 还支持多轮对话的角色扮演、内容安全风控以及10多个智能插件的调用。
YAYI-Ultra的主要功能
- 多领域专业能力:YAYI-Ultra 采用混合专家模型,能够组合数学、编程、金融、舆情、中医和安全等各领域的专家,从而有效解决稠密模型在垂直领域迁移时的“跷跷板”问题。
- 多模态内容生成:支持图文结合的输出,能够根据用户的提问从知识库提取相关信息,并同时提供对应的视觉内容。
- 超长文输出:支持最长20万字的输入和10万字的超长输出,形成从“输入理解”到“内容创作”的完整长文本能力闭环。
- 数据分析与可视化:准确完成数据分析、计算及图表绘制任务。
- 复杂任务智能规划:增强多工具串行调用场景下的合理性,能够将复杂任务拆解为多个子任务,通过调动搜索引擎、代码解释器、图像解析等基础工具,以及新闻热榜追踪、传播影响力分析等垂直领域工具来完成任务。
- 联网智能创作:支持通过网络收集信息进行创作,例如撰写一篇关于中国儒家文化发展历史的分析报告。
YAYI-Ultra的技术原理
- 混合专家架构:YAYI-Ultra 采用混合专家模型架构,支持多种领域专家的组合,为不同领域提供高精度、低能耗的智能化解决方案,有效缓解稠密模型在垂直领域迁移过程中存在的问题。
- 指令微调与数据驱动:基于大规模高质量多语言数据的训练,结合指令微调技术,使YAYI-Ultra在不同领域和任务上表现卓越。
YAYI-Ultra的评测表现
在OpenCompass大模型公开学术榜单中,YAYI-Ultra以64.5分首次跻身前十,成为TOP10中五个中国大模型之一。具体表现如下:
- 代码生成:在LiveCodeBench中排名第五,表现优于GPT-4o-20241120版本。
- 复杂指令理解:在IFEval中排名第九。
- 知识推理能力:在MMLU-Pro中排名第九。
YAYI-Ultra的项目地址
- Github仓库:https://github.com/wenge-research/YAYI2
- HuggingFace模型库:https://huggingface.co/wenge-research
YAYI-Ultra的应用场景
- 媒体领域:帮助客户将内容创作时间缩短30%-50%,提升内容发布频率20%-40%,将内容差错率从5%降低至0.5%左右。
- 医疗领域:基于YAYI的大医金匮中医模型,能够精准诊断500余种常见病症,辨证推理准确率高达90%。并已推出面向终端用户的“大医金匮”中医健康管理APP。
- 财税领域:基于YAYI的财税知识模型,模型回答准确率达到90.1%,高于同类模型,助力客户实现24小时不间断的咨询服务。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...