GLM-Edge系列在部分端侧平台上实现了高速运行
2024中国生成式AI大会(上海站)预告
智猩猩联合主办的2024中国生成式AI大会将于12月5日至6日在上海举行。大会将设有主会场和分会场,主会场将进行大模型峰会和AI Infra峰会,而分会场将围绕端侧生成式AI、AI视频生成和具身智能等主题展开技术研讨。欢迎各界人士报名参与。
GLM-Edge大语言模型系列简介
GLM-Edge是智谱AI近期推出的一系列大语言模型,专为端侧应用场景设计。该系列包括1.5B和4B的语言模型,以及2B和5B的多模态模型,特别适配移动平台和PC等不同计算能力的设备。其在骁龙8 Elite芯片平台上的解码速度表现出色,达到每秒60个token以上。
GLM-Edge的创新与优化
GLM-Edge系列的推出旨在平衡模型性能与实际推理效果。通过与行业伙伴的紧密合作和持续的推理优化,GLM-Edge在多个端侧平台上实现了高速运行。尽管在测试中GLM-Edge的整体表现尚未达到同尺寸模型Qwen的水平,但未来的迭代优化将有潜力提升其性能。
效果与性能测试结果
在文本摘要和信息抽取任务中,GLM-Edge的表现不及Qwen,存在一定的幻觉现象。例如,在文本摘要任务中,GLM-Edge-1.5B的输出结果与原文存在偏差,而Qwen的输出则更为准确。在信息抽取任务中,GLM-Edge未能提取出准确的目标地址,显示出其在特定任务上的局限性。
总结与展望
总体而言,GLM-Edge系列在性能和实用性方面还有提升的空间。尽管目前的表现不如Qwen,但随着后续版本的优化,GLM-Edge有望在端侧生成式AI领域取得更大的进展。高通和Intel平台上的性能测试结果也展示了该系列模型在不同硬件上的适应能力。
欢迎大家关注即将到来的2024中国生成式AI大会,共同探讨生成式AI的未来发展与应用。
联系作者
文章来源:智猩猩GenAI
作者微信:
作者简介:智猩猩旗下公众号之一,深入关注大模型与AI智能体,及时搜罗生成式AI技术产品。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...