一览大模型长文本能力

AIGC动态2年前 (2024)发布算法邦

一览大模型长文本能力

AIGC动态欢迎阅读

原标题：一览大模型长文本能力
关键字：模型,位置,文本,数据,侵权
文章来源：算法邦
内容字数：11828字

内容摘要：

智猩猩和智东西发起主办的2024中国生成式AI大会将于4月18-19日在北京举办。主会场将进行开幕式、大模型专场、AI Infra专场和AIGC应用专场；分会场将进行具身智能技术研讨会、AI智能体技术研讨会和中国智算中心创新论坛。扫名，也可咨询。导读本文是作者BPSk从数据层面、模型层面、评估层面对大模型长文本能力技术点总结以及对业内优秀工作的汇总。
本文只做技术分享，如有侵权，联系删文。前言
如今的大模型被应用在各个场景，其中有些场景则需要模型能够支持处理较长文本的能力(比如8k甚至更长)，其中已经有很多开源或者闭源模型具备该能力比如GPT4、Baichuan2-192K等等。
那关于LLM的长文本能力，目前业界通常都是怎么做的？有哪些技术点或者方向？今天我们就来总结一波，供大家快速全面了解。
当然也有一些关于LLM长文本的综述，感兴趣的小伙伴可以看看，比如：
《Advancing Transformer Architecture in Long-Context Large Language Models: A Comprehensive Survey》
https://arxi

原文链接：一览大模型长文本能力