标签：长度

2行代码，「三体」一次读完！港中文贾佳亚团队联手MIT发布超长文本扩展技术，打破LLM遗忘魔咒

新智元报道编辑：好困桃子【新智元导读】大模型上下文从此不再受限！港中文贾佳亚团队联手MIT发布了全新超长文本扩展技术LongLoRA，只需2行代码，让LLM看小...

2年前 (2023)

机器之心报道机器之心编辑部无需过多计算资源即可扩展大模型上下文长度。一般来说，大模型预训练时文本长度是固定的，如果想要支持更长文本，就需要对模型进...

2年前 (2023)

克雷西发自凹非寺量子位 | 公众号 QbitAI只要两行代码+11个小时微调，就能把大模型4k的窗口长度提高到32k。规模上，最长可以扩展到10万token，一口气就能读...

2年前 (2023)

上下文长度的增加是 LLM 的一个显著发展趋势。过去一年，几种长上下文语言模型陆续问世，包括 GPT-4（32k上下文）、MosaicML 的 MPT（65k上下文）、Anthropic...

2年前 (2023)

机器之心报道编辑：PandaDeepmind 出新招，ReLU 尽展优势。Transformer 架构已经在现代机器学习领域得到了广泛的应用。注意力是 transformer 的一大核心组件...

2年前 (2023)

Stability AI 是一家专注于开源 AI 模型的创业公司，其旗下的 Stable Diffusion 是如今最好的图片生成AI之一。9月14日，著名开源平台Stability AI在官网发布...

2年前 (2023)

1 2 34