标签：窗口

多轮对话推理速度提升46%，开源方案打破LLM多轮对话的长度限制

机器之心发布机器之心编辑部在大型语言模型（LLM）的世界中，处理多轮对话一直是一个挑战。前不久麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM，能够在...

阅读原文

AIGC动态

3年前 (2024)

400万token上下文、推理再加速46%！最新开源方案升级MIT成果，推理成本再降低

明敏发自凹非寺量子位 | 公众号 QbitAI22倍加速还不够，再来提升46%，而且方法直接开源！这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。 Streami...

阅读原文

AIGC动态

3年前 (2024)

四行代码让大模型上下文暴增3倍，羊驼Mistral都适用

克雷西发自凹非寺量子位 | 公众号 QbitAI无需微调，只要四行代码就能让大模型窗口长度暴增，最高可增加3倍！而且是“即插即用”，理论上可以适配任意大模型...

阅读原文

AIGC动态

3年前 (2024)

5000万tokens大海捞针创纪录，百川智能192K超长上文+搜索增强商用难题！解决99%企业定制需求

新智元报道编辑：编辑部【新智元导读】就在昨天，百川智能正式发布Baichuan2-Turbo系列API，192K的超长上下文窗口+搜索增强知识库，解决了困扰行业已久的大...

阅读原文

AIGC动态

3年前 (2023)

大模型+搜索构建完整技术栈，百川智能用搜索增强给企业定制化下了一剂「猛药」

机器之心报道机器之心编辑部用好企业知识库是大模型应用破局的关键。从 ChatGPT 最初发布算起，虽然大模型的热潮已经持续了一年多，但大部分时间依然停留在...

阅读原文

AIGC动态

3年前 (2023)

RAG+GPT-4 Turbo让模型性能飙升！更长上下文不是终局，「大海捞针」实验成本仅4%

新智元报道编辑：桃子【新智元导读】RAG或许就是大模型能力飙升下一个未来。RAG+GPT-4，4%的成本，便可拥有卓越的性能。这是最新的「大海捞针」实验得出的结...

阅读原文

AIGC动态

3年前 (2023)

攻其不备：Anthropic发布Claude 2.1

点击上方蓝字关注我们“ Anthropic发布Claude 2.1，具有巨大的上下文窗口，提供更强大的语言模型和聊天机器人。虽然有一些限制，但相对于前身有显著改进，包括...

阅读原文

AIGC动态

3年前 (2023)

李开复4个多月后“放大招”：对标OpenAI、谷歌，发布“全球最强”开源大模型

整理 | Tina 今天，由李开复打造的 AI 大模型创业公司“零一万物”发布了一系列开源大模型：Yi-34B 和 Yi-6B。Yi-34B 是一个双语（英语和中文）基础模型，经过 ...

阅读原文

AIGC动态

3年前 (2023)

李开复官宣「全球最强」开源大模型：一次处理40万汉字、中英均霸榜

机器之心报道机器之心编辑部李开复表示，「零一万物要跻身全球大模型第一梯队。」开源大模型宇宙又有了新的重量级成员，这次是创新工场董事长兼 CE0 李开复大...

阅读原文

AIGC动态

3年前 (2023)

全球最强长文本大模型，一次可读35万汉字：Baichuan2-192K上线

机器之心原创作者：泽南、张倩大模型看书，从来没有这么快过。国内大模型创业公司，正在技术前沿创造新的记录。10 月 30 日，百川智能正式发布 Baichuan2-192...

阅读原文

AIGC动态

3年前 (2023)

百川智能发布Baichuan2-192K大模型，目前全球最长上下文窗口

文章转自新智元，Founder Park 有所删减10 月 30 日，百川智能发布 Baichuan2-192K 大模型。其上下文窗口长度高达 192K，是目前全球最长的上下文窗口。文本长...

阅读原文

AIGC动态

3年前 (2023)

百川智能推出全球最长上下文窗口大模型Baichuan2-192K，一次可输入35万字超越Claude2

10月30日，百川智能发布Baichuan2-192K大模型，上下文窗口长度高达192K，是目前全球最长的上下文窗口。Baichuan2-192K能够一次处理约35万个汉字，是目前支持...

阅读原文

AIGC动态

3年前 (2023)

刚刚，百川智能Baichuan2-192K发布，上下文窗口全球最长！一次读完《三体》，拿下7个SOTA

新智元报道编辑：编辑部【新智元导读】全球最长上下文窗口来了！今日，百川智能发布Baichuan2-192K大模型，上下文窗口长度高达192K（35万个汉字），是Claude ...

阅读原文

AIGC动态

3年前 (2023)

大模型开启「长」时代，杨植麟的新公司把对话框容量做到了世界第一

机器之心原创作者：张倩虽然我们不知道谁是下一个 OpenAI，但是似乎找到了另一个 Anthropic。最近，大模型创投领域又发生了一件大事：大模型初创公司 Anthrop...

阅读原文

AIGC动态

3年前 (2023)

最多400万token上下文、推理提速22倍，StreamingLLM火了，已获GitHub 2.5K星

机器之心报道编辑：蛋酱如果你体验过与任何一款对话式 AI 机器人的交流，你一定能想起某些极具「挫败感」的时刻。比如，你在前一天的对话中讲述过的要点，被 ...

阅读原文

AIGC动态

3年前 (2023)

123