标签:窗口
多轮对话推理速度提升46%,开源方案打破LLM多轮对话的长度限制
机器之心发布 机器之心编辑部在大型语言模型(LLM)的世界中,处理多轮对话一直是一个挑战。前不久麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM,能够在...
400万token上下文、推理再加速46%!最新开源方案升级MIT成果,推理成本再降低
明敏 发自 凹非寺量子位 | 公众号 QbitAI22倍加速还不够,再来提升46%,而且方法直接开源! 这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。 Streami...
四行代码让大模型上下文暴增3倍,羊驼Mistral都适用
克雷西 发自 凹非寺量子位 | 公众号 QbitAI无需微调,只要四行代码就能让大模型窗口长度暴增,最高可增加3倍! 而且是“即插即用”,理论上可以适配任意大模型...
5000万tokens大海捞针创纪录,百川智能192K超长上文+搜索增强商用难题!解决99%企业定制需求
新智元报道编辑:编辑部 【新智元导读】就在昨天,百川智能正式发布Baichuan2-Turbo系列API,192K的超长上下文窗口+搜索增强知识库,解决了困扰行业已久的大...
大模型+搜索构建完整技术栈,百川智能用搜索增强给企业定制化下了一剂「猛药」
机器之心报道 机器之心编辑部用好企业知识库是大模型应用破局的关键。 从 ChatGPT 最初发布算起,虽然大模型的热潮已经持续了一年多,但大部分时间依然停留在...
RAG+GPT-4 Turbo让模型性能飙升!更长上下文不是终局,「大海捞针」实验成本仅4%
新智元报道编辑:桃子【新智元导读】RAG或许就是大模型能力飙升下一个未来。RAG+GPT-4,4%的成本,便可拥有卓越的性能。这是最新的「大海捞针」实验得出的结...
攻其不备:Anthropic发布Claude 2.1
点击上方蓝字关注我们“ Anthropic发布Claude 2.1,具有巨大的上下文窗口,提供更强大的语言模型和聊天机器人。虽然有一些限制,但相对于前身有显著改进,包括...
李开复4个多月后“放大招”:对标OpenAI、谷歌,发布“全球最强”开源大模型
整理 | Tina 今天,由李开复打造的 AI 大模型创业公司“零一万物”发布了一系列开源大模型:Yi-34B 和 Yi-6B。Yi-34B 是一个双语(英语和中文)基础模型,经过 ...
李开复官宣「全球最强」开源大模型:一次处理40万汉字、中英均霸榜
机器之心报道机器之心编辑部李开复表示,「零一万物要跻身全球大模型第一梯队。」开源大模型宇宙又有了新的重量级成员,这次是创新工场董事长兼 CE0 李开复大...
全球最强长文本大模型,一次可读35万汉字:Baichuan2-192K上线
机器之心原创作者:泽南、张倩大模型看书,从来没有这么快过。国内大模型创业公司,正在技术前沿创造新的记录。10 月 30 日,百川智能正式发布 Baichuan2-192...
百川智能发布Baichuan2-192K大模型,目前全球最长上下文窗口
文章转自新智元,Founder Park 有所删减10 月 30 日,百川智能发布 Baichuan2-192K 大模型。其上下文窗口长度高达 192K,是目前全球最长的上下文窗口。文本长...
百川智能推出全球最长上下文窗口大模型Baichuan2-192K,一次可输入35万字超越Claude2
10月30日,百川智能发布Baichuan2-192K大模型,上下文窗口长度高达192K,是目前全球最长的上下文窗口。Baichuan2-192K能够一次处理约35万个汉字,是目前支持...
刚刚,百川智能Baichuan2-192K发布,上下文窗口全球最长!一次读完《三体》,拿下7个SOTA
新智元报道编辑:编辑部【新智元导读】全球最长上下文窗口来了!今日,百川智能发布Baichuan2-192K大模型,上下文窗口长度高达192K(35万个汉字),是Claude ...
大模型开启「长」时代,杨植麟的新公司把对话框容量做到了世界第一
机器之心原创作者:张倩虽然我们不知道谁是下一个 OpenAI,但是似乎找到了另一个 Anthropic。最近,大模型创投领域又发生了一件大事:大模型初创公司 Anthrop...
最多400万token上下文、推理提速22倍,StreamingLLM火了,已获GitHub 2.5K星
机器之心报道编辑:蛋酱如果你体验过与任何一款对话式 AI 机器人的交流,你一定能想起某些极具「挫败感」的时刻。比如,你在前一天的对话中讲述过的要点,被 ...