标签:窗口

LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍

新智元报道编辑:LRS 【新智元导读】LongRoPE方法首次将LLM的窗口扩展到了2048k个token,只是简单微调的情况下,就能实现与短上下文窗口相近的性能!大型语言...
阅读原文

LongRoPE:超越极限,将大模型上下文窗口扩展超过200万tokens

大数据文摘受权转载自微软亚洲研究院 编者按:大模型的飞速发展给人们的生活带来了前所未有的便利。我们是否能够设想利用大模型的潜力,快速扫描整部百科全书...
阅读原文

AI 大模型已被破解!Claude 团队最新“越狱”论文把各家模型全部洗脑了一遍

来源:CSDN(ID:CSDNnews) 作者:王启隆 昨日,凭借着 Claude 大模型和 GPT-4 打的不可开交的人工智能创业公司Anthropic公布了一篇论文,文中详述了当前大...
阅读原文

OpenAI竞对用256轮对话「灌醉」大模型,Claude被骗造出炸弹!

新智元报道编辑:alan flynne 【新智元导读】就在刚刚,Anthropic发现了大模型的惊人漏洞。经过256轮对话后,Claude 2逐渐被「灌醉」,开始疯狂越狱,帮人类...
阅读原文

月之暗面Kimi模型升级:200万字窗口版可申请,新增“继续”功能

衡宇 发自 凹非寺量子位 | 公众号 QbitAI继2月以投后约25亿美金估值炸场后,杨植麟的大模型公司月之暗面终于有了一次公开对媒体的活动。 虽然杨植麟本人并未...
阅读原文

GPT 4.5意外曝光,或于6月发布,王者即将归来

点击上方蓝字关注我们“OpenAI意外泄露了GPT-4.5 Turbo的消息。虽然未公布官方声明,搜索引擎抓取了产品页面。GPT-4.5 Turbo拥有双倍上下文窗口,即256,000标...
阅读原文

GPT-4.5 疑似面世,OpenAI 官网网页被索引,最快明天发布?

夕小瑶科技说 原创作者 | 付奶茶就在刚刚 GPT-4.5 Turbo 疑似被 OpenAI 网络团队泄露了! Bing和DuckDuck Go等搜索引擎在GPT-4.5 Turbo正式发布之前就已经对G...
阅读原文

200万上下文窗口创飞Gemini 1.5!微软来砸谷歌场子了(doge)

西风 发自 凹非寺量子位 | 公众号 QbitAI谷歌刚刷新大模型上下文窗口长度记录,发布支持100万token的Gemini 1.5,微软就来砸场子了。 推出大模型上下文窗口拉...
阅读原文

GitHub热榜第一:百万token上下文,还能生成视频,UC伯克利出品

克雷西 发自 凹非寺量子位 | 公众号 QbitAI今日GitHub热榜榜首,是最新的开源世界模型。 上下文窗口长度达到了100万token,持平了谷歌同时推出的王炸Gemini 1...
阅读原文

谷歌Gemini 1.5模型来了!突破100万个tokens,能处理1小时视频【附58页技术报告】

一次能处理1小时视频、11小时音频、超过3万行代码。 编译|ZeR0 编辑|漠影 智东西2月16日报道,谷歌昨夜发布其大模型矩阵的最新力作——Gemini 1.5,并将上下文...
阅读原文

谷歌Gemini1.5重磅上线:最强MoE架构,100万上下文

文章转载自「机器之心」今天,谷歌宣布推出 Gemini 1.5。Gemini 1.5 建立在谷歌基础模型开发和基础设施的研究与工程创新的基础上,包括通过新的专家混合 (MoE...
阅读原文

谷歌Gemini1.5火速上线:MoE架构,100万上下文

机器之心报道 机器之心编辑部今天,谷歌宣布推出 Gemini 1.5。 Gemini 1.5 建立在谷歌基础模型开发和基础设施的研究与工程创新的基础上,包括通过新的专家混...
阅读原文

谷歌发布Gemini 1.5,多项指标碾压ChatGPT

点击上方蓝字关注我们谷歌发布了Gemini 1.5,AI模型系列的重大更新,拥有史无前例的大型上下文长度。Gemini 1.5采用新的MoE架构,效率更高。Gemini 1.5 Pro性...
阅读原文

大模型无限流式输入推理飙升46%!国产开源加速「全家桶」,打破多轮对话长度限制

新智元报道编辑:好困 桃子 【新智元导读】大模型推理再次跃升一个新台阶!最近,全新开源的国产SwiftInfer方案,不仅能让LLM处理无限流式输入,而且还将推理...
阅读原文

多轮对话推理速度提升46%,开源方案打破LLM多轮对话的长度限制​

机器之心发布 机器之心编辑部在大型语言模型(LLM)的世界中,处理多轮对话一直是一个挑战。前不久麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM,能够在...
阅读原文
123