标签:模型

大模型无限流式输入推理飙升46%!国产开源加速「全家桶」,打破多轮对话长度限制

新智元报道编辑:好困 桃子 【新智元导读】大模型推理再次跃升一个新台阶!最近,全新开源的国产SwiftInfer方案,不仅能让LLM处理无限流式输入,而且还将推理...
阅读原文

微软祭出代码大模型WaveCoder!4项代码任务2万个实例数据集,让LLM泛化能力飙升

新智元报道编辑:桃子 【新智元导读】指令调优或许是让大模型性能提升最有潜力的方法。用高质量数据集进行指令调优,能让大模型性能快速提升。 对此,微软研...
阅读原文

回顾精彩瞬间!IEEE Spectrum盘点2023年度热门AI故事

新智元报道编辑:alan 【新智元导读】今年的AI一路高歌猛进,一年的结尾,IEEE Spectrum总结了本年度关于AI的最受欢迎的文章,让我们一同回顾这个2023又是冬...
阅读原文

多轮对话推理速度提升46%,开源方案打破LLM多轮对话的长度限制​

机器之心发布 机器之心编辑部在大型语言模型(LLM)的世界中,处理多轮对话一直是一个挑战。前不久麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM,能够在...
阅读原文

轻量级模型,重量级性能,TinyLlama、LiteLlama小模型火起来了

机器之心报道 编辑:陈萍、大盘鸡小身板,大能量。 当大家都在研究大模型(LLM)参数规模达到百亿甚至千亿级别的同时,小巧且兼具高性能的小模型开始受到研究...
阅读原文

400万token上下文、推理再加速46%!最新开源方案升级MIT成果,推理成本再降低

明敏 发自 凹非寺量子位 | 公众号 QbitAI22倍加速还不够,再来提升46%,而且方法直接开源! 这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。 Streami...
阅读原文

四行代码让大模型上下文暴增3倍,羊驼Mistral都适用

克雷西 发自 凹非寺量子位 | 公众号 QbitAI无需微调,只要四行代码就能让大模型窗口长度暴增,最高可增加3倍! 而且是“即插即用”,理论上可以适配任意大模型...
阅读原文

余震强度预测能力升级,Nature 刊文认证基于神经网络的模型性能优于传统模型

作者:李宝珠 编辑:李玮栋、xixi,三羊 地震的发生涉及诸多变量,「预测」存在挑战,但余震发生次数及强度的预测已取得重大进展。2023 年 12 月 18 日 23 时...
阅读原文

新加坡国立大学在读博士孔令东:运用视觉基础模型分割「任意」激光雷达点云|自动驾驶新青年讲座

「自动驾驶新青年讲座」由智猩猩企划,致力于邀请全球知名高校、顶尖研究机构以及优秀企业的新青年,主讲在环境感知、精准定位、决策规划、控制执行等自动驾...
阅读原文

微软最新研究成果:使用GPT-4合成数据来训练AI模型,实现SOTA!

夕小瑶科技说 原创作者 | 谢年年、王二狗文本嵌入是各项NLP任务的基础,用于将自然语言转换为向量表示。现有的大部分方法通常采用复杂的多阶段训练流程,先在...
阅读原文

一个框架整合大脑理论 1 大视野概述

来源:CreateAMind Active inference as a theory of sentient behavior 这种方法至少在六个方面带来了统一的好处。 主动推理作为感知行为的理论 强调 • 我们...
阅读原文

英伟达将恢复中国“版”AI芯片出货;雷军给团队发百万美金年度大奖;OpenAI下周推出GPT Store | AI一周资讯

作者 | 李忠良 阿里开源大模型发布 720 亿参数,四个参数模型开源;小冰宣布大模型已获国内备案,发布克隆人等产品;雷军给两支团队发百万美金年度大奖;百度...
阅读原文

斯坦福开源的家用机器人!Transformer 架构驱动,由华人开发!

大数据文摘出品 在科技领域,时不时就会出现一项突破性的成果,彻底重塑我们对可能性的认知。 近日,斯坦福大学、伯克利大学和谷歌 DeepMind 团队合作推出一...
阅读原文

顺着网线爬过来成真了,Audio2Photoreal通过对话就能生成逼真表情与动作

机器之心报道 编辑:大盘鸡、佳琪多模态的发展已经开始超乎我们的想象了。 当你和朋友隔着冷冰冰的手机屏幕聊天时,你得猜猜对方的语气。当 Ta 发语音时,你...
阅读原文

专为数据库打造:DB-GPT用私有化LLM技术定义数据库下一代交互方式

机器之心专栏 机器之心编辑部DB-GPT 简化了这些基于大型语言模型 (LLM) 和数据库的应用程序的创建。2023 年 6 月,蚂蚁集团发起了数据库领域的大模型框架 DB-...
阅读原文