标签:模型
大模型无限流式输入推理飙升46%!国产开源加速「全家桶」,打破多轮对话长度限制
新智元报道编辑:好困 桃子 【新智元导读】大模型推理再次跃升一个新台阶!最近,全新开源的国产SwiftInfer方案,不仅能让LLM处理无限流式输入,而且还将推理...
微软祭出代码大模型WaveCoder!4项代码任务2万个实例数据集,让LLM泛化能力飙升
新智元报道编辑:桃子 【新智元导读】指令调优或许是让大模型性能提升最有潜力的方法。用高质量数据集进行指令调优,能让大模型性能快速提升。 对此,微软研...
回顾精彩瞬间!IEEE Spectrum盘点2023年度热门AI故事
新智元报道编辑:alan 【新智元导读】今年的AI一路高歌猛进,一年的结尾,IEEE Spectrum总结了本年度关于AI的最受欢迎的文章,让我们一同回顾这个2023又是冬...
多轮对话推理速度提升46%,开源方案打破LLM多轮对话的长度限制
机器之心发布 机器之心编辑部在大型语言模型(LLM)的世界中,处理多轮对话一直是一个挑战。前不久麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM,能够在...
轻量级模型,重量级性能,TinyLlama、LiteLlama小模型火起来了
机器之心报道 编辑:陈萍、大盘鸡小身板,大能量。 当大家都在研究大模型(LLM)参数规模达到百亿甚至千亿级别的同时,小巧且兼具高性能的小模型开始受到研究...
400万token上下文、推理再加速46%!最新开源方案升级MIT成果,推理成本再降低
明敏 发自 凹非寺量子位 | 公众号 QbitAI22倍加速还不够,再来提升46%,而且方法直接开源! 这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。 Streami...
四行代码让大模型上下文暴增3倍,羊驼Mistral都适用
克雷西 发自 凹非寺量子位 | 公众号 QbitAI无需微调,只要四行代码就能让大模型窗口长度暴增,最高可增加3倍! 而且是“即插即用”,理论上可以适配任意大模型...
余震强度预测能力升级,Nature 刊文认证基于神经网络的模型性能优于传统模型
作者:李宝珠 编辑:李玮栋、xixi,三羊 地震的发生涉及诸多变量,「预测」存在挑战,但余震发生次数及强度的预测已取得重大进展。2023 年 12 月 18 日 23 时...
新加坡国立大学在读博士孔令东:运用视觉基础模型分割「任意」激光雷达点云|自动驾驶新青年讲座
「自动驾驶新青年讲座」由智猩猩企划,致力于邀请全球知名高校、顶尖研究机构以及优秀企业的新青年,主讲在环境感知、精准定位、决策规划、控制执行等自动驾...
微软最新研究成果:使用GPT-4合成数据来训练AI模型,实现SOTA!
夕小瑶科技说 原创作者 | 谢年年、王二狗文本嵌入是各项NLP任务的基础,用于将自然语言转换为向量表示。现有的大部分方法通常采用复杂的多阶段训练流程,先在...
一个框架整合大脑理论 1 大视野概述
来源:CreateAMind Active inference as a theory of sentient behavior 这种方法至少在六个方面带来了统一的好处。 主动推理作为感知行为的理论 强调 • 我们...
英伟达将恢复中国“版”AI芯片出货;雷军给团队发百万美金年度大奖;OpenAI下周推出GPT Store | AI一周资讯
作者 | 李忠良 阿里开源大模型发布 720 亿参数,四个参数模型开源;小冰宣布大模型已获国内备案,发布克隆人等产品;雷军给两支团队发百万美金年度大奖;百度...
斯坦福开源的家用机器人!Transformer 架构驱动,由华人开发!
大数据文摘出品 在科技领域,时不时就会出现一项突破性的成果,彻底重塑我们对可能性的认知。 近日,斯坦福大学、伯克利大学和谷歌 DeepMind 团队合作推出一...
顺着网线爬过来成真了,Audio2Photoreal通过对话就能生成逼真表情与动作
机器之心报道 编辑:大盘鸡、佳琪多模态的发展已经开始超乎我们的想象了。 当你和朋友隔着冷冰冰的手机屏幕聊天时,你得猜猜对方的语气。当 Ta 发语音时,你...
专为数据库打造:DB-GPT用私有化LLM技术定义数据库下一代交互方式
机器之心专栏 机器之心编辑部DB-GPT 简化了这些基于大型语言模型 (LLM) 和数据库的应用程序的创建。2023 年 6 月,蚂蚁集团发起了数据库领域的大模型框架 DB-...