标签:模型

​新一代注意力机制Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度

机器之心专栏 机器之心编辑部Lightning Attention-2 是一种新型的线性注意力机制,让长序列的训练和推理成本与 1K 序列长度的一致。 大语言模型序列长度的限...
阅读原文

LMDrive: 大语言模型加持的闭环端到端自动驾驶框架

直播预告 | 1月22日晚7点,「自动驾驶新青年讲座」第35讲正式开讲,LMDrive一作、香港中文大学MMLab在读博士邵昊将主讲《LMDrive:大语言模型加持的闭环端到...
阅读原文

数学推理与AI:机器学习系统能在多大程度上理解数学?

导语2023年12月的 NeurIPS 会议上举办了许多主题研讨会,其中 MATH AI 研讨会为第三届,主题为“数学推理与AI”。数学推理是人类认知的基本方面,涉及分析复杂...
阅读原文

独家|非 Transformer 开源大模型 RWKV 元始智能已完成种子轮融资

训练出千亿模型依然是 RWKV 当下最能证明自己的事情。作者丨张 进 编辑丨陈彩娴 AI科技评论独家获悉,开源LLM RWKV背后的元始智能,种子轮融资已于1月16日走...
阅读原文

高效部署大模型,CMU 最新万字综述纵览 LLM 推理 MLSys 优化技术

近日,CMU Catalyst 团队推出了一篇关于高效 LLM 推理的综述,覆盖了 300 余篇相关论文,从 MLSys 的研究视角介绍了算法创新和系统优化两个方面的相关进展。...
阅读原文

书生·浦语2.0大模型开源;比亚迪发布璇玑AI大模型;阿里发布3D角替换框架丨AIGC大事日报

01/17 全球AIGC产业要闻 1、上海AI实验室等开源书生·浦语2.0大模型 2、阿里发布3D角色视频替换框架Motionshop 3、阿里云自研云原生数据库PolarDB发布新版本 4...
阅读原文

张鹏、潘乱对谈白鸦、肖弘:大模型时代的产品经理,需要 Back to the Future

在 AI 应用的路线上,有赞和 Monica.im(简称 Monica)是两种截然不同的代表。 2012 年成立的有赞,是和微信一起成长起来的为商家服务的 ToB 平台,在 2023 年...
阅读原文

大语言模型的32种消除幻觉的技术,你都了解吗?

夕小瑶科技说 原创作者 | 谢年年、python大模型幻觉问题是计算机语言学中一个重要的研究方向。为减轻幻觉,研究人员提出了多种策略,比如反馈机制、外部信息...
阅读原文

今日Arxiv最热NLP大模型论文:AllenAI最新研究:让AI从简单学起,竟然能解决难题?

夕小瑶科技说 原创作者 | 赛博马良本期论文解读非人类撰写,全文由 赛博马良「AI论文解读达人」 智能体自主完成,经人工审核后发布。 智能体传送门: https:/...
阅读原文

中国电信开源星辰AI大模型:央企中首个完成LLM研发和开源的选手诞生

丰色 发自 凹非寺量子位 | 公众号 QbitAI没想到啊,开源大模型家族里,居然挤进来一位特别的选手: 来自央企,身份为运营商。 具体是谁? 中国电信。 所谓“不...
阅读原文

用大模型帮程序员找Bug,中科院剖析102篇论文总结出这些方案

中科院王俊杰团队 投稿量子位 | 公众号 QbitAI中科院对“找Bug”下手了,一口气总结了N种方案! 法宝就是大模型。 大模型由于其卓越的自然语言理解、推理等能力...
阅读原文

杰克逊跳舞秒变3D机器人!阿里又出新活儿,视频任何人可替换

白交 发自 凹非寺量子位 | 公众号 QbitAI人形机器人跳舞复刻杰克逊,竟一点不逊色?? 这究竟是怎么回事? 原来啊,阿里又整出新活儿—— MotionShop,能将视频...
阅读原文

Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

西风 发自 凹非寺量子位 | 公众号 QbitAIStability AI开年第一个大模型来了! 名为Stable Code 3B,参数27亿,专为写代码而生。 Stable Code 3B可理解处理18...
阅读原文

我编程零基础,但开发了一个自己的 AI 应用 | 极客时间

这两天跟公司的架构师聊天,再次谈到 AI 新浪潮,大家都表示市面上的大模型基本都上手“试验”过了,确实牛,也被其严谨的对话的逻辑性、强大的搜索能力和超高...
阅读原文

200亿「书生·浦语2.0」正式开源!数推性能比肩ChatGPT,200K超长上下文完美召回

新智元报道编辑:桃子 好困 【新智元导读】新一代国产开源大语言模型来了!200K超长上下文「完美」支持,20B版本综合性能全面领先。就在今天,上海人工智能实...
阅读原文