标签：模型

新一代注意力机制Lightning Attention-2：无限序列长度、恒定算力开销、更高建模精度

机器之心专栏机器之心编辑部Lightning Attention-2 是一种新型的线性注意力机制，让长序列的训练和推理成本与 1K 序列长度的一致。大语言模型序列长度的限...

阅读原文

AIGC动态

2年前 (2024)

LMDrive: 大语言模型加持的闭环端到端自动驾驶框架

直播预告 | 1月22日晚7点，「自动驾驶新青年讲座」第35讲正式开讲，LMDrive一作、香港中文大学MMLab在读博士邵昊将主讲《LMDrive：大语言模型加持的闭环端到...

阅读原文

AIGC动态

2年前 (2024)

数学推理与AI：机器学习系统能在多大程度上理解数学？

导语2023年12月的 NeurIPS 会议上举办了许多主题研讨会，其中 MATH AI 研讨会为第三届，主题为“数学推理与AI”。数学推理是人类认知的基本方面，涉及分析复杂...

阅读原文

AIGC动态

2年前 (2024)

独家｜非 Transformer 开源大模型 RWKV 元始智能已完成种子轮融资

训练出千亿模型依然是 RWKV 当下最能证明自己的事情。作者丨张进编辑丨陈彩娴 AI科技评论独家获悉，开源LLM RWKV背后的元始智能，种子轮融资已于1月16日走...

阅读原文

AIGC动态

2年前 (2024)

高效部署大模型，CMU 最新万字综述纵览 LLM 推理 MLSys 优化技术

近日，CMU Catalyst 团队推出了一篇关于高效 LLM 推理的综述，覆盖了 300 余篇相关论文，从 MLSys 的研究视角介绍了算法创新和系统优化两个方面的相关进展。...

阅读原文

AIGC动态

2年前 (2024)

书生·浦语2.0大模型开源；比亚迪发布璇玑AI大模型；阿里发布3D角替换框架丨AIGC大事日报

01/17 全球AIGC产业要闻 1、上海AI实验室等开源书生·浦语2.0大模型 2、阿里发布3D角色视频替换框架Motionshop 3、阿里云自研云原生数据库PolarDB发布新版本 4...

阅读原文

AIGC动态

2年前 (2024)

张鹏、潘乱对谈白鸦、肖弘：大模型时代的产品经理，需要 Back to the Future

在 AI 应用的路线上，有赞和 Monica.im(简称 Monica）是两种截然不同的代表。 2012 年成立的有赞，是和微信一起成长起来的为商家服务的 ToB 平台，在 2023 年...

阅读原文

AIGC动态

2年前 (2024)

大语言模型的32种消除幻觉的技术，你都了解吗？

夕小瑶科技说原创作者 | 谢年年、python大模型幻觉问题是计算机语言学中一个重要的研究方向。为减轻幻觉，研究人员提出了多种策略，比如反馈机制、外部信息...

阅读原文

AIGC动态

2年前 (2024)

今日Arxiv最热NLP大模型论文：AllenAI最新研究：让AI从简单学起，竟然能解决难题？

夕小瑶科技说原创作者 | 赛博马良本期论文解读非人类撰写，全文由赛博马良「AI论文解读达人」智能体自主完成，经人工审核后发布。智能体传送门： https:/...

阅读原文

AIGC动态

2年前 (2024)

中国电信开源星辰AI大模型：央企中首个完成LLM研发和开源的选手诞生

丰色发自凹非寺量子位 | 公众号 QbitAI没想到啊，开源大模型家族里，居然挤进来一位特别的选手：来自央企，身份为运营商。具体是谁？中国电信。所谓“不...

阅读原文

AIGC动态

2年前 (2024)

用大模型帮程序员找Bug，中科院剖析102篇论文总结出这些方案

中科院王俊杰团队投稿量子位 | 公众号 QbitAI中科院对“找Bug”下手了，一口气总结了N种方案！法宝就是大模型。大模型由于其卓越的自然语言理解、推理等能力...

阅读原文

AIGC动态

2年前 (2024)

杰克逊跳舞秒变3D机器人！阿里又出新活儿，视频任何人可替换

白交发自凹非寺量子位 | 公众号 QbitAI人形机器人跳舞复刻杰克逊，竟一点不逊色？？这究竟是怎么回事？原来啊，阿里又整出新活儿—— MotionShop，能将视频...

阅读原文

AIGC动态

2年前 (2024)

Stability AI开年首个大模型：专写代码，支持18种编程语言，上下文100K，苹果笔记本离线就能跑

西风发自凹非寺量子位 | 公众号 QbitAIStability AI开年第一个大模型来了！名为Stable Code 3B，参数27亿，专为写代码而生。 Stable Code 3B可理解处理18...

阅读原文

AIGC动态

2年前 (2024)

我编程零基础，但开发了一个自己的 AI 应用 | 极客时间

这两天跟公司的架构师聊天，再次谈到 AI 新浪潮，大家都表示市面上的大模型基本都上手“试验”过了，确实牛，也被其严谨的对话的逻辑性、强大的搜索能力和超高...

阅读原文

AIGC动态

2年前 (2024)

200亿「书生·浦语2.0」正式开源！数推性能比肩ChatGPT，200K超长上下文完美召回

新智元报道编辑：桃子好困【新智元导读】新一代国产开源大语言模型来了！200K超长上下文「完美」支持，20B版本综合性能全面领先。就在今天，上海人工智能实...

阅读原文

AIGC动态

2年前 (2024)

1…342 343344345 346…483