标签：模型

大模型无限流式输入推理飙升46%！国产开源加速「全家桶」，打破多轮对话长度限制

新智元报道编辑：好困桃子【新智元导读】大模型推理再次跃升一个新台阶！最近，全新开源的国产SwiftInfer方案，不仅能让LLM处理无限流式输入，而且还将推理...

阅读原文

AIGC动态

2年前 (2024)

微软祭出代码大模型WaveCoder！4项代码任务2万个实例数据集，让LLM泛化能力飙升

新智元报道编辑：桃子【新智元导读】指令调优或许是让大模型性能提升最有潜力的方法。用高质量数据集进行指令调优，能让大模型性能快速提升。对此，微软研...

阅读原文

AIGC动态

2年前 (2024)

回顾精彩瞬间！IEEE Spectrum盘点2023年度热门AI故事

新智元报道编辑：alan 【新智元导读】今年的AI一路高歌猛进，一年的结尾，IEEE Spectrum总结了本年度关于AI的最受欢迎的文章，让我们一同回顾这个2023又是冬...

阅读原文

AIGC动态

2年前 (2024)

多轮对话推理速度提升46%，开源方案打破LLM多轮对话的长度限制

机器之心发布机器之心编辑部在大型语言模型（LLM）的世界中，处理多轮对话一直是一个挑战。前不久麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM，能够在...

阅读原文

AIGC动态

2年前 (2024)

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

机器之心报道编辑：陈萍、大盘鸡小身板，大能量。当大家都在研究大模型（LLM）参数规模达到百亿甚至千亿级别的同时，小巧且兼具高性能的小模型开始受到研究...

阅读原文

AIGC动态

2年前 (2024)

400万token上下文、推理再加速46%！最新开源方案升级MIT成果，推理成本再降低

明敏发自凹非寺量子位 | 公众号 QbitAI22倍加速还不够，再来提升46%，而且方法直接开源！这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。 Streami...

阅读原文

AIGC动态

2年前 (2024)

四行代码让大模型上下文暴增3倍，羊驼Mistral都适用

克雷西发自凹非寺量子位 | 公众号 QbitAI无需微调，只要四行代码就能让大模型窗口长度暴增，最高可增加3倍！而且是“即插即用”，理论上可以适配任意大模型...

阅读原文

AIGC动态

2年前 (2024)

余震强度预测能力升级，Nature 刊文认证基于神经网络的模型性能优于传统模型

作者：李宝珠编辑：李玮栋、xixi，三羊地震的发生涉及诸多变量，「预测」存在挑战，但余震发生次数及强度的预测已取得重大进展。2023 年 12 月 18 日 23 时...

阅读原文

AIGC动态

2年前 (2024)

新加坡国立大学在读博士孔令东：运用视觉基础模型分割「任意」激光雷达点云｜自动驾驶新青年讲座

「自动驾驶新青年讲座」由智猩猩企划，致力于邀请全球知名高校、顶尖研究机构以及优秀企业的新青年，主讲在环境感知、精准定位、决策规划、控制执行等自动驾...

阅读原文

AIGC动态

2年前 (2024)

微软最新研究成果：使用GPT-4合成数据来训练AI模型，实现SOTA！

夕小瑶科技说原创作者 | 谢年年、王二狗文本嵌入是各项NLP任务的基础，用于将自然语言转换为向量表示。现有的大部分方法通常采用复杂的多阶段训练流程，先在...

阅读原文

AIGC动态

2年前 (2024)

一个框架整合大脑理论 1 大视野概述

来源：CreateAMind Active inference as a theory of sentient behavior 这种方法至少在六个方面带来了统一的好处。主动推理作为感知行为的理论强调 • 我们...

阅读原文

AIGC动态

2年前 (2024)

英伟达将恢复中国“版”AI芯片出货；雷军给团队发百万美金年度大奖；OpenAI下周推出GPT Store | AI一周资讯

作者 | 李忠良阿里开源大模型发布 720 亿参数，四个参数模型开源；小冰宣布大模型已获国内备案，发布克隆人等产品；雷军给两支团队发百万美金年度大奖；百度...

阅读原文

AIGC动态

2年前 (2024)

斯坦福开源的家用机器人！Transformer 架构驱动，由华人开发！

大数据文摘出品在科技领域，时不时就会出现一项突破性的成果，彻底重塑我们对可能性的认知。近日，斯坦福大学、伯克利大学和谷歌 DeepMind 团队合作推出一...

阅读原文

AIGC动态

2年前 (2024)

顺着网线爬过来成真了，Audio2Photoreal通过对话就能生成逼真表情与动作

机器之心报道编辑：大盘鸡、佳琪多模态的发展已经开始超乎我们的想象了。当你和朋友隔着冷冰冰的手机屏幕聊天时，你得猜猜对方的语气。当 Ta 发语音时，你...

阅读原文

AIGC动态

2年前 (2024)

专为数据库打造：DB-GPT用私有化LLM技术定义数据库下一代交互方式

机器之心专栏机器之心编辑部DB-GPT 简化了这些基于大型语言模型 (LLM) 和数据库的应用程序的创建。2023 年 6 月，蚂蚁集团发起了数据库领域的大模型框架 DB-...

阅读原文

AIGC动态

2年前 (2024)

1…353 354355356 357…483