标签:高效
小模型卷起来了:Mistral联合英伟达开源12B小模型,128k上下文
机器之心报道 机器之心编辑部小模型,正在成为 AI 巨头的新战场。今天凌晨,OpenAI 突然发布了 GPT-4o 的迷你版本 ——GPT-4o mini。这个模型替代了原来的 GPT-...
基于LoRA微调多模态大模型一文解析
7月16日19点,「智猩猩AI新青年讲座」第244讲将开讲。上海交通大学和宁波东方理工大学联合培养博士生徐良将主要讲解通用的3D人体动作生成框架ActFormer和人体...
清华汪玉教授团队支招:如何把“大”模型部署到“小”设备上 | Q福利
2024 年,由 AI 驱动的 GPT-4o 等应用产品爆红。这些热门产品的广阔应用前景令人振奋,吸引了大量资源投入 AI 的算法研究、数据清洗、算力等方面的基础建设中...
给大家介绍我的新工具人,夸克AI搜索
NO.1AI时代的搜索变身搜索引擎,长期占据互联网“铁王座”。 AI迅猛崛起后,风向有变。 有人猜测: “搜索引擎的黄金时代可能要结束了。”然而,这事没那么简单,...
Meta AI推出适用于移动设备的紧凑型语言模型
点击上方蓝字关注我们“Meta AI 推出 MobileLLM,一种为移动设备设计的高效语言模型。该模型通过优化参数,实现了与更大模型相当的性能,推动了 AI 模型小型化...
面壁 WAIC 新发布:新一代高效低能耗架构面壁小钢炮、一键开发大模型 APP 的全栈工具集
作者 | 蔡芳芳 7 月 5 日,面壁智能联合创始人、首席科学家刘知远在 WAIC 2024 “模型即服务(Mass)加速大模型应用落地”论坛进行了《大模型时代的摩尔定律,...
WAIC 最具技术想象力成果发布:新架构面壁小钢炮又一次验证并加速了面壁定律
在非共识阶段打「先手」。作者丨王悦 编辑丨陈彩娴 2020 年,1750 亿参数规模的 GPT-3 问世。彼时,完整训练 1750 亿参数的模型需要 3.14E11(TFLOPS)的每秒...
大模型性能掺水严重?北大交出答卷:交互评估+动态出题,死记硬背也没用 | ACL 2024
新智元报道编辑:LRS 【新智元导读】当前大语言模型(LLM)的评估方法受到数据污染问题的影响,导致评估结果被高估,无法准确反映模型的真实能力。北京大学等...
最难「讨好」的消费者,竟然都被AIGC征服了?
说到「营销互动」,你会想到什么? 从传统媒介到互联网时代,互动营销都在行业中占据一席之地。具体形式可能是报纸一角的创意广告,可能是花样百出的 H5 或微...
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
机器之心报道 机器之心编辑部近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。 最新评测结果显示,云从科技的从容...
单张A100全精度推理!谷歌明星开源模型Gemma 2上新9B/27B,挑战3140亿Grok-1
新智元报道编辑:耳朵 【新智元导读】昨晚,谷歌正式开源了自家最强的开源模型Gemma 2,直指为全球范围研究开发者提供实用部署工具。就在昨晚,谷歌的明星开...
英伟达开源合成数据大模型:奖励模型,超过GPT-4 Turbo
直播预告 | 6月18日上午10点,「智猩猩AI新青年讲座」第240讲正式开讲,邀请到德州大学奥斯汀分校刘星超博士将直播讲解《利用直线概率流加速Stable Diffusion...
英伟达开源最强通用模型Nemotron-4 340B
机器之心报道 机器之心编辑部性能超越 Llama-3,主要用于合成数据。英伟达的通用大模型 Nemotron,开源了最新的 3400 亿参数版本。 本周五,英伟达宣布推出 N...
万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化
机器之心发布 作者:宁雪妃、周紫轩(无问芯穹TechView)近年来,大语言模型(Large Language Models, LLMs)受到学术界和工业界的广泛关注,得益于其在各种...
重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,舆论开始发酵
美国也有投机分子。作者 | 西西 编辑 | 陈彩娴 过去一年,中国大模型一直被贴上「追赶美国」的标签,但近日,推特上却有人曝出:美国斯坦福大学的一个 AI 团...