标签:模型
PyTorch造大模型“加速包”,不到1000行代码提速10倍!英伟达科学家:minGPT以来最好的教程式repo之一
西风 发自 凹非寺量子位 | 公众号 QbitAIPyTorch团队让大模型推理速度加快了10倍。且只用了不到1000行的纯原生PyTorch代码!项目名为GPT-fast,加速效果观感...
追踪溯源?可定位源头模型的AI文本判别器出现了!CMU提出
夕小瑶科技说 原创作者 | 智商掉了一地、Python自从去年底 ChatGPT 发布以来,许多人的工作和生活方式随之变化。作为创作时代的重要拐点,大型语言模型(LLM...
微软教小模型推理进阶版:Orca 2性能媲美10倍参数模型,已开源
机器之心报道机器之心编辑部站在巨人的肩膀上会让你看的更远,而通过让大规模语言模型来「教」较小规模的语言模型进行推理,也会是事半功倍的效果。如你我所...
线上闭门会上新!北航、MIT、莫纳什和商汤四位专家直播探讨大模型微调与推理部署
今年9月起,智东西公开课品牌全新升级为智猩猩。智猩猩定位硬科技讲解与服务平台,提供公开课、在线研讨会、讲座、线上闭门会、峰会等线上线下产品。「线上闭...
通义千问720亿参数大模型开源;Meta发布多模态感知数据集;昆仑万维发布Agent开发平台丨AIGC大事日报
12/01全球AIGC产业要闻1、Meta开源实时翻译系列模型Seamless2、Meta推出音频生成模型Audiobox3、Meta发布多模态数据集Ego-Exo4D4、阿里云通义千问开源720亿参...
AI诊疗或更准确,来自顶刊新研究!大模型搞医疗现状:在CPU上成功落地
金磊 明敏 发自 凹非寺量子位 | 公众号 QbitAI当大模型踏入医疗行业与人类医生一较高下时,它能达到什么水平?就在最近,医学顶刊BMJ便给出了这样一个结论:...
国产720亿参数开源免费模型来了!对标Llama2 70B,一手实测在此
鱼羊 发自 凹非寺量子位 | 公众号 QbitAI最强开源大模型,再次易主!就在刚刚,阿里云通义千问又双叒开源了,并且直接开大:甩出了720亿参数版本——在中国的开...
AI美术完成度超80%,游戏模型为何无法通用?三七互娱独家揭秘
量子位智库 发自 凹非寺量子位 | 公众号 QbitAI*本文为量子位智库「AIGC+游戏」系列深度访谈栏目,更多内容请关注即将发布的「AIGC游戏产业全景报告」:。AIG...
昆仑万维方汉:大模型时代,超级 APP 不会是神话
未来,超级APP不是一个,而是多个。作者丨何思思编辑丨陈彩娴“艰苦奋斗,独立自主”——这是昆仑万维董事长兼CEO方汉做大模型3年以来的真实感受。早在今年4月,...
人工智能基础创新的第二增长曲线
来源:微软亚洲研究院作者:韦福如编者按:2023年是微软亚洲研究院建院25周年。借此机会,我们特别策划了“智启未来”系列文章,邀请到微软亚洲研究院不同研究...
AI 视频明星公司 Heygen 收入突破 1800 万美元,公司估值 7500 万美元
因为泰勒·斯威夫特说中文的视频而备受更关注的 AI 视频生成工具 Heygen, 后,11 月份该项收入飙升到了 1800 万美元。而且,在收到一笔最新的 560 万美元风险...
通义千问爆甩开源全家桶!最强720亿参数超车Llama 2,新上视觉模型看图直出代码
新智元报道编辑:编辑部【新智元导读】通义千问开源全家桶正式上线!业界最强72B模型直接超越开源标杆Llama 2-70B,还有1.8B模型、音频大模型全部开源,阿里...
GPT-4合成!「角色调节」让大模型轻松越狱,成功率暴涨40%,成本不到14元,马库斯转赞
新智元报道编辑:桃子【新智元导读】让大模型洗钱、制造炸弹、合成冰毒?GPT-4、 Claude 2纷纷沦陷了。让大模型成功越狱,还是有机可乘。最近,研究人员研制...
LLM生成延迟降低50%!DeepSpeed团队发布FastGen:动态SplitFuse技术,提升2.3倍有效吞吐量
新智元报道编辑:LRS【新智元导读】DeepSpeed-FastGen结合MII和DeepSpeed-Inference实现LLM高吞吐量文本生成。GPT-4和LLaMA这样的大型语言模型(LLMs)已在各...
OpenAI最强竞品训练AI拆解LLM黑箱,意外窥见大模型「灵魂」
新智元报道编辑:润【新智元导读】Anthropic的模型可解释性团队,从大模型中看到了它的「灵魂」——一个可解释的更高级的模型。为了拆开大模型的「黑箱」,Anth...