标签:性能

新加坡国立大学发布图文预训练框架 CosMo,助力长文本理解

夕小瑶科技说 原创作者 | 智商掉了一地、Python近年来,随着大型语言模型(LLM)的兴起,让多模态学习领域也得到了不断发展。本文作者深入探讨了视觉-语言预...
阅读原文

英伟达中国特供版RTX 5880发布!性能比旗舰大砍近25%,比RTX 5000只高6%

新智元报道编辑:好困 润 【新智元导读】英伟达公布国区特供版专业级显卡RTX 5880 Ada,性能大砍接近25%,价格未知。去年年底,英伟达正式发布了「减量不减价...
阅读原文

皮衣老黄套路多!被抢破头的GPU,其实没有任何惊喜

作者 | ANDREW CUNNINGHAM 译者 | 核子可乐 策划 | 凌敏 按投入产出比来计算,新一代 GPU 的性能几乎没有什么提升。 从诸多方面来看,2023 年对于想要搭建游...
阅读原文

无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

丰色 发自 凹非寺量子位 | 公众号 QbitAI一个来自MIT博士生的惊人发现: 只需对Transformer的特定层进行一种非常简单的修剪,即可在缩小模型规模的同时显著提...
阅读原文

英伟达正式发布中国特供版RTX 4090 D:AI性能大降10%,售价还是1万3!

新智元报道编辑:润 好困 【新智元导读】英伟达正式发布针对中国市场的4090 D,性能砍了10%,价格却没降。不过重要的是,又能买到英伟达的旗舰显卡了。中国特...
阅读原文

特供版显卡RTX4090D上市,售价12999元

机器之心报道 机器之心编辑部性能与原版 RTX 4090 类似,但降低了一些 AI 运算能力。美国对 AI 计算卡的禁令,终于影响到了普通消费者。 本周四,英伟达正式...
阅读原文

Llama2推理RTX3090胜过4090,延迟吞吐量占优,但被A800远远甩开

机器之心报道 编辑:杜伟、小舟这是为数不多深入比较使用消费级 GPU(RTX 3090、4090)和服务器显卡(A800)进行大模型预训练、微调和推理的论文。 大型语言...
阅读原文

大模型微调非得依赖人类数据吗?DeepMind:用带反馈的自训练更好

机器之心报道 编辑:杜伟、陈萍面对当前微调大模型主要依赖人类生成数据的普遍做法,谷歌 DeepMind 探索出了一种减少这种依赖的更高效方法。如你我所见,大语...
阅读原文

给Transformer降降秩,移除特定层90%以上组件LLM性能不减

机器之心报道 编辑:陈萍、杜伟MIT、微软联合研究:不需要额外训练,也能增强大语言模型的任务性能并降低其大小。在大模型时代,Transformer 凭一己之力撑起...
阅读原文

为AI加速而生:英特尔的至强,现在能跑200亿参数大模型了

机器之心报道 编辑:泽南实用化 AI 算力又升上了一个新台阶。 在人工智能的应用领域,出现了一些让人始料未及的趋势:很多传统企业开始选择在 CPU 平台上落地...
阅读原文

阿里mPLUG-Owl新升级,鱼与熊掌兼得,模态协同实现MLLM新SOTA

机器之心专栏 机器之心编辑部OpenAI GPT-4V 和 Google Gemini 都展现了非常强的多模态理解能力,推动了多模态大模型(MLLM)快速发展,MLLM 成为了现在业界最...
阅读原文

显卡之争!英伟达和AMD下场互掐!GPU霸主地位是否能保?

夕小瑶科技说 原创作者 | 王二狗大家好,我是二狗。 英伟达和AMD这两家芯片巨头掐起来啦! 事情的起因是,两周前AMD董事会主席兼CEO苏姿丰在一场活动中发布了...
阅读原文

一代更比一代强,AI 时代的至强如何为云服务保驾护航?

作者 | 郑思宇 2023 年,生成式 AI 研究和应用的爆发给云计算产业带来了全新的机遇和挑战:大模型需要庞大的算力支持,用户普遍需要向云计算厂商购买算力服务...
阅读原文

终端侧AI才是生成式AI规模化的未来 | 高通颜辰巍@MEET2024

编辑部 整理自 MEET2024量子位 | 公众号 QbitAI纵观刚刚过去的MEET 2024智能未来大会,终端侧AI俨然成为其中一大热词。 为什么大家都在谈论这一趋势? 在大会...
阅读原文

浙大“北极熊毛衣”登Science,保温效率达羽绒服5倍

克雷西 发自 凹非寺量子位 | 公众号 QbitAI最近,一波又一波寒潮接踵而至,羽绒服成了人们过冬的必备物品。 而浙大研制了一种新型材料,不仅保暖而且比羽绒服...
阅读原文
1171819202126