标签:数量

还不如人类五岁小孩,难度为零的视觉测试,GPT-4o、Claude 3.5 Sonnet却挑战失败了

大数据文摘授权转载自学术头条 撰文:马雪薇 GPT-4o、Claude 3.5 Sonnet 等具有视觉能力的大语言模型(LLM),是否能像人类一样感知图像?最新研究表明,在一...
阅读原文

MoE也有Scaling Law,「百万专家」利用率近100%!DeepMind华人挑战MoE极限

新智元报道编辑:编辑部 【新智元导读】MoE已然成为AI界的主流架构,不论是开源Grok,还是闭源GPT-4,皆是其拥趸。然而,这些模型的专家,最大数量仅有32个。...
阅读原文

中国AI论文数量全球第一!中科院拿下研究机构双第一,腾讯企业排第三

夕小瑶科技说 原创作者 | 21#前段时间,美国乔治城大学的数据分析平台ETO发布了一组关于《人工智能研究年鉴》统计数字,着实让小编震惊。 先说结论: 1、在 2...
阅读原文

单一作者论文,谷歌提出百万专家Mixture,超越密集前馈、稀疏MoE

机器之心报道 编辑:泽南、杜伟释放进一步扩展 Transformer 的潜力,同时还可以保持计算效率。标准 Transformer 架构中的前馈(FFW)层会随着隐藏层宽度的增...
阅读原文

参数更新量仅为LoRA的5%,性能不减反升!南加大提出高效精调法LaMDA

夕小瑶科技说 原创作者 | Axe_越万物负阴而抱阳,冲气以为和 ——《道德经·第四十二章》 从Bert时代一路过来的朋友们应该还记得,对于仅仅只有1亿参数的Bert,...
阅读原文

字节跳动Coze正式开启付费计划!这个价格是Coze飘了吗?

直播预告 | 7月5日晚7点,「智猩猩机器人新青年讲座」第10讲正式开讲,北京通研院研究员贾宝雄博士主讲,主题为《具身智能视角下的三维场景理解、生成与交互...
阅读原文

Stanford发布501页全球AI指数报告:中美两国引领世界,但有一项中国不如印度(附报告全文)

夕小瑶科技说 原创作者 | Richard斯坦福发布了2024年AI指数报告,这是目前AI领域最全面、最权威的年度报告之一。这份报告详尽地记录和分析了AI技术的最新进展...
阅读原文

开创性CVM算法破解40多年计数难题!计算机科学家掷硬币算出「哈姆雷特」独特单词

新智元报道编辑:桃子 【新智元导读】预估一个数组中不重复数字的个数,最简便的方法是什么?计算机科学家们提出了一种全新CVM算法,通过利用随机性,预估出...
阅读原文

又水一篇AI顶会!不知道硕士博士咋毕业的,来看看咋水的。

又水了一篇顶会。要说创新,也没啥大创新。要说没创新,确实也有一丢丢的新东西。 毕竟能发顶会或者高区位会议的文章,idea必须有创新性。但一个科研新人几乎...
阅读原文

Gemini Ultra训练烧掉近2亿美元!斯坦福迄今最全AI报告发布,中国AI专利数遥遥领先

披露大模型最新战况,超全501页《斯坦福AI指数报告》划重点。 作者|ZeR0 编辑|漠影 智东西4月16日报道,最新的501页《2024斯坦福AI指数报告》刚刚发布,披露...
阅读原文

“抄袭”原来才是最快的写论文方法?

有些研究生,即使告诉他方法,也发不了顶会顶刊! 因为能发顶会或者高区位会议的文章,idea必须有创新性。而一个科研新人几乎不具备独立提炼idea的能力。 很...
阅读原文

大模型提示学习样本量有玄机,自适应调节方法好

夕小瑶科技说 原创作者 | 芒果 引言:探索文本分类中的个性化示例数量在自然语言处理(NLP)领域,预测模型已经从零开始训练演变为使用标记数据对预训练模型...
阅读原文

今日arXiv最热NLP大模型论文:大模型提示学习样本量有玄机,自适应调节方法好

夕小瑶科技说 原创作者 | 芒果 引言:探索文本分类中的个性化示例数量在自然语言处理(NLP)领域,预测模型已经从零开始训练演变为使用标记数据对预训练模型...
阅读原文

Sora 作者被曝读博期间仅发表两篇论文,我们是否需要重塑科研价值观?

夕小瑶科技说 原创作者 | 智商掉了一地 众所周知,在当今学术界,论文数量和产出速度常常被视为研究者生产力和学术成就的重要标尺。笔者也面试过很多博士生候...
阅读原文

MoE与Mamba强强联合,将状态空间模型扩展到数百亿参数

机器之心报道 编辑:Panda性能与 Mamba 一样,但所需训练步骤数却少 2.2 倍。状态空间模型(SSM)是近来一种备受关注的 Transformer 替代技术,其优势是能在...
阅读原文
12