标签:基线

RNN效率媲美Transformer,谷歌新架构两:同等规模强于Mamba

机器之心报道 机器之心编辑部去年 12 月,新架构 Mamba 引爆了 AI 圈,向屹立不倒的 Transformer 发起了挑战。如今,谷歌 DeepMind「Hawk 」和「Griffin 」的...
阅读原文

微软、国科大开启1Bit时代:大模型转三进制,速度快4倍能耗降至1/41

机器之心报道 机器之心编辑部革命性的提升来了。把大模型的权重统统改成三元表示,速度和效率的提升让人害怕。 今天凌晨,由微软、国科大等机构提交的一篇论...
阅读原文

迁移学习帮大忙!成都理工大学搭建 SCDUNet++ 模型进行滑坡测绘

作者:加零 编辑:李宝珠、三羊 成都理工大学的研究人员提出了一个名为 SCDUNet++ 的语义分割模型,结合卷积神经网络和 Transformer 的优势,有效开展滑坡测...
阅读原文

一张照片,TikTok姐就都能跳舞了

机器之心报道编辑:杜伟、小舟动画视频生成这几天火了,这次 NUS、字节的新框架不仅效果自然流畅,还在视频保真度方面比其他方法强了一大截。前几日,阿里研...
阅读原文

MetaAI提出全新验证链框架,大模型通过“三省吾身”缓解幻觉现象

大数据文摘授权转载自将门创投作者:seven_曾子曰:“吾日三省吾身”–出自《论语·学而》时至今日,生成幻觉(hallucination)仍然是大模型研究界中一个令人非常...
阅读原文

Meta普林斯顿提出LLM上下文终极解决方案!让模型化身自主智能体,自行读取上下文节点树

新智元报道编辑:润【新智元导读】LeCun转发了Meta团队提出的一种非常特别的处理LLM上下文的方案:通过把上下文内容处理为摘要节点树,让模型自行读取。这样...
阅读原文

让人恐惧的是,机器狗已经能做这种事了

机器之心报道编辑:小舟只用一个神经网络实现操纵,四足机器人的重大技术突破。跑酷是一项极限运动,需要参与者以高度动态的方式跨越障碍,对于大多数时候「...
阅读原文
12