标签：基线

RNN效率媲美Transformer，谷歌新架构两：同等规模强于Mamba

机器之心报道机器之心编辑部去年 12 月，新架构 Mamba 引爆了 AI 圈，向屹立不倒的 Transformer 发起了挑战。如今，谷歌 DeepMind「Hawk 」和「Griffin 」的...

2年前 (2024)

机器之心报道机器之心编辑部革命性的提升来了。把大模型的权重统统改成三元表示，速度和效率的提升让人害怕。今天凌晨，由微软、国科大等机构提交的一篇论...

2年前 (2024)

作者：加零编辑：李宝珠、三羊成都理工大学的研究人员提出了一个名为 SCDUNet++ 的语义分割模型，结合卷积神经网络和 Transformer 的优势，有效开展滑坡测...

2年前 (2024)

机器之心报道编辑：杜伟、小舟动画视频生成这几天火了，这次 NUS、字节的新框架不仅效果自然流畅，还在视频保真度方面比其他方法强了一大截。前几日，阿里研...

3年前 (2023)

大数据文摘授权转载自将门创投作者：seven_曾子曰：“吾日三省吾身”–出自《论语·学而》时至今日，生成幻觉（hallucination）仍然是大模型研究界中一个令人非常...

3年前 (2023)

新智元报道编辑：润【新智元导读】LeCun转发了Meta团队提出的一种非常特别的处理LLM上下文的方案：通过把上下文内容处理为摘要节点树，让模型自行读取。这样...

3年前 (2023)

机器之心报道编辑：小舟只用一个神经网络实现操纵，四足机器人的重大技术突破。跑酷是一项极限运动，需要参与者以高度动态的方式跨越障碍，对于大多数时候「...

3年前 (2023)