标签:序列

仅需200M参数,零样本性能超越有监督!谷歌发布时序预测基础模型TimesFM

新智元报道编辑:LRS 【新智元导读】TimesFM针对时序数据设计,输出序列长于输入序列,在1000亿时间点数据进行预训练后,仅用200M参数量就展现出超强零样本学...
阅读原文

LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!

新智元报道编辑:LRS 【新智元导读】新模型bGPT是一个基于字节的Transformer模型,能够将不同类型的数据纳入同一框架之下,可以生成文本、图像和音频,还能模...
阅读原文

不依赖token,字节级模型来了!直接处理二进制数据

数字游民 投稿量子位 | 公众号 QbitAI最新GPT,不预测token了。 微软亚研院等发布bGPT,仍旧基于Transformer,但是模型预测的是下一个字节(byte)。 通过直...
阅读原文

DeepMind携Mamba华人作者推Transformer之作!性能暴涨媲美Llama 2,推理能效大幅碾压

新智元报道编辑:编辑部 【新智元导读】线性RNN赢了?近日,谷歌DeepMind一口气推出两大新架构,在d基准测试中超越了Transformer。新架构不仅保证了高效的训...
阅读原文

RNN效率媲美Transformer,谷歌新架构两:同等规模强于Mamba

机器之心报道 机器之心编辑部去年 12 月,新架构 Mamba 引爆了 AI 圈,向屹立不倒的 Transformer 发起了挑战。如今,谷歌 DeepMind「Hawk 」和「Griffin 」的...
阅读原文

想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速

机器之心报道 机器之心编辑部作为 2024 开年王炸,Sora 的出现树立了一个全新的追赶目标,每个文生视频的研究者都想在最短的时间内复现 Sora 的效果。 根据 O...
阅读原文

与Sora一样能生成视频、图像,还能一次解读100万数据!

来源| AIGC开放社区 大语言模型(LLM)在生成文本内容方面非常强,但在理解、生成视频、图像等方面略显不足。尤其是在 Sora 一夜爆红之后,让人们意识到未来...
阅读原文

8/8/6/3的Mamba论文,最终还是被ICLR 2024拒了,网友:悬着的心终于死了

机器之心报道 编辑:蛋酱几天前,ICLR 2024 的最终接收结果出来了。 大家应该还记得,Mamba 被 ICLR 2024 大会 Decision Pending(待定)的消息在 1 月份引发...
阅读原文

Pieter Abbeel新工作“大世界模型”:轻松玩转 1 小时长视频,一对一QA视频内容细节

大数据文摘授权转载自AI科技评论 作者:赖文昕 编辑:陈彩娴 自3天前Sora发布以来,由图灵奖得主、Meta首席科学家Yann LeCun提出的“世界模型”又一次引起了广...
阅读原文

Pieter Abbeel 新工作“大世界模型”:轻松玩转 1 小时长视频,一对一 QA 视频内容细节

伯克利发布的“大世界模型”,究竟大在哪里?作者丨赖文昕 编辑丨陈彩娴 自3天前Sora发布以来,由图灵奖得主、Meta首席科学家Yann LeCun提出的“世界模型”又一次...
阅读原文

100万token,一次能分析1小时YouTube视频,「大世界模型」火了

机器之心报道 编辑:陈萍、小舟这项研究为语言模型更好地理解物理世界铺平了道路。最近几天,我们接连被谷歌的多模态模型 Gemini 1.5 以及 OpenAI 的视频生成...
阅读原文

疫苗研发新突破:北航团队提出病毒抗原免疫原性预测新方法 VirusImmu

作者:乔乔 编辑:李宝珠,三羊 来自北京航空航天大学的李静等人,开发了一种用于病毒抗原免疫原性预测的机器学习集成方法 Viruslmmu。传染病是严重危害人类...
阅读原文

AI Agent自主设计全新蛋白质登Nature!威斯康星大学让机器人科学家做实验,无需人类帮助

新智元报道编辑:Aeneas 【新智元导读】这个自动化蛋白质设计系统可以自己设计和测试新的蛋白质,不需要人类的帮助。就像一个能自己做实验的机器人科学家。它...
阅读原文

2亿参数时序模型替代LLM?谷歌突破性研究被批「犯新手错误」

机器之心报道 编辑:张倩、泽南照箭画靶,跑分自设标准? 最近,谷歌的一篇论文在 X 等社交媒体平台上引发了一些争议。 这篇论文的标题是「A decoder-only fo...
阅读原文

不分割成token,直接从字节中高效学习,Mamba原来还能这样用

机器之心报道 编辑:张倩给出一句「Hello, world!」你要怎么把它喂给 AI 模型?目前常见的方法是利用某种算法将它分为若干 token,比如 ['Hello', ',', 'worl...
阅读原文
15678911