标签:研究者

BrainGPT:超越神经科学家的GPT

大数据文摘授权转载自追问nextquestion 面对科研工作中海量的科学文献,科研人员常常感到不胜其扰。一方面,随着文献数量的指数级增长,人们难免会担心是否有...
阅读原文

离职谷歌的Transformer作者创业,连发3个模型(附技术报告)

机器之心报道 编辑:陈萍、小舟去年 8 月,两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI,总部位于日本东京。其中,...
阅读原文

今日arXiv最热大模型论文:超越LoRA,北京大学提出预训练模型非梯度优化法

夕小瑶科技说 原创编辑 | 松果 引言:探索大型语言模型中低秩适应的新方法在自然语言处理领域,大语言模型(LLMs)的迅猛发展带来了前所未有的性能提升。然而...
阅读原文

苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

机器之心报道 机器之心编辑部苹果也在搞自己的大型多模态基础模型,未来会不会基于该模型推出相应的文生图产品呢?我们拭目以待。 今年以来,苹果显然已经加...
阅读原文

被误解的「中文版Sora」背后,字节跳动有哪些技术?

机器之心报道 作者:蛋酱2024 开年,OpenAI 就在生成式 AI 领域扔下了重磅炸弹:Sora。 这几年,视频生成领域的技术迭代持续加速,很多科技公司也公布了相关...
阅读原文

田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型

机器之心报道 编辑:陈萍、大盘鸡只用 24G 显存,消费级 GPU 就能搞定大模型了。 上个月,Meta FAIR 田渊栋参与的一项研究广受好评,他们在论文《 MobileLLM:...
阅读原文

怒斥Sora之后,LeCun放出「视觉世界模型」论文,揭示AI学习物理世界的关键​

机器之心报道 机器之心编辑部Sora 的发布让整个 AI 领域为之狂欢,但 LeCun 是个例外。 面对 OpenAI 源源不断放出的 Sora 生成视频,LeCun 热衷于寻找其中的...
阅读原文

解密:圣塔菲研究所的科学思想革命运动

来源:集智俱乐部 撰文:吴家睿编者按在众多的非营利研究机构中,位于美国新墨西哥州的圣菲研究所以研究复杂系统科学闻名。在《复杂》这本书中,美国科学作家...
阅读原文

RNN效率媲美Transformer,谷歌新架构两连发:同等规模强于Mamba

机器之心报道 机器之心编辑部去年 12 月,新架构 Mamba 引爆了 AI 圈,向屹立不倒的 Transformer 发起了挑战。如今,谷歌 DeepMind「Hawk 」和「Griffin 」的...
阅读原文

大一统视频编辑框架:浙大&微软推出UniEdit,无须训练、支持多种编辑场景

机器之心专栏 机器之心编辑部随着 Sora 的爆火,人们看到了 AI 视频生成的巨大潜力,对这一领域的关注度也越来越高。 除了视频生成,在现实生活中,如何对视...
阅读原文

今日arXiv最热大模型论文:谷歌最新研究,将LLM用于回归分析任务,显著超越传统模型

夕小瑶科技说 原创编辑 | 松果 引言:探索语言模型在回归分析中的应用回归分析是一个强大的工具,能够准确预测系统或模型的结果指标,给定一组参数。然而,传...
阅读原文

ControlNet作者又出新作:百万数据训练,AI图像生成迎来图层设计

机器之心报道 编辑:陈萍、杜伟有人表示:「等待已久的 AI 图像创建功能终于迎来了图层!」尽管用于生成图像的大模型已经成为计算机视觉和图形学的基础,但令...
阅读原文

首批类Sora模型出现,色拉布上线Snap Video,效果优于Pika、不输Gen-2

机器之心报道 编辑:杜伟、蛋酱文生视频这个战场,入局的玩家越来越多了。这次是阅后即焚 SnapChat 背后的公司。 最近,OpenAI 视频生成模型 Sora 的爆火,给...
阅读原文

复旦发布!通过集成小推理引擎,赋能大模型逻辑推理能力

夕小瑶科技说 原创作者 | 芒果、python引言:探索大语言模型的逻辑推理能力在人工智能领域,大语言模型(LLMs)的推理能力一直是研究的热点。这些模型在各种...
阅读原文

端侧最强,Meta田渊栋等人卷10亿以下参数小模型,LeCun:小技巧启动

机器之心报道 机器之心编辑部Meta 推出 MobileLLM 系列,一款适用于移动设备上的「小」模型。「在移动设备上运行 LLM?可能需要 Meta 的一些技巧。」刚刚,图...
阅读原文
13456712