标签:研究者

苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相

机器之心报道 编辑:陈萍、大盘鸡苹果发布基于开源训练和推理框架的高效语言模型族 OpenELM。要说 ChatGPT 拉开了大模型竞赛的序幕,那么 Meta 开源 Llama 系...
阅读原文

杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人

机器之心报道 编辑:陈萍、杜伟在社交活动中,大语言模型既可以是你的合作伙伴(partner),也可以成为你的导师(mentor)。在人类的社交活动中,为了更有效...
阅读原文

让智能体像孩子一样观察别人学习动作,跨视角技能学习数据集EgoExoLearn来了

机器之心专栏 机器之心编辑部在探索人工智能边界时,我们时常惊叹于人类孩童的学习能力 —— 可以轻易地将他人的动作映射到自己的视角,进而模仿并创新。当我们...
阅读原文

BrainGPT:超越神经科学家的GPT

大数据文摘授权转载自追问nextquestion 面对科研工作中海量的科学文献,科研人员常常感到不胜其扰。一方面,随着文献数量的指数级增长,人们难免会担心是否有...
阅读原文

离职谷歌的Transformer作者创业,3个模型(附技术报告)

机器之心报道 编辑:陈萍、小舟去年 8 月,两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI,总部位于日本东京。其中,...
阅读原文

今日arXiv最热大模型论文:超越LoRA,北京大学提出预训练模型非梯度优化法

夕小瑶科技说 原创编辑 | 松果 引言:探索大型语言模型中低秩适应的新方法在自然语言处理领域,大语言模型(LLMs)的迅猛发展带来了前所未有的性能提升。然而...
阅读原文

苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

机器之心报道 机器之心编辑部苹果也在搞自己的大型多模态基础模型,未来会不会基于该模型推出相应的文生图产品呢?我们拭目以待。 今年以来,苹果显然已经加...
阅读原文

被误解的「中文版Sora」背后,字节跳动有哪些技术?

机器之心报道 作者:蛋酱2024 开年,OpenAI 就在生成式 AI 领域扔下了重磅炸弹:Sora。 这几年,视频生成领域的技术迭代持续加速,很多科技公司也公布了相关...
阅读原文

田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型

机器之心报道 编辑:陈萍、大盘鸡只用 24G 显存,消费级 GPU 就能搞定大模型了。 上个月,Meta FAIR 田渊栋参与的一项研究广受好评,他们在论文《 MobileLLM:...
阅读原文

怒斥Sora之后,LeCun放出「视觉世界模型」论文,揭示AI学习物理世界的关键​

机器之心报道 机器之心编辑部Sora 的发布让整个 AI 领域为之狂欢,但 LeCun 是个例外。 面对 OpenAI 源源不断放出的 Sora 生成视频,LeCun 热衷于寻找其中的...
阅读原文

解密:圣塔菲研究所的科学思想

来源:集智俱乐部 撰文:吴家睿编者按在众多的非营利研究机构中,位于美国新墨西哥州的圣菲研究所以研究复杂系统科学闻名。在《复杂》这本书中,美国科学作家...
阅读原文

RNN效率媲美Transformer,谷歌新架构两:同等规模强于Mamba

机器之心报道 机器之心编辑部去年 12 月,新架构 Mamba 引爆了 AI 圈,向屹立不倒的 Transformer 发起了挑战。如今,谷歌 DeepMind「Hawk 」和「Griffin 」的...
阅读原文

大一统视频编辑框架:浙大&微软推出UniEdit,无须训练、支持多种编辑场景

机器之心专栏 机器之心编辑部随着 Sora 的爆火,人们看到了 AI 视频生成的巨大潜力,对这一领域的关注度也越来越高。 除了视频生成,在现实生活中,如何对视...
阅读原文

今日arXiv最热大模型论文:谷歌最新研究,将LLM用于回归分析任务,显著超越传统模型

夕小瑶科技说 原创编辑 | 松果 引言:探索语言模型在回归分析中的应用回归分析是一个强大的工具,能够准确预测系统或模型的结果指标,给定一组参数。然而,传...
阅读原文

ControlNet作者又出新作:百万数据训练,AI图像生成迎来图层设计

机器之心报道 编辑:陈萍、杜伟有人表示:「等待已久的 AI 图像创建功能终于迎来了图层!」尽管用于生成图像的大模型已经成为计算机视觉和图形学的基础,但令...
阅读原文
14567813