标签:模型

港中文联合MIT提出超长上下文LongLoRA大模型微调算法

大数据文摘受权转载自将门创投 现阶段,上下文窗口长度基本上成为了评估LLM能力的硬性指标,上下文的长度越长,代表大模型能够接受的用户要求越复杂,近期Ope...
阅读原文

今日arXiv最热NLP大模型论文:上海AI Lab联合清华发布十项全能数学大模型InternLM-Math

夕小瑶科技说 原创作者 | 芒果、Python引言:数学推理与大语言模型的新突破数学推理能力是大语言模型(LLMs)抽象推理能力的一个重要体现。近年来,随着深度...
阅读原文

为什么 OpenAI 能够制作出 GPT 和 Sora?

Hello大家好,我是 JioNLP。 OpenAI 放了一个核弹级的模型Sora,把文生视频带到了新的高度。从去年的 gpt 到今年的 sora。整个 AI 界的最顶尖、最令人叹为观...
阅读原文

过年8天AI圈变天!56件生成式AI要闻一文看尽,OpenAI谷歌英伟达齐放大招

02/10~02/17 全球AIGC产业要闻 开工大吉! 在刚刚过去的八天春节假期里,生成式AI继续上大分。 OpenAI成为春节期间的“话题之王” 。其于2月16日凌晨推出首款文...
阅读原文

群魔乱舞:MoE大模型详解

700个开发硬件免费申请➕现金大奖!生成式 AI、机器人 AI、PC AI 三大赛道!AMD Pervasive AI 开发者挑战赛报名火热进行中,扫码了解详情并报名~导读本文是知...
阅读原文

7 万亿美元的芯片融资计划,Sam Altman 看到了什么,在害怕什么?

上周,来自《华尔街日报》的报道,Sam Altman 正在与包括阿联酋政府在内的投资者进行谈判,筹集高达 7 万亿美元的资金,以增加全球半导体芯片的供应。 看上去...
阅读原文

Sora 面世,视频生成的 GPT-3 时刻来了

短视频生成模型的比拼中,谁能拔得头筹?作者丨王悦、郭思、赖文昕 编辑丨陈彩娴 2月16日凌晨,正值中国春节法定节假日期间,OpenAI 毫无预兆地发布了 AI 视...
阅读原文

海马体掌管记忆的神,我是你的破壁人 | 追问顶刊

▷本文为追问特约长文,7000字,阅读需17min。建议收藏或转发朋友圈,分多次阅读,愿有所收获。本文已开快捷转载,如需另外开白,还请留言。记忆是如何形成的...
阅读原文

张一鸣被立功德碑,现已拆除;OpenAI、谷歌同天打擂,谁赢了?字节调集多位高管参战AI,将发布数款重磅产品|AI周报

整理 | 褚杏娟张一鸣被家乡立功德碑,现已拆除;OpenAI Sora 刷屏众大佬点赞,其更强大功能曝光 ; 谷歌推出 Gemini 1.5 版本:可处理 100 万 token;字节 AI ...
阅读原文

LeCun怒斥Sora不能理解物理世界!Meta首发AI视频「世界模型」V-JEPA

新智元报道编辑:桃子 好困 【新智元导读】短短几天,「世界模型」雏形相继诞生,AGI真的离我们不远了?Sora之后,LeCun首发AI视频预测架构V-JEPA,能够以人...
阅读原文

OpenAI Sora核心技术,被曝缝合自DeepMind和谢赛宁论文?机器模拟人类世界迈出第一步

新智元报道编辑:编辑部 【新智元导读】为何Sora会掀起滔天巨浪?Sora的技术,就是机器模拟我们世界的下一步。而且今天有人扒出,Sora创新的核心秘密时空Patc...
阅读原文

离开OpenAI待业的Karpathy做了个大模型新项目,Star量一日破千

机器之心报道 编辑:杜伟没工作也要「卷」。闲不下来的 Andrej Karpathy 又有了新项目! 过去几天,OpenAI 非常热闹,先有 AI 大牛 Andrej Karpathy 官宣离职...
阅读原文

后Sora时代,CV从业者如何选择模型?卷积还是ViT,监督学习还是CLIP范式

机器之心报道 编辑:蛋酱如何衡量一个视觉模型?又如何选择适合自己需求的视觉模型?MBZUAI和Meta的研究者给出了答案。一直以来,ImageNet 准确率是评估模型...
阅读原文

PRO | 多模态趋势下,Transformer并非主流架构唯一解

2023年,几乎 AI 的每个领域都在以前所未有的速度进化,同时,AI也在不断地推动着具身智能、自动驾驶等关键赛道的技术边界。 多模态趋势下,Transformer 作为...
阅读原文

让视觉语言模型搞空间推理,谷歌又整新活了

机器之心报道 机器之心编辑部视觉语言模型虽然强大,但缺乏空间推理能力,最近 Google 的新论文说它的 SpatialVLM 可以做,看看他们是怎么做的。视觉语言模型...
阅读原文