标签:模型
两会热议:工作报告提出的“人工智能+”行动如何在各行业落地?
自去年底“新质生产力”正式写入中央文件以来,这一概念已经成为我国数字经济高频词,同时也是今年两会上的讨论热词。所谓“新质生产力”是相对于传统生产力而言...
一文看尽297篇文献!中科院领衔发表首篇「基于扩散模型的图像编辑」综述
新智元报道编辑:LRS 【新智元导读】AIGC大模型最火热的任务之一——基于Diffusion Model的图像编辑(editing)领域的首篇综述,长达26页,涵盖297篇文献!本文...
Claude 3相比GPT-4到底强在哪?我整理了一份总结
大数据文摘授权转载自夕小瑶科技说作者:智商掉了一地 在 AI 领域,大模型的竞争日益激烈,每一次技术的迭代都在推动着智能生成的边界不断拓展。距离 Sora 震...
「还是谷歌好」,离职创业一年,我才发现训练大模型有这么多坑
机器之心报道 编辑:蛋酱、小舟Karpathy:中肯的,一针见血的。 如何在不到一年的时间里创办一家公司、筹集资金、购买芯片,并搭建出追赶 Gemini pro/GPT 3.5...
Sora 时代的 AI 视频生成何去何从?
Sora 作为 OpenAI 最新发布的视频生成模型,在全球范围内引起了热烈讨论。距离上一个引发全民讨论的视频生成模型 Pika 1.0 的发布,不到三个月的时间。Sora ...
全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA
机器之心专栏 机器之心编辑部半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。 沿袭 ViT 的研究思路,我们能...
ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP
机器之心专栏 作者:邵文琪模型量化是模型压缩与加速中的一项关键技术,其将模型权重与激活值量化至低 bit,以允许模型占用更少的内存开销并加快推理速度。对...
消费级显卡可用!李开复零一万物发布并开源90亿参数Yi模型,代码数学能力史上最强
丰色 发自 凹非寺量子位 | 公众号 QbitAI李开复旗下AI公司零一万物,又一位大模型选手登场: 90亿参数Yi-9B。 它号称Yi系列中的“理科状元”,“恶补”了代码数学...
中科院等万字详解:最前沿图像扩散模型综述
黄健成 投稿量子位 | 公众号 QbitAI针对图像编辑中的扩散模型,中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。 全文长达26页,共1.5万余词,涵盖2...
人大系初创与OpenAI三次“撞车”:类Sora架构一年前已文
金磊 衡宇 发自 凹非寺量子位 | 公众号 QbitAISora一出,诸多创业公司的命运因之改变。 我们最近听说了个超级戏剧性的故事,就在中国,就是中关村的一家创业...
谷歌被曝翻车:内部群龙无首,生图机制过分“多元化”
西风 发自 凹非寺量子位 | 公众号 QbitAI谷歌Gemini文生图风波还未平,更劲爆的内幕消息又被曝出来了。 Pirate Wires爆料,Gemini这次的翻车,谷歌内部此前并...
Claude 3 相比 GPT-4 到底强在哪?我整理了一份总结
夕小瑶科技说 原创作者 | 智商掉了一地 在 AI 领域,大模型的竞争日益激烈,每一次技术的迭代都在推动着智能生成的边界不断拓展。 距离 Sora 震惊行业内外仅...
今日arXiv最热大模型论文:哈工深新研究发现!无需额外资源,SelectIT方法助力大语言模型精准调优
夕小瑶科技说 原创作者 | 松果 引言:指令调优在大型语言模型中的重要性在当今的人工智能领域,大语言模型(LLMs)已经成为了研究的热点,它们在理解指令和解...
如何缩小中美通用大模型差距? 我在两会看到了答案
白交 发自 凹非寺量子位 | 公众号 QbitAI“通用大模型关乎国运之争”…… “人工智能+”首次出现在政府工作报告中,并直接上升为一种行动。 雷军刘庆峰等代表委员都...
Claude 3“自我认知”引爆,马斯克坐不住了,OpenAI被曝还有后手
梦晨 发自 凹非寺量子位 | 公众号 QbitAIClaude 3问世超过24小时,还在不断刷新人们的认知。 学量子物理的博士大哥快疯了,因为Claude 3是仅有的几个能理解他...