标签:模型

两会热议:工作报告提出的“人工智能+”行动如何在各行业落地?

自去年底“新质生产力”正式写入中央文件以来,这一概念已经成为我国数字经济高频词,同时也是今年两会上的讨论热词。所谓“新质生产力”是相对于传统生产力而言...
阅读原文

一文看尽297篇文献!中科院领衔发表首篇「基于扩散模型的图像编辑」综述

新智元报道编辑:LRS 【新智元导读】AIGC大模型最火热的任务之一——基于Diffusion Model的图像编辑(editing)领域的首篇综述,长达26页,涵盖297篇文献!本文...
阅读原文

Claude 3相比GPT-4到底强在哪?我整理了一份总结

大数据文摘授权转载自夕小瑶科技说作者:智商掉了一地 在 AI 领域,大模型的竞争日益激烈,每一次技术的迭代都在推动着智能生成的边界不断拓展。距离 Sora 震...
阅读原文

「还是谷歌好」,离职创业一年,我才发现训练大模型有这么多坑

机器之心报道 编辑:蛋酱、小舟Karpathy:中肯的,一针见血的。 如何在不到一年的时间里创办一家公司、筹集资金、购买芯片,并搭建出追赶 Gemini pro/GPT 3.5...
阅读原文

Sora 时代的 AI 视频生成何去何从?

Sora 作为 OpenAI 最新发布的视频生成模型,在全球范围内引起了热烈讨论。距离上一个引发全民讨论的视频生成模型 Pika 1.0 的发布,不到三个月的时间。Sora ...
阅读原文

全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

机器之心专栏 机器之心编辑部半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。 沿袭 ViT 的研究思路,我们能...
阅读原文

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP

机器之心专栏 作者:邵文琪模型量化是模型压缩与加速中的一项关键技术,其将模型权重与激活值量化至低 bit,以允许模型占用更少的内存开销并加快推理速度。对...
阅读原文

消费级显卡可用!李开复零一万物发布并开源90亿参数Yi模型,代码数学能力史上最强

丰色 发自 凹非寺量子位 | 公众号 QbitAI李开复旗下AI公司零一万物,又一位大模型选手登场: 90亿参数Yi-9B。 它号称Yi系列中的“理科状元”,“恶补”了代码数学...
阅读原文

中科院等万字详解:最前沿图像扩散模型综述

黄健成 投稿量子位 | 公众号 QbitAI针对图像编辑中的扩散模型,中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。 全文长达26页,共1.5万余词,涵盖2...
阅读原文

人大系初创与OpenAI三次“撞车”:类Sora架构一年前已文

金磊 衡宇 发自 凹非寺量子位 | 公众号 QbitAISora一出,诸多创业公司的命运因之改变。 我们最近听说了个超级戏剧性的故事,就在中国,就是中关村的一家创业...
阅读原文

谷歌被曝翻车:内部群龙无首,生图机制过分“多元化”

西风 发自 凹非寺量子位 | 公众号 QbitAI谷歌Gemini文生图风波还未平,更劲爆的内幕消息又被曝出来了。 Pirate Wires爆料,Gemini这次的翻车,谷歌内部此前并...
阅读原文

Claude 3 相比 GPT-4 到底强在哪?我整理了一份总结

夕小瑶科技说 原创作者 | 智商掉了一地 在 AI 领域,大模型的竞争日益激烈,每一次技术的迭代都在推动着智能生成的边界不断拓展。 距离 Sora 震惊行业内外仅...
阅读原文

今日arXiv最热大模型论文:哈工深新研究发现!无需额外资源,SelectIT方法助力大语言模型精准调优

夕小瑶科技说 原创作者 | 松果 引言:指令调优在大型语言模型中的重要性在当今的人工智能领域,大语言模型(LLMs)已经成为了研究的热点,它们在理解指令和解...
阅读原文

如何缩小中美通用大模型差距? 我在两会看到了答案

白交 发自 凹非寺量子位 | 公众号 QbitAI“通用大模型关乎国运之争”…… “人工智能+”首次出现在政府工作报告中,并直接上升为一种行动。 雷军刘庆峰等代表委员都...
阅读原文

Claude 3“自我认知”引爆,马斯克坐不住了,OpenAI被曝还有后手

梦晨 发自 凹非寺量子位 | 公众号 QbitAIClaude 3问世超过24小时,还在不断刷新人们的认知。 学量子物理的博士大哥快疯了,因为Claude 3是仅有的几个能理解他...
阅读原文