标签:模型

小米大模型提效新框架:训练最高提速34%,推理最高提速52%!Kaldi之父合作出品

直播预告 | 6月25日晚7点,「智猩猩机器人新青年讲座」第9讲正式开讲,UMass Amherst在读博士周沁泓将直播讲解《在具身智能模拟器中针对动态灾害进行具身决策...
阅读原文

5 秒生成高质量文章,Llama 3-Chinese-Chat Demo 一键启动!

Llama 3 自发布以来备受关注,并被誉为「迄今为止最好的开源大模型」,但 Llama 3 在支持中文方面仍然存在一些问题,比如在使用中文提问时,经常发生英文回复...
阅读原文

姚班天才组队开发《完蛋!我被大模型包围了》续作!专为工作日摸鱼爱好者打造

梦晨 衡宇 发自 凹非寺量子位 | 公众号 QbitAI姚班天才组队开发大模型原生应用,一个工作日摸鱼好物悄悄上线。 背后竟是爆火前作《完蛋!我被大模型包围了》...
阅读原文

小红书怎么用大模型?顶会作者在线等你来聊

允中 发自 凹非寺量子位 | 公众号 QbitAI大模型正引领新一轮的研究热潮,业界和学术界都涌现出了众多的创新成果。 小红书技术团队也在这一浪潮中不断探索,多...
阅读原文

大模型测试题爆火,GPT-4和Claude3都跪了,LeCun转发:新Benchmark

克雷西 发自 凹非寺量子位 | 公众号 QbitAI一项新的“大模型Benchmark”在推特上爆火,LeCun也点赞转发了! 而且无论是GPT-4还是Claude 3,面对它都如同被夺了...
阅读原文

编码数学击败GPT4-Turbo!DeepSeek-Coder-v2登顶竞技场最强开源编码模型

一水 发自 凹非寺量子位 | 公众号 QbitAI就在刚刚,竞技场排名再次刷新: 深度求索DeepSeek-Coder-v2成竞技场最强开源编码模型! 它在Coding Arena中已攀升至...
阅读原文

图解智能和意识基本原理的“飞行模型”

作者:刘锋 随着本世纪以来人工智能的快速发展,其对人类社会的影响也越来越大,对于通用智能何时实现、人工智能是否能产生自我意识,人工智能未来的研究方...
阅读原文

视觉 AI 的「Foundation Model」,已经发展到哪一步?丨CVPR 2024 现场直击

CVPR 不再只是一个纯粹的学术会议,也是产业发展的嗅觉源。作者|房晓楠 编辑|陈彩娴 2024 年美国时间 6 月 17 日至 21 日,IEEE 国际计算机视觉与模式识别...
阅读原文

StabilityAI获超1亿美元投资并任命新CEO;月之暗面称没有开发海外产品计划;GPT-5将在一年半后发布丨AI情报局

01 融资快报Stability AI 获超 1 亿美元投资并任命新的 CEO:The Information消息,Stability AI 已任命 Prem Akkaraju 为新任首席执行官。视觉特效公司维塔 ...
阅读原文

1个芯片顶英伟达3个?这个偏爱的创始人爆肝8年,终于等来抢英伟达泼天富贵的一天!

整理 | 褚杏娟、核子可乐 据报道,在 AI 领域与英伟达正面竞争的高性能计算机芯片初创公司 Cerebras Systems 已经向美国证券监管机构提交了保密文件,准备在...
阅读原文

AI视频技术突破静默,让每一帧画面实现声色同步 | 大模型一周大事

大模型的快节奏发展,让了解最新技术动态、积极主动学习成为每一位从业者的必修课。InfoQ 研究中心期望通过每周更新大模型行业最新动态,为广大读者提供全面...
阅读原文

最新!何恺明团队发布:打破自回归图像生成瓶颈,告别矢量量化

夕小瑶科技说 原创作者 | 21#近日,深度学习领域的杰出研究者何恺明及其团队又放了个大招,推出其团队最新研究工作,在AI研究领域引起了广泛关注。 何恺明202...
阅读原文

今日arXiv最热大模型论文:大模型对齐告别微调,直接编辑表征空间即可解决

夕小瑶科技说 原创作者 | Richard人工智能技术正在飞速发展,尤其是大语言模型在自然语言处理领域取得了令人瞩目的成就。但同时,我们也面临着如何让语言模型...
阅读原文

240万亿巨量数据被洗出,足够训出18个GPT-4!全球23所机构联手,清洗秘籍公开

新智元报道编辑:编辑部 【新智元导读】是时候把数据Scale Down了!Llama 3揭示了这个可怕的事实:数据量从2T增加到15T,就能大力出奇迹,所以要想要有GPT-3...
阅读原文

微软Florence-2官宣开源,一统视觉基础模型!华人团队联手打造

新智元报道编辑:桃子 【新智元导读】等了半年,微软视觉基础模型Florence-2终于开源了。它能够根据提示,完成字幕、对象检测、分割等各种计算机视觉和语言的...
阅读原文