标签:模型
AI数据训AI,引发模型大崩溃!牛津剑桥最新研究,登上Nature发警告
夕小瑶科技说 原创作者 | 谷雨龙泽我们都知道,AI大模型是需要现成的数据来训练,只有喂给AI大量的数据,AI才能“学富五车”。为此,不少AI模型在研发的时候,...
GPT-4o 最关键功能本周上线,语音交互的时代终于要来了
Voice Agent 是与人类进行对话沟通的 AI,是下一代人机交互界面。和文本相比,声音交互的优势主要体现在: • 语音交互以其与人类自然沟通方式的高度一致性,...
Karpathy:用表情包解释一下,为什么AI数不清Strawberry几个 r?
还记得这些天大模型被揪出来的低级错误吗? 不知道 13.11 和 13.8哪个大,数不清 Strawberry 单词里面有多少个 r…… 每每被发现一个弱点,大模型都只能接受人...
1亿元模型券来了!北京发布AI新政策,76次提及“大模型”
最高奖励5000万元!北京“人工智能+”行动计划发布。 作者|李水青 编辑|心缘 智东西7月29日消息,7月26日,北京市发展和改革委员会、北京市经济和信息化局等多...
上海 AI Lab多篇顶会成果!涉及ECCV 2024 满分评审、机器人版「斯坦福小镇」桃源 | 讲座预告
「智猩猩机器人新青年讲座」由AI与硬科技知识分享社区智猩猩全新企划,致力于邀请全球知名高校、顶尖研究机构以及优秀企业的青年学者,主讲在具身智能、强化...
GPT-4o mini凭什么登顶竞技场?OpenAI刷分秘诀被扒,原来奥特曼早有暗示
明敏 发自 凹非寺量子位 | 公众号 QbitAI为啥GPT-4o mini能登顶大模型竞技场?? 原来是OpenAI会刷分呀。 这两天,lmsys竞技场公布了一份充满争议的榜单。其...
Llama3.1训练平均3小时故障一次,H100万卡集群好脆弱,气温波动都会影响吞吐量
西风 发自 凹非寺量子位 | 公众号 QbitAI每3个小时1次、平均1天8次,Llama 3.1 405B预训练老出故障,H100是罪魁祸首? 最近有人从Meta发布的92页超长Llama 3....
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
RecDiff团队投稿量子位 | 公众号 QbitAI用扩散模型搞社交信息推荐,怎么解决数据噪声难题?现有的一些自监督学习方法效果还是有限。 针对此,港大数据智能实...
训练一次经历 419 次意外故障!英伟达 GPU 也差点玩不转 405B 模型,全靠 Meta 工程师后天救场!
整理 | 华卫 最近,Meta 在一份研究报告中揭示了训练 Llama 3 405B 参数模型的重大挑战:该系统在包含 16384 个 Nvidia H100 GPU 的集群上运行,在训练期间...
人力、资金成本大幅下降,最早上车 Agent 的企业已经开始获益
作者 | 钰莹 Agent 太火了!在生成式 AI 浪潮之后,Agent 被广泛称为是“这一波浪潮中最先落地”的应用。“至少有 100 个项目正致力于将 AI 代理商业化,近 10 ...
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
新智元报道编辑:乔杨 好困 【新智元导读】适逢Llama 3.1模型刚刚发布,英伟达就发表了一篇技术博客,手把手教你如何好好利用这个强大的开源模型,为领域模型...
日均tokens使用量超5000亿,AI生图玩法猛猛上新:豆包大模型为什么越来越「香」了?
机器之心报道 作者:蛋酱2024 年的 AI 图像生成技术,又提升到了一个新高度。 技术的飞速迭代,让这一领域的商业化落地进入加速阶段。前有 Midjourney v6 史...
1890美元,就能从头训练一个还不错的12亿参数扩散模型
机器之心报道 编辑:张倩、陈陈只用1890美元、3700 万张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训...
关于大模型「越狱」的多种方式,有这些防御手段
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
小模型狂飙!6家巨头争相发布小模型,Andrej Karpathy:大语言模型的尺寸竞争正在倒退…
夕小瑶科技说 原创作者 | 21#过去一周,可谓是小模型战场最疯狂的一周,商业巨头改变赛道,向大模型say byebye~。 OpenAI、Apple、Mistral等“百花齐放”,纷纷...