标签：模型

AI数据训AI，引发模型大崩溃！牛津剑桥最新研究，登上Nature发警告

夕小瑶科技说原创作者 | 谷雨龙泽我们都知道，AI大模型是需要现成的数据来训练，只有喂给AI大量的数据，AI才能“学富五车”。为此，不少AI模型在研发的时候，...

阅读原文

AIGC动态

2年前 (2024)

GPT-4o 最关键功能本周上线，语音交互的时代终于要来了

Voice Agent 是与人类进行对话沟通的 AI，是下一代人机交互界面。和文本相比，声音交互的优势主要体现在： • 语音交互以其与人类自然沟通方式的高度一致性，...

阅读原文

AIGC动态

2年前 (2024)

Karpathy：用表情包解释一下，为什么AI数不清Strawberry几个 r？

还记得这些天大模型被揪出来的低级错误吗？不知道 13.11 和 13.8哪个大，数不清 Strawberry 单词里面有多少个 r…… 每每被发现一个弱点，大模型都只能接受人...

阅读原文

AIGC动态

2年前 (2024)

1亿元模型券来了！北京发布AI新政策，76次提及“大模型”

最高奖励5000万元！北京“人工智能+”行动计划发布。作者|李水青编辑|心缘智东西7月29日消息，7月26日，北京市发展和改革委员会、北京市经济和信息化局等多...

阅读原文

AIGC动态

2年前 (2024)

上海 AI Lab多篇顶会成果！涉及ECCV 2024 满分评审、机器人版「斯坦福小镇」桃源 | 讲座预告

「智猩猩机器人新青年讲座」由AI与硬科技知识分享社区智猩猩全新企划，致力于邀请全球知名高校、顶尖研究机构以及优秀企业的青年学者，主讲在具身智能、强化...

阅读原文

AIGC动态

2年前 (2024)

扩散模型也能搞定社交信息推荐，港大数据智能实验室提出RecDiff

RecDiff团队投稿量子位 | 公众号 QbitAI用扩散模型搞社交信息推荐，怎么解决数据噪声难题？现有的一些自监督学习方法效果还是有限。针对此，港大数据智能实...

阅读原文

AIGC动态

2年前 (2024)

GPT-4o mini凭什么登顶竞技场？OpenAI刷分秘诀被扒，原来奥特曼早有暗示

明敏发自凹非寺量子位 | 公众号 QbitAI为啥GPT-4o mini能登顶大模型竞技场？？原来是OpenAI会刷分呀。这两天，lmsys竞技场公布了一份充满争议的榜单。其...

阅读原文

AIGC动态

2年前 (2024)

Llama3.1训练平均3小时故障一次，H100万卡集群好脆弱，气温波动都会影响吞吐量

西风发自凹非寺量子位 | 公众号 QbitAI每3个小时1次、平均1天8次，Llama 3.1 405B预训练老出故障，H100是罪魁祸首？最近有人从Meta发布的92页超长Llama 3....

阅读原文

AIGC动态

2年前 (2024)

训练一次经历 419 次意外故障！英伟达 GPU 也差点玩不转 405B 模型，全靠 Meta 工程师后天救场！

整理 | 华卫最近，Meta 在一份研究报告中揭示了训练 Llama 3 405B 参数模型的重大挑战：该系统在包含 16384 个 Nvidia H100 GPU 的集群上运行，在训练期间...

阅读原文

AIGC动态

2年前 (2024)

人力、资金成本大幅下降，最早上车 Agent 的企业已经开始获益

作者 | 钰莹 Agent 太火了！在生成式 AI 浪潮之后，Agent 被广泛称为是“这一波浪潮中最先落地”的应用。“至少有 100 个项目正致力于将 AI 代理商业化，近 10 ...

阅读原文

AIGC动态

2年前 (2024)

英伟达最新技术分享：手把手教你用Llama 3.1合成数据改进模型！附代码

新智元报道编辑：乔杨好困【新智元导读】适逢Llama 3.1模型刚刚发布，英伟达就发表了一篇技术博客，手把手教你如何好好利用这个强大的开源模型，为领域模型...

阅读原文

AIGC动态

2年前 (2024)

日均tokens使用量超5000亿，AI生图玩法猛猛上新：豆包大模型为什么越来越「香」了？

机器之心报道作者：蛋酱2024 年的 AI 图像生成技术，又提升到了一个新高度。技术的飞速迭代，让这一领域的商业化落地进入加速阶段。前有 Midjourney v6 史...

阅读原文

AIGC动态

2年前 (2024)

1890美元，就能从头训练一个还不错的12亿参数扩散模型

机器之心报道编辑：张倩、陈陈只用1890美元、3700 万张图像，就能训练一个还不错的扩散模型。现阶段，视觉生成模型擅长创建逼真的视觉内容，然而从头开始训...

阅读原文

AIGC动态

2年前 (2024)

关于大模型「越狱」的多种方式，有这些防御手段

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

小模型狂飙！6家巨头争相发布小模型，Andrej Karpathy：大语言模型的尺寸竞争正在倒退…

夕小瑶科技说原创作者 | 21#过去一周，可谓是小模型战场最疯狂的一周，商业巨头改变赛道，向大模型say byebye~。 OpenAI、Apple、Mistral等“百花齐放”，纷纷...

阅读原文

AIGC动态

2年前 (2024)

1…112 113114115 116…483