标签：参数

马斯克怒告OpenAI案解密：Ilya看到了什么？125万亿参数Q*细节曝光，53页PDF全网疯转

新智元报道编辑：编辑部【新智元导读】现在，马斯克起诉OpenAI案的最大未解之谜，就集中在了「Ilya究竟看到了什么」上。他看到的东西，让OpenAI大震荡，所有...

阅读原文

AIGC动态

2年前 (2024)

53页PDF爆料OpenAI“AGI时间表”，爆料者：马斯克诉讼搅了局

克雷西发自凹非寺量子位 | 公众号 QbitAIOpenAI神秘的Q*计划，又有新鲜爆料。今天凌晨，一篇53页google文档开始在网络上热传，透露OpenAI“计划在2027年前...

阅读原文

AIGC动态

2年前 (2024)

清华、哈工大把大模型压缩到了1bit，把大模型放在手机里跑的愿望就快要实现了！

机器之心专栏机器之心编辑部近期，清华大学和哈尔滨工业大学联合发布了一篇论文：把大模型压缩到 1.0073 个比特时，仍然能使其保持约 83% 的性能！自从大模...

阅读原文

AIGC动态

2年前 (2024)

60行代码，从头开始构建GPT！最全实践指南来了

新智元报道编辑：桃子【新智元导读】GPT早已成为大模型时代的基础。国外一位开发者发布了一篇实践指南，仅用60行代码构建GPT。60行代码，从头开始构建GPT？ ...

阅读原文

AIGC动态

2年前 (2024)

微软6页论文爆火：三进制LLM，真香！

金磊发自凹非寺量子位 | 公众号 QbitAI现在，大语言模型（LLM）迎来了“1-bit时代”。这就是由微软和中国中科院大学在最新一项研究中所提出的结论—— 所有的L...

阅读原文

AIGC动态

2年前 (2024)

想训练类Sora模型吗？尤洋团队OpenDiT实现80%加速

机器之心报道机器之心编辑部作为 2024 开年王炸，Sora 的出现树立了一个全新的追赶目标，每个文生视频的研究者都想在最短的时间内复现 Sora 的效果。根据 O...

阅读原文

AIGC动态

2年前 (2024)

知名AI研究者深挖谷歌Gemma：参数不止70亿，设计原则很独特

机器之心报道编辑：陈萍、杜伟想要了解谷歌 Gemma 与 Llama 2、Mistral 有哪些异同吗？这篇文章值得一读。就在几天前，开源大模型领域迎来了重磅新玩家：谷...

阅读原文

AIGC动态

2年前 (2024)

用扩散模型生成网络参数，LeCun点赞尤洋团队新研究

机器之心报道机器之心编辑部如果你有被 Sora 生成的视频震撼到，那你就已经见识过扩散模型在视觉生成方面的巨大潜力。当然，扩散模型的潜力并不止步于此，它...

阅读原文

AIGC动态

2年前 (2024)

打入AI底层！NUS尤洋团队用扩散模型构建神经网络参数，LeCun点赞

克雷西发自凹非寺量子位 | 公众号 QbitAI扩散模型，迎来了一项重大新应用—— 像Sora生成视频一样，给神经网络生成参数，直接打入了AI的底层！这就是新加坡...

阅读原文

AIGC动态

2年前 (2024)

用扩散模型生成神经网络？NUS 尤洋团队：这不是开玩笑

Neural Network Diffusion，开始用魔法打败魔法了。作者丨赖文昕编辑丨郭思、陈彩娴说起扩散模型生成的东西，你会立刻想到什么？是OpenAI的经典牛油果椅子...

阅读原文

AIGC动态

2年前 (2024)

华为王云鹤：对“小”的大模型的优化重新思考

700个开发硬件免费申请➕现金大奖！生成式 AI、机器人 AI、PC AI 三大赛道！AMD Pervasive AI 开发者挑战赛报名火热进行中，扫码了解详情并报名～导读作者为华...

阅读原文

AIGC动态

2年前 (2024)

苹果极致LLM端侧方案：LLM in a flash

700个开发硬件免费申请➕现金大奖！生成式 AI、机器人 AI、PC AI 三大赛道！AMD Pervasive AI 开发者挑战赛报名火热进行中，扫码了解详情并报名～导读本文是知...

阅读原文

AIGC动态

2年前 (2024)

人类偏好优化算法哪家强？跟着高手一文学懂DPO、IPO和KTO

选自 huggingface.co/blog 作者：Kashif Rasul 等机器之心编译编辑：赵阳‍尽管收集人类对模型生成内容的相对质量的标签，并通过强化学习从人类反馈（RLHF）...

阅读原文

AIGC动态

2年前 (2024)

生成速度快SDXL一倍，9GB GPU也能运行，Stable Cascade来搞性价比了

机器之心报道编辑：大盘鸡硬件要求越来越低，生成速度越来越快。Stability AI 作为文本到图像的「元老」，不仅在引领该领域的潮流方向，也在模型质量上一次...

阅读原文

AIGC动态

2年前 (2024)

专访面壁曾国洋：踩过 1000 次大模型的坑后，造一个性能小钢炮

以小博大，面壁MiniCPM在大模型赛场上扔出了重磅炸弹。作者丨赖文昕、王悦编辑丨陈彩娴 2月1日，刚成立一年的面壁智能发布了两个在海内外大模型领域「炸裂级...

阅读原文

AIGC动态

2年前 (2024)

1…9 101112 13…16