标签:变体

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回

克小西 发自 凹非寺量子位 | 公众号 QbitAIo1-preview终于赢过了mini一次! 亚利桑那州立大学的最新研究表明,o1-preview在规划任务上,表现显著优于o1-mini...
阅读原文

当代版木牛流马?国外网友造出「会走路的桌子」,引百万人围观

机器之心报道 机器之心编辑部你想喝瓶啤酒,于是就把桌子叫了过来。这不是吃了菌子才有的场景,而是国外网友的一项发明,名叫 Carpentopod。整个桌子有 12 条...
阅读原文

英伟达下一代GPU泄露!RTX 5080比4090提升10%,5090功耗高达600W

新智元报道编辑:好困 【新智元导读】根据最新泄露的数据,英伟达GeForce RTX 5080的功耗或将提升至400W,并在部分性能上达到RTX 4090的110%!而RTX 5090的功...
阅读原文

AI填补蛋白质设计一大空白,或揭秘癌症、痴呆症发病机制,促进新药发现和生物材料研发

大数据文摘授权转载自学术头条 中风、痴呆症等神经系统疾病是致病、致残的主要原因之一,据世界卫生组织(WHO)报道,全球有超过三分之一的人口遭受这类疾病...
阅读原文

新PyTorch API:几行代码实现不同注意力变体,兼具FlashAttention性能和PyTorch灵活性

机器之心报道 编辑:陈陈用 FlexAttention 尝试一种新的注意力模式。理论上,注意力机制就是你所需要的一切。然而在实际操作中,我们还需要优化像 FlashAtten...
阅读原文

ACL 2024 | 对25个开闭源模型数学评测,GPT-3.5-Turbo才勉强及格

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

Llama 3上线4天,井喷1000多个变种!中文版也有了!Groq上推理速度800token每秒

大数据文摘授权自夕小瑶科技说作者:Zicy 4月19号,Meta发布了其最新的大型语言模型Llama 3的早期版本,反响热烈,短短4天,就有了1000多个变种,而且这个数...
阅读原文

Llama 3 上线4天,井喷1000多个变种!中文版也有了!Groq上推理速度800token每秒

夕小瑶科技说 原创作者 | Zicy4月19号,Meta发布了其最新的大型语言模型Llama 3的早期版本,反响热烈,短短4天,就有了1000多个变种,而且这个数字还在持续增...
阅读原文

详解Latte:去年底上线的全球首个开源文生视频DiT

机器之心专栏 机器之心编辑部随着 Sora 的成功发布,视频 DiT 模型得到了大量的关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域的研究重点。DiT [...
阅读原文

生成速度快SDXL一倍,9GB GPU也能运行,Stable Cascade来搞性价比了

机器之心报道 编辑:大盘鸡硬件要求越来越低,生成速度越来越快。Stability AI 作为文本到图像的「元老」,不仅在引领该领域的潮流方向,也在模型质量上一次...
阅读原文

Meta对Transformer架构下手了:新注意力机制更懂推理

机器之心报道编辑:杜伟、陈萍作者表示,这种全新注意力机制(Sytem 2 Attention)或许你也需要呢。大型语言模型(LLM)很强已经是一个不争的事实,但它们有...
阅读原文

重新审视Transformer:倒置更有效,真实世界预测的新SOTA出现了

机器之心报道编辑:大盘鸡反转 Transformer,变成 iTransformer。Transformer 在时间序列预测中出现了强大能力,可以描述成对依赖关系和提取序列中的多层次表...
阅读原文

两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速

机器之心报道编辑:张倩模型小了,幻觉还减轻了。前段时间,「霉霉大秀中文」的视频在各个社交媒体走红,随后又出现了「郭德纲大秀英语」等类似视频。这些视...
阅读原文