标签:作者

当代版木牛流马?国外网友造出「会走路的桌子」,引百万人围观

机器之心报道 机器之心编辑部你想喝瓶啤酒,于是就把桌子叫了过来。这不是吃了菌子才有的场景,而是国外网友的一项发明,名叫 Carpentopod。整个桌子有 12 条...
阅读原文

LIama 3+Mamba强强联手!蒸馏到线性RNN,推理速度提升1.6倍

克雷西 发自 凹非寺量子位 | 公众号 QbitAI把Llama 3蒸馏到Mamba,推理速度最高可提升1.6倍! 而且性能不减,甚至表现比原始模型还要优异。 这是来自Together...
阅读原文

斯坦福最新理论研究:RLHF中奖励过度优化现象也存在Scaling Laws

大数据文摘授权转载自将门创投 作者:seven_ 可以说,人类反馈强化学习 (RLHF) 是一把解锁大型语言模型(LLMs)涌现能力的金钥匙。它使拥有庞大参数规模的语言...
阅读原文

顶会审稿人紧缺,我审我自己!ICML 2023排序实验结果出炉:作者自评能提升评审质量吗?

新智元报道编辑:LRST 【新智元导读】宾夕法尼亚大学苏炜杰教授团队在ICML 2023会议中进行实验显示,经过作者自评校准后,审稿分数的误差降低超过20%。近年来...
阅读原文

大模型边推理边纠错,有可能做到吗?这是ICML爆火的演讲

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

AI证件照神器登GitHub热榜,内置考研考公签证模版一键生成

一水 发自 凹非寺量子位 | 公众号 QbitAI最近,这个AI证件照神器狠狠火了~ 本·漫不经心上传了一张哈利波特的照片,结果啪的一下,一张蓝底证件照就生成了! ...
阅读原文

LLM 推理框架之上:10 种常见 LLM 推理系统总结

9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京辽宁大厦盛大举行。峰会设有开幕式、数据中心AI芯片专场、AI芯片架构创新专场、边缘/端侧AI芯片专场、...
阅读原文

Runway删库跑路,真的run away了!

夕小瑶科技说 原创作者 | 海野没有任何通知,Runway在Hugging Face上的内容全部删除了! 目前具体原因不明。Runway的主页只留下了一句话: 我们不再对Hugging...
阅读原文

幻方AI ESFT:针对 MoE 的高效微调方案,媲美全参微调

生成式AI时代最火AI芯片峰会下月来袭!9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京盛大举行。峰会设有开幕式、数据中心AI芯片专场、边缘/端侧AI芯...
阅读原文

LLaMA 3 背后的大规模 GPU 集群 RoCE 网络建设

生成式AI时代最火AI芯片峰会下月来袭!9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京盛大举行。峰会设有开幕式、数据中心AI芯片专场、边缘/端侧AI芯...
阅读原文

ACL 2024大奖揭晓!全华人团队用AI破解3000年前甲骨文密码

新智元报道编辑:编辑部 【新智元导读】一年一度NLP顶会ACL揭晓了最终获奖论文。今年,共有7篇论文荣获最佳论文,时间检验奖颁给斯坦福GloVe、康奈尔大学相似...
阅读原文

ACL 2024奖项公布:华科大破译甲骨文最佳论文之一、GloVe时间检验奖

机器之心报道 机器之心编辑部本届 ACL 大会,投稿者「收获满满」。为期六天的 ACL 2024 正在泰国曼谷举办。ACL 是计算语言学和自然语言处理领域的顶级国际会...
阅读原文

万字综述:全面梳理 FP8 训练和推理技术

大模型时代最火AI芯片峰会来啦!!9月6-7日,由智猩猩联合主办的2024全球AI芯片峰会将在北京举行。峰会设有数据中心AI芯片、智算集群技术论坛等7大板块。目前...
阅读原文

比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型

新智元报道编辑:alan 【新智元导读】近日,来自加州大学尔湾分校等机构的研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美...
阅读原文

21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA

新智元报道编辑:LRST 好困 【新智元导读】多模态大语言模型(MLLM)在医学视觉问答(VQA)领域展现出巨大潜力,通过提供针对医学图像的具体临床问题的回答,...
阅读原文
12311