标签:作者
当代版木牛流马?国外网友造出「会走路的桌子」,引百万人围观
机器之心报道 机器之心编辑部你想喝瓶啤酒,于是就把桌子叫了过来。这不是吃了菌子才有的场景,而是国外网友的一项发明,名叫 Carpentopod。整个桌子有 12 条...
LIama 3+Mamba强强联手!蒸馏到线性RNN,推理速度提升1.6倍
克雷西 发自 凹非寺量子位 | 公众号 QbitAI把Llama 3蒸馏到Mamba,推理速度最高可提升1.6倍! 而且性能不减,甚至表现比原始模型还要优异。 这是来自Together...
斯坦福最新理论研究:RLHF中奖励过度优化现象也存在Scaling Laws
大数据文摘授权转载自将门创投 作者:seven_ 可以说,人类反馈强化学习 (RLHF) 是一把解锁大型语言模型(LLMs)涌现能力的金钥匙。它使拥有庞大参数规模的语言...
顶会审稿人紧缺,我审我自己!ICML 2023排序实验结果出炉:作者自评能提升评审质量吗?
新智元报道编辑:LRST 【新智元导读】宾夕法尼亚大学苏炜杰教授团队在ICML 2023会议中进行实验显示,经过作者自评校准后,审稿分数的误差降低超过20%。近年来...
大模型边推理边纠错,有可能做到吗?这是ICML爆火的演讲
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
AI证件照神器登GitHub热榜,内置考研考公签证模版一键生成
一水 发自 凹非寺量子位 | 公众号 QbitAI最近,这个AI证件照神器狠狠火了~ 本·漫不经心上传了一张哈利波特的照片,结果啪的一下,一张蓝底证件照就生成了! ...
LLM 推理框架之上:10 种常见 LLM 推理系统总结
9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京辽宁大厦盛大举行。峰会设有开幕式、数据中心AI芯片专场、AI芯片架构创新专场、边缘/端侧AI芯片专场、...
Runway删库跑路,真的run away了!
夕小瑶科技说 原创作者 | 海野没有任何通知,Runway在Hugging Face上的内容全部删除了! 目前具体原因不明。Runway的主页只留下了一句话: 我们不再对Hugging...
幻方AI ESFT:针对 MoE 的高效微调方案,媲美全参微调
生成式AI时代最火AI芯片峰会下月来袭!9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京盛大举行。峰会设有开幕式、数据中心AI芯片专场、边缘/端侧AI芯...
LLaMA 3 背后的大规模 GPU 集群 RoCE 网络建设
生成式AI时代最火AI芯片峰会下月来袭!9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京盛大举行。峰会设有开幕式、数据中心AI芯片专场、边缘/端侧AI芯...
ACL 2024大奖揭晓!全华人团队用AI破解3000年前甲骨文密码
新智元报道编辑:编辑部 【新智元导读】一年一度NLP顶会ACL揭晓了最终获奖论文。今年,共有7篇论文荣获最佳论文,时间检验奖颁给斯坦福GloVe、康奈尔大学相似...
ACL 2024奖项公布:华科大破译甲骨文最佳论文之一、GloVe时间检验奖
机器之心报道 机器之心编辑部本届 ACL 大会,投稿者「收获满满」。为期六天的 ACL 2024 正在泰国曼谷举办。ACL 是计算语言学和自然语言处理领域的顶级国际会...
万字综述:全面梳理 FP8 训练和推理技术
大模型时代最火AI芯片峰会来啦!!9月6-7日,由智猩猩联合主办的2024全球AI芯片峰会将在北京举行。峰会设有数据中心AI芯片、智算集群技术论坛等7大板块。目前...
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
新智元报道编辑:alan 【新智元导读】近日,来自加州大学尔湾分校等机构的研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美...
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
新智元报道编辑:LRST 好困 【新智元导读】多模态大语言模型(MLLM)在医学视觉问答(VQA)领域展现出巨大潜力,通过提供针对医学图像的具体临床问题的回答,...