标签:方法
大模型总结摘要靠谱吗?比人类写的流畅,用GPT-4幻觉还少
机器之心报道编辑:陈萍以后文本摘要总结任务,可以放心交给大模型了。文本摘要,作为自然语言生成(NLG)中的一项任务,主要用来将一大段长文本压缩为简短的...
大模型生成提速2倍!单GPU几小时搞定微调,北大数院校友共同一作丨开源
萧箫 发自 凹非寺量子位 | 公众号 QbitAI只需给大模型“加点小零件”,推理速度立刻提升2倍!不需要额外训练一个模型,也不需要对计算硬件做优化,单张A100最快...
ICCV 2023 Oral | 如何在开放世界进行测试段训练?基于动态原型扩展的自训练方法
机器之心报道机器之心编辑部本文首次提出一种针对开放世界的测试段训练方法。提高模型泛化能力是推动基于视觉的感知方法落地的重要基础,测试段训练和适应(T...
大模型为啥这么慢,原来是想多了:新方向是和人一样的思维算法
机器之心报道编辑:Panda组合人类推理之精妙与算法方法之精准,思维算法可助力 LLM 解决复杂问题。人类直觉是一种常被 AI 研究者忽视的能力,但其精妙程度连...
北航打破模态壁垒,跨可见光-红外模态的通用物理对抗攻击方法来了
机器之心专栏机器之心编辑部可见光 - 红外同步隐身。近年来,针对视觉感知系统安全性评估的探索逐步深入,先后有研究者成功实现基于眼镜、贴纸、衣服等不同载...
字节跳动李航:AI for Science的一些探索和进展
机器之心专栏作者:ByteDance Research负责人李航近年,人工智能的各个领域,包括自然语言处理、计算机视觉、语音处理,借助深度学习的强大威力,都取得了令...
AI for Science,字节跳动的一些探索和进展
来源:ScienceAI作者:ByteDance Research负责人李航概要近年,人工智能的各个领域,包括自然语言处理、计算机视觉、语音处理,借助深度学习的强大威力,都取...
苹果芯跑大模型不用降计算精度,投机采样杀疯了,GPT-4也在用
梦晨 发自 凹非寺量子位 | 公众号 QbitAI专攻代码的Code Llama一出,大家伙都盼着谁来后续量化瘦身一下,好在本地也能运行。果然是llama.cpp作者Georgi Gerga...
微软亚研提出TinyMIM,用知识蒸馏改进小型ViT
机器之心专栏微软亚洲研究院本文提出了 TinyMIM,它是第一个成功地使小模型受益于MIM预训练的模型。一、研究动机掩码建模(MIM, MAE)被证明是非常有效的自监...