标签:方法
CMU朱俊彦、Adobe新作:512×512图像推理,A100只用0.11秒
机器之心报道 编辑:陈萍、杜伟可玩性极强!简笔素描一键变身多风格画作,还能添加额外的描述,这在 CMU、Adobe 联合推出的一项研究中实现了。 作者之一为 CM...
如何从头开始编写LoRA代码,这有一份教程
选自 lightning.ai 作者:Sebastian Raschka 机器之心编译 编辑:陈萍作者表示:在各种有效的 LLM 微调方法中,LoRA 仍然是他的首选。LoRA(Low-Rank Adaptat...
可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」
新智元报道编辑:LRS 【新智元导读】利用文本生成图片(Text-to-Image, T2I)已经满足不了人们的需要了,近期研究在T2I模型的基础上引入了更多类型的条件来生...
COLING24|自适应剪枝让多模态大模型加速2-3倍,哈工大等推出SmartTrim
机器之心专栏 机器之心编辑部基于 Transformer 结构的视觉语言大模型(VLM)在各种下游的视觉语言任务上取得了巨大成功,但由于其较长的输入序列和较多的参数...
如何把大模型压缩到1bit?论文作者这样说
自从大模型火爆出圈以后,人们对压缩大模型的愿望从未消减。这是因为,虽然大模型在很多方面表现出优秀的能力,但高昂的部署代价极大提升了它的使用门槛。这...
今日arXiv最热大模型论文:超越LoRA,北京大学提出预训练模型非梯度优化法
夕小瑶科技说 原创编辑 | 松果 引言:探索大型语言模型中低秩适应的新方法在自然语言处理领域,大语言模型(LLMs)的迅猛发展带来了前所未有的性能提升。然而...
7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题
微软靠“想象力”解决大语言模型调用工具两大难题!方法已开源。 作者|徐珊 编辑|云鹏 智东西3月10日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出...
一文看尽297篇文献!中科院领衔发表首篇「基于扩散模型的图像编辑」综述
新智元报道编辑:LRS 【新智元导读】AIGC大模型最火热的任务之一——基于Diffusion Model的图像编辑(editing)领域的首篇综述,长达26页,涵盖297篇文献!本文...
全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA
机器之心专栏 机器之心编辑部半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。 沿袭 ViT 的研究思路,我们能...
ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP
机器之心专栏 作者:邵文琪模型量化是模型压缩与加速中的一项关键技术,其将模型权重与激活值量化至低 bit,以允许模型占用更少的内存开销并加快推理速度。对...
中科院等万字详解:最前沿图像扩散模型综述
黄健成 投稿量子位 | 公众号 QbitAI针对图像编辑中的扩散模型,中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。 全文长达26页,共1.5万余词,涵盖2...
今日arXiv最热大模型论文:哈工深新研究发现!无需额外资源,SelectIT方法助力大语言模型精准调优
夕小瑶科技说 原创作者 | 松果 引言:指令调优在大型语言模型中的重要性在当今的人工智能领域,大语言模型(LLMs)已经成为了研究的热点,它们在理解指令和解...
ICLR 2024 | 为音视频分离提供新视角,清华大学胡晓林团队推出RTFS-Net
机器之心专栏 机器之心编辑部视听语音分离(AVSS)技术旨在通过面部信息从混合信号中分离出目标说话者的声音。这项技术能够应用于智能助手、远程会议和增强现...
CVPR 2024满分论文:浙大提出基于可变形三维高斯的高质量单目动态重建新方法
机器之心专栏 机器之心编辑部单目动态场景(Monocular Dynamic Scene)是指使用单眼摄像头观察并分析的动态环境,其中场景中的物体可以自由移动。单目动态场...
清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!
机器之心专栏 机器之心编辑部近期,清华大学和哈尔滨工业大学联合发布了一篇论文:把大模型压缩到 1.0073 个比特时,仍然能使其保持约 83% 的性能!自从大模...