标签：方法

CMU朱俊彦、Adobe新作：512×512图像推理，A100只用0.11秒

机器之心报道编辑：陈萍、杜伟可玩性极强！简笔素描一键变身多风格画作，还能添加额外的描述，这在 CMU、Adobe 联合推出的一项研究中实现了。作者之一为 CM...

阅读原文

AIGC动态

2年前 (2024)

如何从头开始编写LoRA代码，这有一份教程

选自 lightning.ai 作者：Sebastian Raschka 机器之心编译编辑：陈萍作者表示：在各种有效的 LLM 微调方法中，LoRA 仍然是他的首选。LoRA（Low-Rank Adaptat...

阅读原文

AIGC动态

2年前 (2024)

可控图像生成最新综述！北邮开源20页249篇文献，包揽Text-to-Image Diffusion领域各种「条件」

新智元报道编辑：LRS 【新智元导读】利用文本生成图片（Text-to-Image, T2I）已经满足不了人们的需要了，近期研究在T2I模型的基础上引入了更多类型的条件来生...

阅读原文

AIGC动态

2年前 (2024)

COLING24｜自适应剪枝让多模态大模型加速2-3倍，哈工大等推出SmartTrim

机器之心专栏机器之心编辑部基于 Transformer 结构的视觉语言大模型（VLM）在各种下游的视觉语言任务上取得了巨大成功，但由于其较长的输入序列和较多的参数...

阅读原文

AIGC动态

2年前 (2024)

如何把大模型压缩到1bit？论文作者这样说

自从大模型火爆出圈以后，人们对压缩大模型的愿望从未消减。这是因为，虽然大模型在很多方面表现出优秀的能力，但高昂的部署代价极大提升了它的使用门槛。这...

阅读原文

AIGC动态

2年前 (2024)

今日arXiv最热大模型论文：超越LoRA，北京大学提出预训练模型非梯度优化法

夕小瑶科技说原创编辑 | 松果引言：探索大型语言模型中低秩适应的新方法在自然语言处理领域，大语言模型（LLMs）的迅猛发展带来了前所未有的性能提升。然而...

阅读原文

AIGC动态

2年前 (2024)

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

微软靠“想象力”解决大语言模型调用工具两大难题！方法已开源。作者|徐珊编辑|云鹏智东西3月10日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出...

阅读原文

AIGC动态

2年前 (2024)

一文看尽297篇文献！中科院领衔发表首篇「基于扩散模型的图像编辑」综述

新智元报道编辑：LRS 【新智元导读】AIGC大模型最火热的任务之一——基于Diffusion Model的图像编辑（editing）领域的首篇综述，长达26页，涵盖297篇文献！本文...

阅读原文

AIGC动态

2年前 (2024)

全面超越ViT，美团、浙大等提出视觉任务统一架构VisionLLAMA

机器之心专栏机器之心编辑部半年多来，Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功（训练稳定、容易做 scaling）。沿袭 ViT 的研究思路，我们能...

阅读原文

AIGC动态

2年前 (2024)

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

机器之心专栏作者：邵文琪模型量化是模型压缩与加速中的一项关键技术，其将模型权重与激活值量化至低 bit，以允许模型占用更少的内存开销并加快推理速度。对...

阅读原文

AIGC动态

2年前 (2024)

中科院等万字详解：最前沿图像扩散模型综述

黄健成投稿量子位 | 公众号 QbitAI针对图像编辑中的扩散模型，中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。全文长达26页，共1.5万余词，涵盖2...

阅读原文

AIGC动态

2年前 (2024)

今日arXiv最热大模型论文：哈工深新研究发现！无需额外资源，SelectIT方法助力大语言模型精准调优

夕小瑶科技说原创作者 | 松果引言：指令调优在大型语言模型中的重要性在当今的人工智能领域，大语言模型（LLMs）已经成为了研究的热点，它们在理解指令和解...

阅读原文

AIGC动态

2年前 (2024)

ICLR 2024 | 为音视频分离提供新视角，清华大学胡晓林团队推出RTFS-Net

机器之心专栏机器之心编辑部视听语音分离（AVSS）技术旨在通过面部信息从混合信号中分离出目标说话者的声音。这项技术能够应用于智能助手、远程会议和增强现...

阅读原文

AIGC动态

2年前 (2024)

CVPR 2024满分论文：浙大提出基于可变形三维高斯的高质量单目动态重建新方法

机器之心专栏机器之心编辑部单目动态场景（Monocular Dynamic Scene）是指使用单眼摄像头观察并分析的动态环境，其中场景中的物体可以自由移动。单目动态场...

阅读原文

AIGC动态

2年前 (2024)

清华、哈工大把大模型压缩到了1bit，把大模型放在手机里跑的愿望就快要实现了！

机器之心专栏机器之心编辑部近期，清华大学和哈尔滨工业大学联合发布了一篇论文：把大模型压缩到 1.0073 个比特时，仍然能使其保持约 83% 的性能！自从大模...

阅读原文

AIGC动态

2年前 (2024)

1…10 111213 14…21