标签:方法
两分钟1200帧的长视频生成器StreamingT2V来了,代码将开源
机器之心报道 编辑:Panda广阔的战场,风暴兵在奔跑…… prompt:Wide shot of battlefield, stormtroopers running... 这段长达 1200 帧的 2 分钟视频来自一个...
老药新用,中南大学团队发布 AdaDR,基于自适应图卷积网络进行药物重定位
作者:梅菜 编辑:李宝珠,三羊 中南大学研究团队提出了一种名为 AdaDR 的自适应 GCN 方法,通过深度集成节点特征和拓扑结构来进行药物重定位。现代社会,人...
清华微软开源全新提示词压缩工具,长度骤降80%!GitHub怒砍3.1K星
新智元报道编辑:润 好困 【新智元导读】最近,清华和微软的研究人员提出了一种全新的方法,能在保证输出质量不变的前提下,将提示词压缩到原始长度的20%!在...
模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了
丰色 发自 凹非寺量子位 | 公众号 QbitAI把Huggingface上的现成模型拿来“攒一攒”—— 直接就能组合出新的强大模型?! 日本大模型公司sakana.ai脑洞大开(正是“...
离职谷歌的Transformer作者创业,连发3个模型(附技术报告)
机器之心报道 编辑:陈萍、小舟去年 8 月,两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI,总部位于日本东京。其中,...
用大语言模型控制交通信号灯,有效缓解拥堵!
夕小瑶科技说 原创作者 | 松果 引言:城市交通拥堵的挑战与智能交通信号控制的进展城市交通拥堵是一个全球性的问题,在众多缓解交通拥堵的策略中,提高路口交...
CMU朱俊彦、Adobe新作:512×512图像推理,A100只用0.11秒
机器之心报道 编辑:陈萍、杜伟可玩性极强!简笔素描一键变身多风格画作,还能添加额外的描述,这在 CMU、Adobe 联合推出的一项研究中实现了。 作者之一为 CM...
如何从头开始编写LoRA代码,这有一份教程
选自 lightning.ai 作者:Sebastian Raschka 机器之心编译 编辑:陈萍作者表示:在各种有效的 LLM 微调方法中,LoRA 仍然是他的首选。LoRA(Low-Rank Adaptat...
可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」
新智元报道编辑:LRS 【新智元导读】利用文本生成图片(Text-to-Image, T2I)已经满足不了人们的需要了,近期研究在T2I模型的基础上引入了更多类型的条件来生...
COLING24|自适应剪枝让多模态大模型加速2-3倍,哈工大等推出SmartTrim
机器之心专栏 机器之心编辑部基于 Transformer 结构的视觉语言大模型(VLM)在各种下游的视觉语言任务上取得了巨大成功,但由于其较长的输入序列和较多的参数...
如何把大模型压缩到1bit?论文作者这样说
自从大模型火爆出圈以后,人们对压缩大模型的愿望从未消减。这是因为,虽然大模型在很多方面表现出优秀的能力,但高昂的部署代价极大提升了它的使用门槛。这...
今日arXiv最热大模型论文:超越LoRA,北京大学提出预训练模型非梯度优化法
夕小瑶科技说 原创编辑 | 松果 引言:探索大型语言模型中低秩适应的新方法在自然语言处理领域,大语言模型(LLMs)的迅猛发展带来了前所未有的性能提升。然而...
7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题
微软靠“想象力”解决大语言模型调用工具两大难题!方法已开源。 作者|徐珊 编辑|云鹏 智东西3月10日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出...
一文看尽297篇文献!中科院领衔发表首篇「基于扩散模型的图像编辑」综述
新智元报道编辑:LRS 【新智元导读】AIGC大模型最火热的任务之一——基于Diffusion Model的图像编辑(editing)领域的首篇综述,长达26页,涵盖297篇文献!本文...
全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA
机器之心专栏 机器之心编辑部半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。 沿袭 ViT 的研究思路,我们能...