标签:方法

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

微软靠“想象力”解决大语言模型调用工具两大难题!方法已开源。 作者|徐珊 编辑|云鹏 智东西3月10日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出...
阅读原文

一文看尽297篇文献!中科院领衔发表首篇「基于扩散模型的图像编辑」综述

新智元报道编辑:LRS 【新智元导读】AIGC大模型最火热的任务之一——基于Diffusion Model的图像编辑(editing)领域的首篇综述,长达26页,涵盖297篇文献!本文...
阅读原文

全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

机器之心专栏 机器之心编辑部半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。 沿袭 ViT 的研究思路,我们能...
阅读原文

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP

机器之心专栏 作者:邵文琪模型量化是模型压缩与加速中的一项关键技术,其将模型权重与激活值量化至低 bit,以允许模型占用更少的内存开销并加快推理速度。对...
阅读原文

中科院等万字详解:最前沿图像扩散模型综述

黄健成 投稿量子位 | 公众号 QbitAI针对图像编辑中的扩散模型,中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。 全文长达26页,共1.5万余词,涵盖2...
阅读原文

今日arXiv最热大模型论文:哈工深新研究发现!无需额外资源,SelectIT方法助力大语言模型精准调优

夕小瑶科技说 原创作者 | 松果 引言:指令调优在大型语言模型中的重要性在当今的人工智能领域,大语言模型(LLMs)已经成为了研究的热点,它们在理解指令和解...
阅读原文

ICLR 2024 | 为音视频分离提供新视角,清华大学胡晓林团队推出RTFS-Net

机器之心专栏 机器之心编辑部视听语音分离(AVSS)技术旨在通过面部信息从混合信号中分离出目标说话者的声音。这项技术能够应用于智能助手、远程会议和增强现...
阅读原文

CVPR 2024满分论文:浙大提出基于可变形三维高斯的高质量单目动态重建新方法

机器之心专栏 机器之心编辑部单目动态场景(Monocular Dynamic Scene)是指使用单眼摄像头观察并分析的动态环境,其中场景中的物体可以自由移动。单目动态场...
阅读原文

清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!

机器之心专栏 机器之心编辑部近期,清华大学和哈尔滨工业大学联合发布了一篇论文:把大模型压缩到 1.0073 个比特时,仍然能使其保持约 83% 的性能!自从大模...
阅读原文

对抗「概念飘逸」难题!谷歌发布全新时间感知框架:图像识别准确率提升15%

新智元报道编辑:wewe 【新智元导读】告别数据健忘症!机器学习新方法实现「时空穿越」,助力模型适应易变世界。在机器学习领域,概念漂移(concept drift)...
阅读原文

ControlNet作者新作:AI绘画能分图层了!项目未开源就斩获660 Star

金磊 发自 凹非寺量子位 | 公众号 QbitAI“绝不是简单的抠图。” ControlNet作者最新推出的一项研究受到了一波高度关注—— 给一句prompt,用Stable Diffusion可...
阅读原文

让Sora东京女郎唱歌、高启强变声罗翔,阿里人物口型视频生成绝了

机器之心报道 机器之心编辑部有了阿里的 EMO,AI 生成或真实的图像「动起来说话或唱歌」变得更容易了。 最近,以 OpenAI Sora 为代表的文生视频模型又火了起...
阅读原文

想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速

机器之心报道 机器之心编辑部作为 2024 开年王炸,Sora 的出现树立了一个全新的追赶目标,每个文生视频的研究者都想在最短的时间内复现 Sora 的效果。 根据 O...
阅读原文

基于神经网络的偏微分方程求解器新突破:北大&字节研究成果入选Nature子刊

机器之心发布 机器之心编辑部近年来,基于神经网络的偏微分方程求解器在各领域均得到了广泛关注。其中,量子变分蒙特卡洛方法(NNVMC)在量子化学领域异军突...
阅读原文

数量即力量!腾讯揭秘:Agent数量越多,大语言模型效果越好

机器之心专栏 机器之心编辑部来自腾讯的研究者们做了一个关于 agent 的scaling property(可拓展性)的工作。发现:通过简单的采样投票,大语言模型(LLM)的...
阅读原文
1101112131420