标签:方法

参数少80%,效果仍超LoRA!上交大&上海AI Lab推出高效微调框架FLoRA

Huiser 投稿量子位 | 公众号 QbitAI为了让大模型在特定任务、场景下发挥更大作用,LoRA这样能够平衡性能和算力资源的方法正在受到研究者们的青睐。 然而,以L...
阅读原文

大模型性能掺水严重?北大交出答卷:交互评估+动态出题,死记硬背也没用 | ACL 2024

新智元报道编辑:LRS 【新智元导读】当前大语言模型(LLM)的评估方法受到数据污染问题的影响,导致评估结果被高估,无法准确反映模型的真实能力。北京大学等...
阅读原文

ACL2024主会:无需训练的大模型推荐系统!

夕小瑶科技说 原创作者 | Axe_越如今,各种推荐系统无时无刻不在包围着我们的生活,自大模型(Large Language Model, LLM)时代以来,得益于LLM的高自由度,...
阅读原文

比LERF提速199倍!清华哈佛发布LangSplat:三维语义高斯泼溅 | CVPR 2024 Highlight

新智元报道编辑:LRST 【新智元导读】本文将为大家介绍CVPR 2024 Highlight的论文LangSplat: 3D Language Gaussian Splatting(三维语义高斯泼溅)。LangSpla...
阅读原文

史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍

机器之心报道 机器之心编辑部DiT 都能用,生成视频无质量损失,也不需要训练。实时 AI 视频生成来了! 本周三,新加坡国立大学尤洋团队提出了业内第一种可以...
阅读原文

GPAvatar:仅需单图,快速且精准的3D头像重建及其表情控制

大数据文摘授权转载自将门创投 作者:楚选耕 头部虚拟形象的重建对于虚拟现实、在线会议、游戏和电影等行业的应用至关重要。 该领域的主要目标是忠实地重建头...
阅读原文

小红书怎么用大模型?顶会作者在线等你来聊

允中 发自 凹非寺量子位 | 公众号 QbitAI大模型正引领新一轮的研究热潮,业界和学术界都涌现出了众多的创新成果。 小红书技术团队也在这一浪潮中不断探索,多...
阅读原文

又一篇AI顶会!这个idea“ 杀疯了 ” ….

很多人总是误以为,靠着自己的认真努力就能把SCI/CCF论文发出来,可真相是:只知道一味地努力,是一种完完全全错误的学生思维,是发不出论文的。 科研是有“门...
阅读原文

今日arXiv最热大模型论文:大模型对齐告别微调,直接编辑表征空间即可解决

夕小瑶科技说 原创作者 | Richard人工智能技术正在飞速发展,尤其是大语言模型在自然语言处理领域取得了令人瞩目的成就。但同时,我们也面临着如何让语言模型...
阅读原文

提速199倍!清华&哈佛发布三维语义高斯泼溅LangSplat|CVPR‘24 Highlight

LangSplat团队 投稿量子位 | 公众号 QbitAI入选CVPR 2024 Highlight的三维语义高斯泼溅最新成果,查询速度比之前的SOTA方法LERF快了199倍! 清华&哈佛团...
阅读原文

OpenAI 是如何估计与分析模型计算量的?

直播预告 | 6月25日10点,「智猩猩AI新青年讲座」第241讲正式开讲,伊利诺伊大学厄巴纳-香槟分校在读博士赵晓明将直播讲解《从单目视频中合成动态新视图》,...
阅读原文

导师爆料:这篇CVPR最佳学生论文,从想法到成稿只用一个月,源自业余灵感

机器之心报道 机器之心编辑部按部就班 vs. 好奇心驱动,哪个更容易出研究成果?CVPR 2024 的最佳学生论文,竟然是用一个月的时间写出来的。 北京时间 6 月 20...
阅读原文

Nature重磅:大模型的谎言如何“破”?牛津团队提出新方法,无需人工监督或特定领域知识

大数据文摘授权转载自学术头条 世界卫生组织(WHO)的人工智能健康资源助手 SARAH 列出了旧金山本不存在的诊所的虚假名称和地址。 Meta公司“短命”的科学聊天...
阅读原文

小红书这场大模型论文分享会,集齐了四大国际顶会的作者

大模型正引领新一轮的研究热潮,业界和学术界都涌现出了众多的创新成果。 小红书技术团队也在这一浪潮中不断探索,多篇论文研究成果在 ICLR、ACL、CVPR、AAAI...
阅读原文

1块3090就能训7B大模型,山东大学低带宽低显存训练法,解决显卡限购卡脖子

夕小瑶科技说 原创作者 | 谢年年 大模型的全参数微调对资源要求非常高,当前业界更倾向于采用LoRA,Parallel Adapter等参数高效微调(PEFT)方法,通过添加只...
阅读原文
15678921