标签:特征
TPAMI 2024 | ProCo: 无限contrastive pairs的长尾对比学习
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
数学大统一理论里程碑进展:几何朗兰兹猜想获证明,论文超800页
选自quantamagazine 作者:Erica Klarreich 机器之心编译 编辑:Panda历经三十年的努力,数学家已经成功证明了一个名为「朗兰兹纲领(Langlands program)」...
贾扬清共一论文获ICML时间检验奖:首个开源版AlexNet,著名框架Caffe前身,最佳论文奖也已公布
西风 发自 凹非寺量子位 | 公众号 QbitAIICML 2024时间检验奖出炉,贾扬清共同一作论文获奖! 论文题为“DeCAF: A Deep Convolutional Activation Feature for...
多模态模型(VLM)部署方法抛砖引玉
7月11日19点,「智猩猩自动驾驶新青年讲座」第36讲将开讲,主讲理想汽车最新成果:基于MLLM的闭环规划智能体PlanAgent,由理想汽车实习研究员、中国科学院自...
上交发布MG-LLaVA,基于多粒度指令调整,横扫视觉大模型榜单
夕小瑶科技说 原创作者 |Richard近年来多模态大语言模型(MLLMs)在视觉理解任务中取得了长足进步。然而,大多数模型仍局限于处理低分辨率图像,这限制了它们在...
上交&阿里:掀开多模态大模型的头盖骨,解密黑盒模型推理过程
夕小瑶科技说 原创作者 | 谢年年多模态大模型的发展势头正猛,研究者们热衷于通过微调模型,打造出具有更高输入分辨率、更复杂功能、更强感知能力以及更精细...
哈工大提出创新迭代推理框架 DPE-MNER :充分发挥多模态表示潜力
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
比LERF提速199倍!清华哈佛发布LangSplat:三维语义高斯泼溅 | CVPR 2024 Highlight
新智元报道编辑:LRST 【新智元导读】本文将为大家介绍CVPR 2024 Highlight的论文LangSplat: 3D Language Gaussian Splatting(三维语义高斯泼溅)。LangSpla...
GPAvatar:仅需单图,快速且精准的3D头像重建及其表情控制
大数据文摘授权转载自将门创投 作者:楚选耕 头部虚拟形象的重建对于虚拟现实、在线会议、游戏和电影等行业的应用至关重要。 该领域的主要目标是忠实地重建头...
提速199倍!清华&哈佛发布三维语义高斯泼溅LangSplat|CVPR‘24 Highlight
LangSplat团队 投稿量子位 | 公众号 QbitAI入选CVPR 2024 Highlight的三维语义高斯泼溅最新成果,查询速度比之前的SOTA方法LERF快了199倍! 清华&哈佛团...
CVPR 2024 Highlight | 北航等发布「时间特征维护」:无需训练,极致压缩加速Diffusion
新智元报道编辑:LRST 好困 【新智元导读】拯救4bit扩散模型精度,仅需时间特征维护——以超低精度量化技术重塑图像内容生成!近日,北航、莫纳什、UT Austin联...
霉霉开口唱碧昂丝的歌,又是AI!口型不出戏,五官姿态也自然,复旦百度等出品|GitHub揽星1k+
西风 发自 凹非寺量子位 | 公众号 QbitAI一张人像、一段音频参考,就能让霉霉在你面前唱碧昂丝的《Halo》。 一种名为Hallo的研究火了,GitHub已揽星1k+。 话...
「连续数值分布式表征」加持,浙大UIUC让语言模型擅长表格预测 | ICLR 2024 Spotlight
新智元报道编辑:LRST 【新智元导读】来自浙江大学和伊利诺伊大学厄巴纳-香槟分校的研究者发表了他们关于「表格语言模型」(Tabular Language Model)的研究...
i人小助手:Meta推出多模态对话图,帮你轻松识别社交状态
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...