标签:方法
ACL2024:浙江大学提出大小模型协同的跨文档理解,低成本高表现
夕小瑶科技说 原创作者 | Richard 自大模型出现以来,其在自然语言处理领域取得了令人瞩目的进展。然而如何有效地将大模型应用于具体的任务中,仍面临诸多挑...
ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
「AI+物理先验知识」,浙大、中国科学院通用蛋白质-配体相互作用评分方法登Nature子刊
将 ScienceAI设为星标 第一时间掌握 新鲜的 AI for Science 资讯编辑 | X 蛋白质就像是身体中的精密锁具,而药物分子则是钥匙,只有完美契合的钥匙才能解锁治...
一步文生图大模型还能“更小更快”,MixDQ量化方法无损“瘦身”扩散模型3倍,提速1.5倍
大数据文摘授权转载自将门创投 作者:赵天辰 我们提出了MixDQ,一种面向少步扩散模型的混合比特量化方案。 MixDQ分析定位了“少步扩散模型量化”的独特问题,并...
GPT-4o更容易越狱?北航&南洋理工上万次测试给出详细分析
北航&南洋理工联合团队投稿量子位 | 公众号 QbitAIGPT-4o,比上一代更容易被越狱攻击了? 来自北航和南洋理工的研究人员,通过上万次的API查询,对GPT-4o...
To Believe or Not to Believe?DeepMind新研究一眼看穿LLM幻觉
新智元报道编辑:庸庸 乔杨 【新智元导读】DeepMind发表了一篇名为「To Believe or Not to Believe Your LLM」的新论文,探讨了LLM的不确定性量化问题,通过...
支持合成一分钟高清视频,华科等提出人类跳舞视频生成新框架UniAnimate
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力,开源框架SymbCoT来了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
ICML 2024 Oral|外部引导的深度聚类新范式
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
next-token被淘汰!Meta实测「多token」训练方法,推理提速3倍,性能大涨10%+
新智元报道编辑:LRS 【新智元导读】研究人员提出了一种新的大型语言模型训练方法,通过一次性预测多个未来tokens来提高样本效率和模型性能,在代码和自然语...
无需3D数据也能训练,港科&港中文联手华为推出3D自动驾驶场景生成模型
允中 发自 凹非寺量子位 | 公众号 QbitAI无需采集3D数据,也能训练出高质量的3D自动驾驶场景生成模型。 这是来自香港中文大学、香港科技大学和华为诺亚方舟实...
解决Transformer根本缺陷,CoPE论文爆火:所有大模型都能获得巨大改进
机器之心报道 机器之心编辑部即使最强大的 LLM 也难以通过 token 索引来关注句子等概念,现在有办法了。最近两天,马斯克和 LeCun 的口水战妥妥成为大家的看...
OCR小模型仍有机会!华科等提出VIMTS:零样本视频端到端识别新SOTA
新智元报道编辑:LRT 【新智元导读】通过提示查询生成模块和任务感知适配器,大一统框架VimTS在不同任务间实现更好的协同作用,显著提升了模型的泛化能力。该...
不影响输出质量还能追踪溯源,「大模型无偏水印」入选ICLR 2024 Spotlight
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...