多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中三篇杰出论文

AIGC动态2年前 (2024)发布夕小瑶科技说

原标题：多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中三篇杰出论文
文章来源：夕小瑶科技说
内容字数：5826字

EMNLP 2024最佳论文奖揭晓

根据最新消息，EMNLP 2024最佳论文奖已经公布，共有五篇论文获奖，其中华人学者参与三篇，展现了华人在自然语言处理领域的卓越贡献。这些研究涉及多模态翻译、语音表征学习、语言模型梯度分析等多个前沿主题。

1. 图像再创造的文化相关性

来自CMU的研究论文《An image speaks a thousand words,but can everyone listen? On image transcreation for cultural relevance》探讨了图像的跨文化再创造任务。作者构建了三个生成模型管道，实验结果显示目前的图像编辑模型尚未完全满足该任务要求，但通过结合LLM和检索器可实现改进。

2. 稳健的语音表征学习

来自CMU、上海交通大学及丰田工业大学的论文《Towards Robust Speech Representation Learning for Thousands of Languages》介绍了一种名为XEUS的跨语言通用语音编码器。研究团队通过整合现有数据及新数据，构建了包含4057种语言的预训练语料库，实验结果显示XEUS在多项任务中表现优异。

3. 语言模型梯度投射

理工学院与特拉维夫大学的研究团队在论文《Backward Lens: Projecting Language Model Gradients into the Vocabulary Space》中扩展了梯度可解释性方法。他们证明了梯度矩阵可以被视为输入的低秩线性组合，并探索了新信息在语言模型中的存储机制。

4. 大语言模型预训练数据检测

中科院的研究论文《Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method》提出了一种新的数据检测方法DC-PDD，旨在提高LLM训练数据的透明度。研究表明，该方法在多个基准测试中表现优于传统方法。

5. 从反馈中学习的耦合理解与生成

康奈尔大学的论文《CoGen: Learning from Feedback with Coupled Comprehension and Generation》探讨了语言理解与生成的耦合方法。通过与用户的交互反馈，实验结果显示该方法显著提升了模型的理解与生成能力。

杰出论文奖项

此次EMNLP 2024还评选出了20篇杰出论文，涉及隐私法律、学习偏好等多个主题，突出显示了学术界在自然语言处理领域的持续创新与研究热情。尤其值得一提的是，华人学者Nanyun Peng团队的三篇论文均获得了奖项，显示了其在创意叙事生成能力评估方面的深厚研究基础。

未来展望

EMNLP 2025将于明年11月在中国苏州举办，期待更多学者积极参与，推动自然语言处理领域的进一步发展。

联系作者

文章来源：夕小瑶科技说
作者微信：
作者简介：专业、有趣、深度价值导向的科技媒体。聚集30万AI工程师、研究员，覆盖500多家海内外机构投资人，互联网大厂中高管和AI公司创始人。一线作者来自清北、国内外顶级AI实验室和大厂，兼备敏锐的行业嗅觉和洞察深度。商务合作：zym5189

阅读原文

# AIGC动态 # 深度学习 # 生成模型 # 自然语言处理 # 语义理解 # 迁移学习

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中三篇杰出论文

EMNLP 2024最佳论文奖揭晓

1. 图像再创造的文化相关性

2. 稳健的语音表征学习

3. 语言模型梯度投射

4. 大语言模型预训练数据检测

5. 从反馈中学习的耦合理解与生成

杰出论文奖项

未来展望

联系作者

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中三篇杰出论文

突破化学合成瓶颈：AI化学家引领智能化实验新时代！

相关文章

暂无评论