今日arXiv最热NLP论文：Meta重磅，为训练数据打上烙印，以判断是否被大模型所用

AIGC动态1年前 (2024)发布夕小瑶科技说

AIGC动态欢迎阅读

原标题：今日arXiv最热NLP论文：Meta重磅，为训练数据打上烙印，以判断是否被大模型所用
关键字：水印,模型,放射性,数据,文本
文章来源：夕小瑶科技说
内容字数：11408字

内容摘要：

夕小瑶科技说原创编辑 | 谢年年为了将LLMs打造类想要的样子，通常需要收集大量数据微调模型。在LLMs时代之前，众包是获取标注数据的主要方式。
自从LLMs出来后，研究者们探索出可以从强大的模型如Bard、ChatGPT或Claude中生成合成数据微调自己的模型，相比众包更加省时省力省钱。
但这一过程涉及到了使用其他模型生成的数据，可能会引发版权和知识产权的问题。例如，如果一个模型被用来生成训练数据，而这些数据又被用来训练另一个模型，那么后者是否是对前者的派生作品？
为了追根溯源，可以像图片版权保护一样为LLM的输出打上水印（watermarking），以此来检测合成数据，极大的促进了大模型的安全防护。
最近关于LLM水印技术的文章很多，今天介绍的这篇文章来自Meta，它并没有探讨如何在保障输出质量的情况下为LLM打水印，而是另辟蹊径，研究水印文本的“放射性”——即水印文本被用作微调数据时会发生什么呢？对模型的潜在“污染”能力有多大？
论文标题：Watermarking Makes Language Models Radioactive
前置知识考虑到有些童鞋对水印技术不太了解

原文链接：今日arXiv最热NLP论文：Meta重磅，为训练数据打上烙印，以判断是否被大模型所用