今日arXiv最热大模型论文：减少语法错误，竟成了突破口！识别AI生成文本，AUROC达98.7%

AIGC动态2年前 (2024)发布夕小瑶科技说

AIGC动态欢迎阅读

原标题：今日arXiv最热大模型论文：减少语法错误，竟成了突破口！识别AI生成文本，AUROC达98.7%
关键字：文本,样本,模型,阈值,检测器
文章来源：夕小瑶科技说
内容字数：6182字

内容摘要：

夕小瑶科技说原创作者 | 谢年年语法错误更少竟成为检测大模型生成文本的突破口？
澳门大学和哈工大的团队最近发现人类在写作时比语言模型更容易犯语法错误。换句话说，大模型生成的文本中语法错误更少。这一特性为检测模型生成文本提供了一个新的视角：若一篇文章经过语法修改器校正后，其与原文相差不大，那么说明这篇文章的语法错误率较低，因此更有可能是由模型生成的。
大模型表示：太优秀也是一种错吗？
论文标题:Who Wrote This? The Key to Zero-Shot LLM-Generated Text Detection Is GECScore
论文链接：https://arxiv.org/pdf/2405.04286
为什么人类比大模型更容易犯语法错误呢？从直觉上来说人类写作时确实比大模型更容易犯语法错误，比如手滑打几个，写几个病句都很常见。那么为什么人类容易犯语法错误呢？这是有理论支撑的。
神经科学和认知心理学中，词的启动效应（Word Priming）和记忆形成（Memory Formation）认为这些失误往往源于大脑倾向于优先考虑语义连贯性和叙事流畅性，而非字符级别的

原文链接：今日arXiv最热大模型论文：减少语法错误，竟成了突破口！识别AI生成文本，AUROC达98.7%

联系作者

文章来源：夕小瑶科技说
作者微信：xixiaoyaoQAQ
作者简介：专业、有趣、深度价值导向的科技媒体。聚集30万AI工程师、研究员，覆盖500多家海内外机构投资人，互联网大厂中高管和AI公司创始人。一线作者来自清北、国内外顶级AI实验室和大厂，兼备敏锐的行业嗅觉和洞察深度。商务合作：zym5189

阅读原文