AIGC动态欢迎阅读
原标题:Gemini自曝文心一言牵出重大难题,全球陷入高质量数据荒?2024年或将枯竭
关键字:数据,知识产权,模型,语料,网友
文章来源:新智元
内容字数:6101字
内容摘要:
新智元报道编辑:编辑部
【新智元导读】Gemini自曝自己是文心一言,听之虽然好笑,背后原因却令人忧心:互联网语料或许已经被AI严重污染,而且全球都陷入了高质量数据荒,最早在明年将面临枯竭!谷歌Gemini,又出了!
昨天上午,网友们激动地奔走相告:Gemini承认自己是用文心一言训练中文语料的。
国外大模型用中国模型产生的中文语料训练,这听起来就是个段子,结果段子竟然成现实了,简直魔幻。
微博大V「阑夕」夜亲自下场,在Poe网站上实测了一番,发现的确如此——
不需要前置对话,不是角色扮演,Gemini直接就会承认自己是文心一言。
Gemini Pro会说自己是百度的文心大模型。
还说自己的创始人是李彦宏,然后盛赞他是一位「有才华和远见的企业家」。
所以,这是因为数据清洗没做好,还是在Poe上调用API出现的问题?目前原因还未可知。有网友说,其实自始至终都只有一个AI,是在演给人类看呢。
其实早在今年3月,谷歌就曾曝出Bard的训练数据部分来自ChatGPT,因为这个原因,Bert一作Jacob Devlin愤而跳槽OpenAI,然后曝出了这个惊天。
总之,此次再次证明:
原文链接:Gemini自曝文心一言牵出重大难题,全球陷入高质量数据荒?2024年或将枯竭
联系作者
文章来源:新智元
作者微信:AI_era
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人对人类社会与文明进化的影响,领航中国新智能时代。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...