AIGC动态欢迎阅读
原标题:科技巨头如何为了发展人工智能而采取捷径收集数据
关键字:政策,数据,知识产权,人工智能,模型
文章来源:AI范儿
内容字数:14566字
内容摘要:
点击上方蓝字关注我们“科技巨头正在大规模收集用户数据,用于训练人工智能系统。这些公司利用用户的网络活动、位置信息和其他个人数据,开发出更加智能和个性化的产品。这种做法引发了隐私和数据安全的担忧,需要和公众加强监管和保护措施。到了 2021 年底,OpenAI 面临数据短缺的问题。在开发最新 AI系统的过程中,他们已经耗尽了互联网上所有可靠的英文文本资源。为了训练技术的下一个版本,他们需要更多的数据,而且是大量的数据。
因此,OpenAI 研究人员创造了 Whisper,这个工具能够转录 YouTube 视频的音频,产生新的对话文本,以提升 AI系统的智能水平。
一些知情人士透露,OpenAI 的员工讨论过这样的做法可能会违反 YouTube 的规定。YouTube 作为 Google 的一部分,禁止将其视频用于于该视频平台的应用。
最终,OpenAI 团队转录了超过一百万小时的 YouTube 视频。据说,包括 OpenAI 总裁 Greg Brockman 在内的小组成员亲自参与了视频的收集工作。这些文本随后被输入到名为 GPT-4 的系统中,该系统被广泛认为是全球最强大的
联系作者
文章来源:AI范儿
作者微信:AI_Insights
作者简介:AI领域四大媒体之一。 智能未来,始于Prompt!
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...