科技巨头如何为了发展人工智能而采取捷径收集数据

AIGC动态9个月前发布 AI范儿
9 0 0

科技巨头如何为了发展人工智能而采取捷径收集数据

AIGC动态欢迎阅读

原标题:科技巨头如何为了发展人工智能而采取捷径收集数据
关键字:政策,数据,知识产权,人工智能,模型
文章来源:AI范儿
内容字数:14566字

内容摘要:


点击上方蓝字关注我们“科技巨头正在大规模收集用户数据,用于训练人工智能系统。这些公司利用用户的网络活动、位置信息和其他个人数据,开发出更加智能和个性化的产品。这种做法引发了隐私和数据安全的担忧,需要和公众加强监管和保护措施。到了 2021 年底,OpenAI 面临数据短缺的问题。在开发最新 AI系统的过程中,他们已经耗尽了互联网上所有可靠的英文文本资源。为了训练技术的下一个版本,他们需要更多的数据,而且是大量的数据。
因此,OpenAI 研究人员创造了 Whisper,这个工具能够转录 YouTube 视频的音频,产生新的对话文本,以提升 AI系统的智能水平。
一些知情人士透露,OpenAI 的员工讨论过这样的做法可能会违反 YouTube 的规定。YouTube 作为 Google 的一部分,禁止将其视频用于于该视频平台的应用。
最终,OpenAI 团队转录了超过一百万小时的 YouTube 视频。据说,包括 OpenAI 总裁 Greg Brockman 在内的小组成员亲自参与了视频的收集工作。这些文本随后被输入到名为 GPT-4 的系统中,该系统被广泛认为是全球最强大的


原文链接:科技巨头如何为了发展人工智能而采取捷径收集数据

联系作者

文章来源:AI范儿
作者微信:AI_Insights
作者简介:AI领域四大媒体之一。 智能未来,始于Prompt!

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...