用于训练AI的数据已经枯竭,预训练时代结束。
原标题:AI真的要“断粮”了?OpenAI创始人的最新警告震动全球,但他可能忽略了这个事实…
文章来源:AI范儿
内容字数:4480字
预训练模式的未来:AI发展的新挑战与机遇
在最近的NeurIPS会议上,OpenAI的联合创始人Ilya Sutskever提出了一个引发广泛讨论的观点:“我们熟知的预训练模式必将终结。”这一论断引发了关于AI发展基石的深刻反思。预训练通常被视为AI模型开发的第一步,然而,Sutskever认为,训练数据正面临耗竭的危机。
数据的有限性:石油与AI的类比
Sutskever将训练数据比作一种不可再生资源,尽管数据本身可以复制,但AI系统从中提取的知识和洞察力却是有限的。他强调,AI系统需要真正有价值的新数据才能提升能力。虽然现有的数据规模庞大,但如果没有新的、有质量的数据,AI的表现将难以突破。
对“数据枯竭”观点的反思
笔者对此观点持有保留态度。首先,重新学习已有数据可以带来新的理解和启发;其次,互联网每天都有新的内容生成,现有的数据并未达到完全枯竭的阶段。优化数据利用效率和模型架构,仍有广阔的提升空间。
突破瓶颈的可能方向
面对预训练模式的挑战,Sutskever提出了几个潜在的突破方向,包括:发展真正具有思考能力的AI代理、创造高质量的合成数据以及在推理阶段投入更多资源。未来的AI系统将不仅依赖模式匹配,而是能够像人类一样进行逐步推理,提升其行为的可预测性。
新公司的成立与未来展望
在理念转变的推动下,Sutskever于2024年创立了Safe Superintelligence Inc(SSI),致力于开发安全的超智能系统。尽管面临“数据危机”,但通过提升数据质量、改进处理方法以及深化对已有数据的理解,AI行业仍有机会迎来新的发展阶段。
结语
在当前AI发展的挑战与机遇并存的时代,谁能在数据质量提升、已有数据深度挖掘及新数据获取方面取得突破,谁就有可能成为未来AI时代的引领者。
联系作者
文章来源:AI范儿
作者微信:
作者简介:专注于探索 AIGC,发掘人工智能的乐趣。