OpenAI 也是卷起来了。
原标题:刚刚,OpenAI上线Deep Research!人类终极考试远超DeepSeek R1
文章来源:机器之心
内容字数:6517字
OpenAI发布深度研究智能体Deep Research:加速复杂信息查询
OpenAI近日发布了面向深度研究领域的全新智能体产品——Deep Research,该产品现已面向Pro用户开放,未来将逐步扩展至Plus、Team及Enterprise用户。Deep Research旨在帮助用户高效完成复杂的多步骤研究任务,其核心功能是利用推理能力整合大量在线信息,在几十分钟内完类需要数小时才能完成的工作。
1. Deep Research的核心功能与优势
Deep Research的核心在于其强大的信息整合能力。它能够工作,用户只需提供查询提示,Deep Research便会自动搜索、分析和综合数百个在线资源,生成一份高质量的研究报告。该智能体由OpenAI即将推出的o3模型的一个优化版本驱动,该模型针对网页浏览和数据分析进行了优化,并能处理文本、图像和PDF等多种数据类型。OpenAI认为,Deep Research标志着其朝着开发通用人工智能(AGI)目标迈出了重要一步,它能够自主发现和整合网络信息,并进行推理,从而产生新颖的科学研究。
2. Deep Research的目标用户及应用场景
Deep Research主要面向金融、科学、政策和工程等领域从事密集知识工作的专业人士,以及需要进行深入产品研究的消费者。它能够处理复杂、耗时的网络研究,例如进行竞争分析、撰写个性化报告等。Deep Research的输出包含完整的记录、清晰的引文和思路摘要,方便用户引用和验证信息。尤其在查找小众、非直观信息方面,Deep Research展现出显著优势。
3. Deep Research的使用方法及与GPT-4的对比
用户可在ChatGPT中选择“message composer”中的Deep Research功能,输入查询并提供必要上下文信息(例如文件或电子表格)。Deep Research运行时间通常为5到30分钟,完成后会向用户发送通知。最终结果将以报告形式呈现,未来还将添加图像、数据可视化等内容。与实时多模态对话更擅长的GPT-4相比,Deep Research更适合需要深入细节和广泛探索的特定领域查询,能够更全面地分析信息并引用所有声明。文章中以寻找电视剧和查询NFL球员平均退休年龄为例,对比了Deep Research和GPT-4在信息深度和完整性上的差异,Deep Research表现出更强大的信息整合和推理能力。
4. Deep Research的技术原理及性能评估
Deep Research采用端到端的强化学习方法进行训练,能够规划和执行多步骤的搜索策略,并根据需要进行回溯和调整。它可以浏览用户上传的文件,使用Python工具进行数据处理,并在报告中嵌入图表和图像。在“人类终极考试”和GAIA基准测试中,Deep Research都取得了领先的成绩,展现了其在解决复杂现实世界问题方面的强大能力。
5. Deep Research的局限性和未来发展
Deep Research目前仍处于早期阶段,存在一些局限性,例如偶尔会出现幻觉或错误推断,以及报告格式方面的问题。但OpenAI表示,这些问题会随着使用和时间的推移而得到改善。未来,Deep Research将连接更多专业数据源,并与其他功能(例如Operator)结合,以执行更复杂的任务。
总而言之,Deep Research是OpenAI在人工智能领域的一项重要突破,它为用户提供了高效完成复杂研究任务的强大工具,并展现了AGI发展的巨大潜力。
联系作者
文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台