原标题:OpenAI正式推出ChatGPT实时视频功能,兑现七个月前演示承诺
文章来源:小夏聊AIGC
内容字数:1791字
OpenAI推出高级语音模式,开启智能视觉交互新篇章
本周四,OpenAI宣布了一项令人振奋的技术更新——针对ChatGPT的“高级语音模式”实现了视觉化升级。这个新功能能够模拟人类对话,并通过手机摄像头即时识别物体,为用户提供实时反馈和互动。这一升级目前已向ChatGPT Plus、Team和Pro服务的订阅用户开放,让人们的使用体验更加丰富。
强大的视觉互动功能
这一新模式不仅具备语音交互的能力,还融合了视觉技术,带来了屏幕共享的强大功能。无论是帮助用户解析复杂的设置菜单,还是为数学难题提供解答建议,ChatGPT都能轻松应对,提升了用户的效率和体验。
简便的操作方式
用户可以通过简单的操作来启用这一功能。在ChatGPT的界面,轻触语音图标后再点击左下角新增的视频图标,即可进入视频互动模式。此外,若需要共享屏幕内容,只需点击三点菜单并选择“共享屏幕”选项,操作简便直观,人人都能快速上手。
逐步推广的计划
OpenAI表示,带有视觉功能的高级语音模式将从本周四起逐步推出,预计在下周内实现全面覆盖。不过,并非所有用户都能立即享受到这一服务。ChatGPT Enterprise和Edu的用户需要等到明年1月,而在欧盟、瑞士、冰岛、挪威以及列支敦士登等地区的用户,需耐心等待进一步的时间安排通知。
视觉分析能力的展示
在最近一期的CNN“60分钟”节目中,OpenAI总裁Greg Brockman向主持人安德森·库珀展示了这一高级语音模式的视觉分析能力。当库珀在黑板上绘制人体部位时,ChatGPT不仅能准确理解绘画内容,还能提供专业的建议。例如,它指出大脑的位置相当准确,并建议将大脑的形状调整得更接近椭圆。然而,演示中也暴露出一些几何问题上的不准确性,提醒用户在使用时需谨慎。
与竞争对手的激烈较量
随着人工智能领域竞争的加剧,谷歌、Meta等公司也在积极开发类似的功能。本周,谷歌已向部分Android测试人员开放了其实时视频分析对话式人工智能项目——Project Astra,显示了其在这一领域的快速布局。
节日氛围的增添
除了高级语音模式,OpenAI还在本周推出了一款充满节日气息的功能——“圣诞老人模式”。用户只需在ChatGPT应用中找到提示栏旁的雪花图标并点击,即可启用这一独特的圣诞老人语音功能,为节日增添了一份趣味。
总的来说,OpenAI的这一新功能不仅提升了ChatGPT的实用性,也为用户的互动体验注入了新的活力。在未来,我们可以期待更多创新科技的出现,进一步推动人工智能的发展。
联系作者
文章来源:小夏聊AIGC
作者微信:
作者简介:专注于人工智能生成内容的前沿信息与技术分享。我们提供AI生成艺术、文本、音乐、视频等领域的最新动态与应用案例。每日新闻速递、技术解读、行业分析、专家观点和创意展示。期待与您一起探索AI的无限潜力。欢迎关注并分享您的AI作品或宝贵意见。