ChatGPT 的实时视频功能可能会逐渐推广到更广泛的地区

ChatGPT高级语音模式实时视频功能或即将向更多用户开放
众多人士在日常工作和个人生活中高度依赖ChatGPT来满足各种需求。OpenAI通过引入高级语音模式等功能,为ChatGPT增添了一定程度的友好性,使得自然对话得以实现。然而,用户们一直在翘首以盼的是,公司承诺的视觉功能能够尽快推出。现在,这方面传来了好消息,因为ChatGPT高级语音模式中的实时视频功能可能很快就会面向更多用户开放。
2024年5月,OpenAI宣布了GPT-4o的推出,并声称ChatGPT的高级语音模式将具备先进的实时视觉功能。在展示的一个著名演示中,新的高级语音模式能够轻松且无缝地识别摄像头画面中的拍摄对象,如一只狗,记住它的名字,识别球,并通过捡球等活动将球与狗联系起来。考虑到用户需要手动输入的信息极少,且人工智能助手对实时摄像头的响应速度极快,这一演示令人印象深刻,仿佛用户在与人类进行视频通话一般。
部分用户有幸在alpha版本中体验了实时视频(视觉)功能,同样留下了深刻的印象。然而,用户们一直在耐心等待该功能在alpha测试之外正式上线。据我们所知,OpenAI并未给出高级语音模式中视觉功能在alpha测试之外发布的具体时间表。
如今,OpenAI似乎正准备推出Beta版,因为我们在最新的ChatGPT v1.2024.317 Beta版本中发现了与高级语音模式中的视觉功能相关的字符串。这些字符串表明,该功能在测试版推出时可能会被命名为“实时摄像头”。我们注意到,用户会收到警告,建议不要使用实时摄像头功能进行实时导航或做出可能影响其健康或安全的其他决定。
由于这些字符串是在应用程序的测试版中发现的,这可能意味着OpenAI目前正在为更广泛的测试版推出做准备,有望在不久的将来实现。如果我们进行假设,可以推测该功能可能很快就会向ChatGPT Plus订阅者开放,或者是AI助手的其他付费层级用户。