OpenAI：语音模式常见问题解答 – 搞英语 → 看世界

鉴于周三的Gemini 2.0 Flash 音频和视频流演示给我留下了深刻的印象，公平地说，我强调 OpenAI 在周四的“12 天 OpenAI”系列的第 6 天，将其相当于该功能的功能交付给了生产中的 ChatGPT 。

今天早上我在 ChatGPT iPhone 应用程序中获得了访问权限。它同样令人印象深刻：在高级语音模式对话中，您现在可以点击相机图标开始与 ChatGPT 共享实时视频流。我把它介绍给我的鸡，并告诉它它们的名字，然后它就能在同一次对话中识别出每只鸡。显然，ChatGPT 桌面应用程序也可以进行屏幕共享，尽管该功能尚未向我推出。

（在十二月剩下的时间里，你还可以让它呈现出圣诞老人的声音和个性——我让圣诞老人用威尔士语给我读了俳句，告诉我他早些时候可以通过我的相机看到什么。）