这是我十月份在OpenAI DevDay 上最喜欢的演示 – 由 Katia Gil Guzman 开发的语音驱动的太阳系探索,你可以大声说出“让我看看火星”之类的内容,它会放大显示不同的行星尸体。
OpenAI最终发布了它的代码,现在升级为使用他们在 12 月发布的新的、更易于使用的 WebRTC API。
我像这样运行它,使用llm keys get加载我的 OpenAI API 密钥:
cd /tmp git clone https://github.com/openai/openai-realtime-solar-system cd openai-realtime-solar-system npm install OPENAI_API_KEY="$(llm keys get openai)" npm run dev
您需要同时单击 Wifi 图标和麦克风图标,然后才能用语音进行指令。尝试“让我看看火星”。
标签: openai , llms ,人工智能,生成人工智能
原文: https://simonwillison.net/2025/Jan/31/openai-realtime-solar-system/#atom-everything