在 2024 年熙熙攘攘的科技园区,被动人工智能时代(仅响应我们的查询的系统)正在让位于更深刻的时代:人工智能代理时代。
展望 2025 年,我们将发现当算法学会行动时会发生什么。
这些新兴代理的核心在于三位一体的学习方法:
- 监督学习:就像给孩子读书一样,人类为人工智能标记猫和狗、羊和牛提供了明确的指导。
- 无监督学习:人工智能发现数据中隐藏的模式;电子商务网站通过聚集相似用户的购买模式来推荐您可能喜欢的产品。
- 强化学习:人工智能通过玩数千次来学习玩视频游戏,就像游戏玩家一样。
深度学习意味着使用神经网络架构来计算答案,例如明天的天气如何或总结昨晚的尼克斯队比赛。
我记得在研究生院学习深度学习时,作为教科书的最后一章——一位教授随口说道:“这是一个令人着迷但不切实际的想法!”
Transformer 架构改变了一切。就像神经网络的印刷机一样,人工智能可以处理大量数据,每千兆字节的能力都会增强。除了准确性之外,它的多功能性也在增长:总结文章的基本原理可以生成艺术、创作音乐和翻译。
就像人类一样,智能体也会面临很多不确定性。用户要求预订《莫阿娜 2》假期门票,但时间和地点已被预订。它应该做什么?
使用 DRL 训练的 AI 创建世界的心理模型,然后考虑时间、计算费用和其他参数,努力找到最佳答案。
是同时寻找下一个最近的影院还是另找时间或询问用户比较好?
我们为代理提供的建模和探索问题空间的工具越好,代理就越能代表我们采取行动。我们距离教科书的那一章已经有很长的路要走。
Miguel Morales 是《Grokking Deep Reinforcement Learning》一书的作者,制作了上面的图像。这是一本很棒的书,可以更深入地理解这个主题。