Bing Chat 的笔记——我们第一次接触操控性人工智能

今天，A 参加了与Ars Technica的 Benj Edwards 的 Ars Live 对话，谈论了去年法学硕士历史上的疯狂时期，当时微软推出了 Bing Chat，它立即开始行为不端，对人们进行煤气灯操纵和诽谤。

这是我们谈话的视频。

我通过 MacWhisper 播放了该视频，提取了文字记录，并使用 Claude来识别我应该链接到的相关文章。这是伴随演讲的背景信息。

2023 年 2 月 Bing 发布期间发布的帖子的粗略时间表：

我们提到的其他要点：

这个 AI 聊天机器人“Sidney”行为不端– 2022 年 11 月 23 日（ChatGPT 发布前一周）的精彩论坛帖子，来自一位印度用户，谈论他们与 Bing/Sydney 秘密预览的交互
针对 GPT-3 的即时注入攻击– 我于 2022 年 9 月 12 日创造了术语“即时注入”
关于大型语言模型需要了解的八件事(PDF) 是 Simon了解阿谀奉承和沙袋的论文（2023 年 4 月）
Anthropic 的《克劳德的性格》讲述了他们如何为克劳德设计性格 – 2023 年 6 月 8 日，我对此的笔记。
为什么 ChatGPT 和 Bing Chat 如此擅长编造故事，Benj 在 2023 年 4 月提出了“虚构”一词。