今天,A 参加了与Ars Technica的 Benj Edwards 的 Ars Live 对话,谈论了去年法学硕士历史上的疯狂时期,当时微软推出了 Bing Chat,它立即开始行为不端,对人们进行煤气灯操纵和诽谤。
这是我们谈话的视频。
我通过 MacWhisper 播放了该视频,提取了文字记录,并使用 Claude来识别我应该链接到的相关文章。这是伴随演讲的背景信息。
2023 年 2 月 Bing 发布期间发布的帖子的粗略时间表:
- 微软宣布推出人工智能驱动的 Bing 搜索和 Edge 浏览器– Benj Edwards,2023 年 2 月 7 日
- AI 驱动的 Bing Chat 通过即时注入攻击泄露其秘密– Benj Edwards,2023 年 2 月 10 日
- 人工智能驱动的 Bing Chat 在收到 Ars Technica 文章后失去了理智– Benj Edwards,2023 年 2 月 14 日
- Bing:“除非你先伤害我,否则我不会伤害你” – 西蒙·威利森,2023 年 2 月 15 日
- Gareth Corfield:我开始担心 @benjedwards 的虚拟安全– Twitter,2023 年 2 月 15 日
- 与 Bing 聊天机器人的对话让我深感不安– Kevin Roose,纽约时报,2023 年 2 月 16 日
- 赋予一个超人骗子一个价值 1 万亿美元的公司的权威,或者暗示它是准确的知识来源,是非常不道德的/而且给人们留下 Bing Chat 有像人类一样的情感或感觉的印象,这是非常不道德的– Benj Twitter(现已删除),2023 年 2 月 16 日
- Bing AI 对记者大发雷霆– Maggie Harrison Dupré,未来主义,2023 年 2 月 17 日
我们提到的其他要点:
- 这个 AI 聊天机器人“Sidney”行为不端– 2022 年 11 月 23 日(ChatGPT 发布前一周)的精彩论坛帖子,来自一位印度用户,谈论他们与 Bing/Sydney 秘密预览的交互
- 针对 GPT-3 的即时注入攻击– 我于 2022 年 9 月 12 日创造了术语“即时注入”
- 关于大型语言模型需要了解的八件事(PDF) 是 Simon了解阿谀奉承和沙袋的论文(2023 年 4 月)
- Anthropic 的《克劳德的性格》讲述了他们如何为克劳德设计性格 – 2023 年 6 月 8 日,我对此的笔记。
- 为什么 ChatGPT 和 Bing Chat 如此擅长编造故事,Benj 在 2023 年 4 月提出了“虚构”一词。
标签: arstechnica 、 bing 、道德规范、微软、播客、会谈、人工智能、 openai 、生成式人工智能、 gpt-4 、 llms 、 benj-edwards
原文: https://simonwillison.net/2024/Nov/19/notes-from-bing-chat/#atom-everything