今天举办了一场 AI 研讨会,我们在会上介绍了 AWS 提供的一些生成式 AI 服务以及如何使用它们。这是相当高的水平,但我仍然从中得到了一些东西。
令人震惊的是,这些基础模型(例如在网络上预先训练的法学硕士)的集成有多少涉及自然语言。就像如果你构建一个具有特定个性的聊天机器人,你会以如下内容开始每个上下文:
你是一位友好的生活教练,试图提供帮助。如果你不知道问题的答案,你就说我不知道。 (问题)
这将扩展到领域知识。现在,您可以使用自己的数据集微调基础模型,但更简单但效率稍低的方法是手工制作一堆问题和答案对,然后将其直接输入到提示中。
这也可以扩展到代理(模型与之交互的代码)。我们没有在很大程度上涵盖代理,但在查看了一些营销材料后,在我看来,大部分集成都是指示模型将参数放入 XML 标签中(以便更“笨”的代理可以解析出来),以及如何解释结构化响应。
提示中的大量用自然语言编写的样板文件只是为了处理传递信息。我没想到会这样。
尽管如此,这还是很有趣的。尽管我没有动力进一步研究这一点,但我想了解更多有关如何连接外部数据源和代理的信息(涉及模型可用且不需要向量数据库的东西)精细转动。我不知道如何表示这些“事实”,以便模型可以使用它,或者即使这是一个东西)。