Jsonformer:一种从语言模型生成结构化 JSON 的可靠方法
这是一个非常有趣的把戏。 LLM 面临的一个共同挑战是让他们可靠地输出特定 JSON 格式的数据,而不会偶尔弄乱并生成无效的 JSON 或输出其他文本。
Jsonformer 以一种真正巧妙的方式解决了这个问题:它实现了与决定接下来输出哪个标记的逻辑交互的代码,受 JSON 模式的影响。如果该代码知道双引号后的下一个标记应该是逗号,它可以强制针对该特定标记发出问题。
这意味着即使对于更小、功能更差的语言模型,您也可以获得可靠、健壮的 JSON 输出。
它是针对 Hugging Face 转换器构建的,但没有理由不能在其他环境中应用相同的想法。
原文: http://simonwillison.net/2023/May/8/jsonformer/#atom-everything