DeepSeek 发布的另一个令人印象深刻的模型。 Janus 是他们的“统一多模态理解和生成模型”系列——这些模型既可以接受图像作为输入,也可以生成图像进行输出。
Janus-Pro是本文附带的一个新的7B模型,在不完全开源的DeepSeek许可证下发布。
DeepSeek 称其为“Janus 的高级版本,显着提高了多模态理解和视觉生成”。
尝试这一方法的最简单方法是使用Hugging Face Spaces 演示。
标签:视觉 LLMS ,生成人工智能, deepseek ,人工智能, LLMS
原文: https://simonwillison.net/2025/Jan/27/deepseek-janus-pro/#atom-everything