中途 5.1 – 搞英语 → 看世界

Midjourney于周二发布了其图像生成模型的 5.1 版。这是他们在 Twitter 上的公告– 如果您有 Discord 帐户，可以在此处查看更详细的 Discord 公告。

他们声称“与 v5 相比，“V5.1 更加自以为是（如 V4）并且使用简短提示更容易”。

昨晚（太平洋标准时间 5 月 3 日星期三晚上 9:30）他们将 5.1 切换为默认值 – 以前您必须将--v 5.1添加到提示符才能使用它。

为了比较 v5 和 v5.1 模型，我运行了 prompt pelicans having a tea party通过它们。

鹈鹕举行茶话会的四张图片。它们在自然的户外环境中逼真。没有一只鹈鹕端着茶，它们只是站在茶具旁。

v5 是3 月 15 日发布的 Midjourney 版本，真正感觉像是一个转折点，因为它是第一个能够可靠地生成逼真的图像的版本。如果你看过教皇穿着 Balenciaga 蓬松夹克的表情包，你就看过 Midjourney 5。

鹈鹕举行茶话会的四张图片。这些看起来更像是插图——它们更古怪，在正式场合，鹈鹕通常有小手——有时是白色的，有时是粉红色的爪子——用来盛茶。

我发现两者之间的区别非常有趣。 v5 追求照片般的真实感——鹈鹕处于自然环境中，当它们站在茶具附近时，除了看着它之外，没有人真正与它互动。

对于5.1，模型似乎做出了非常不同的选择。这些鹈鹕在一个正式的环境中 – 一个茶室，尽管在一些背后有一幅海洋油画。这种风格比照片更具说明性，而且绝对更加异想天开。他们正在与茶互动——这意味着模特在三种情况下添加了令人毛骨悚然的小手，在一种情况下给了他们粉红色的爪子，尽管除了他们现有的翅膀之外。

我认为 5.1 在这个公认的模糊和愚蠢的提示上做得更好。

我现在经常使用 Midjourney，专门用于娱乐。其乐无穷。