Midjourney于周二发布了其图像生成模型的 5.1 版。这是他们在 Twitter 上的公告– 如果您有 Discord 帐户,可以在此处查看更详细的 Discord 公告。
他们声称“与 v5 相比,“V5.1 更加自以为是(如 V4)并且使用简短提示更容易”。
昨晚(太平洋标准时间 5 月 3 日星期三晚上 9:30)他们将 5.1 切换为默认值 – 以前您必须将--v 5.1
添加到提示符才能使用它。
为了比较 v5 和 v5.1 模型,我运行了 prompt pelicans having a tea party通过它们。
中途 v5
v5 是3 月 15 日发布的 Midjourney 版本,真正感觉像是一个转折点,因为它是第一个能够可靠地生成逼真的图像的版本。如果你看过教皇穿着 Balenciaga 蓬松夹克的表情包,你就看过 Midjourney 5。
中途v5.1
我发现两者之间的区别非常有趣。 v5 追求照片般的真实感——鹈鹕处于自然环境中,当它们站在茶具附近时,除了看着它之外,没有人真正与它互动。
对于5.1,模型似乎做出了非常不同的选择。这些鹈鹕在一个正式的环境中 – 一个茶室,尽管在一些背后有一幅海洋油画。这种风格比照片更具说明性,而且绝对更加异想天开。他们正在与茶互动——这意味着模特在三种情况下添加了令人毛骨悚然的小手,在一种情况下给了他们粉红色的爪子,尽管除了他们现有的翅膀之外。
我认为 5.1 在这个公认的模糊和愚蠢的提示上做得更好。
我现在经常使用 Midjourney,专门用于娱乐。其乐无穷。
原文: http://simonwillison.net/2023/May/4/midjourney-51/#atom-everything