DALL·E 3和Midjourney是目前最好的两款AI 艺术生成器。它们都可以根据文本提示生成一系列匹配的图像,无论您的请求多么奇怪或疯狂。DALL·E 3 可能是最简单的入门工具,而 Midjourney 虽然使用起来有点笨拙,但却提供了一些最强大的功能。
自从这两款图像生成器发布以来,我一直在专业和个人方面对其进行测试,还有很多问题需要解决。让我们开始深入研究吧。
DALL·E 3 和 Midjourney 如何运作?
DALL·E 3 和 Midjourney 都接受了数百万甚至数十亿对文本-图像的训练,这使它们能够理解诸如狗、猎鹿帽和黑暗情绪照明等概念。这就是它们能够解析诸如“一幅加拿大男子骑着驼鹿穿过枫树林的印象派油画”这样的提示要求它们创作的内容的方式。
在实际生成图像时,他们使用一种称为扩散的过程。他们从一片随机噪声场开始,然后通过若干步骤对其进行编辑,以便更好地匹配他们对你的提示的解读。这就是为什么你每次都会得到不同的结果,即使你第二次尝试同一个提示:起始种子的随机性可以完全改变最终结果。在之前一篇比较 DALL·E 3 和稳定扩散的文章中,我将这个过程描述成有点像仰望多云的天空,找到一朵有点像狗的云,然后打个响指就可以让它变得越来越像狗。虽然事情远不止于此,但这不失为一种思考问题的方法。

当然,仅仅因为两个模型使用相同的技术来生成图像,并不意味着您将从 DALL·E 和 Midjourney 获得类似的结果。每个模型如何解释您的提示、它对各种参数赋予的权重、它们所训练的数据以及负责开发它们的公司的理念都会极大地影响输出结果。
这是 DALL·E 3 对“一幅描绘一名加拿大男子骑着驼鹿穿过枫树林的印象派油画”的解读。

这是 Midjourney 的。

正如你所见,DALL·E 3 在描绘加拿大人骑着驼鹿方面做得更好,但在我看来,Midjourney 的作品看起来更像是一幅真正的印象派绘画。
目前还不能以这些结果说明哪一个 AI 模型更好,我将在接下来的讨论中更加深入地探讨这些差异。
DALL·E 3 与 Midjourney 的对比
DALL·E 3 更易于使用
DALL·E 3 可通过ChatGPT、Bing Image Creator、Microsoft Paint和其他使用其 API 的服务获得。DALL·E 3 是ChatGPT 是最官方的选项,也是最容易使用的,不过,您需要成为ChatGPT Plus订阅者才能访问它,因此如果您不是,可以使用GPT导航网站(www.chatgpt5x.com)中的免费使用方案。
尽管有多种方式可以访问 DALL·E 3,但它们的工作方式大同小异,而且都非常简单:您只需让 DALL·E 3 为您创建图像即可。 如果您不知道自己想要什么,可以尝试几种不同的样式——尽管它们只是将关键字添加到您的提示中。

另一方面,Midjourney 从一开始就很尴尬。它没有网页应用。相反,你必须通过团队聊天应用Discord 来访问它。注册一个 Discord 账户并加入 Midjourney 的服务器并不难,但这对于国人来讲还是比较复杂,好的一点是GPT导航网站(www.chatgpt5x.com)也有直接使用的方式。
Midjourney 功能更强大
尽管有些笨拙,但 Midjourney 仍然有很多优点。它可能是目前最强大的 AI 图像生成器,至少如果你不准备训练自己的自定义模型的话。
让我们从参数开始。这里有一个完整的列表,但通过键入--相关命令,您可以控制图像的纵横比、图像的变化程度、从哪个种子开始,甚至是否要为无缝图案创建重复的图块。

您甚至可以使用另一张图片作为字符参考(它会尝试重新创建其中的字符)或样式参考(它会尝试匹配图像的样式)。两者都可以创建一致的图像,而这是 AI 图像生成器通常难以做到的事情。
然后还有一些工具可以让你放大、改变和编辑你的图像。一旦你运行了提示,你就会看到两组四个按钮:U1、U2、U3和U4,它们将相应的图像放大到 1024px 宽,V1、V2、V3和V4,它们重新运行你的提示以根据相应的图像创建更多变化。

放大图像后,您可以使用“放大(2 倍)”或“放大(4 倍)”按钮将其再次放大到 2048px 宽,甚至 4096px 宽。您可以创建更多变化,使用“变化(细微)”与起始图像紧密匹配,或使用“变化(强)”使其更加鲜明。您甚至可以使用“变化(区域)”更改图像的特定部分。缩小和平移(箭头)按钮可让您将创作扩展到其边界之外。打开混音模式,您可以拥有更多控制权,因为每次进行变化时都可以更改提示。在我们了解图像提示或混合等功能之前,这些功能允许您结合上传的多张图像的“概念和美感”。
DALL·E 3 的功能远不及这个功能集,尽管它的编辑选项自首次发布以来已有显著改进。您的第一个选择是让 ChatGPT 重新运行一个略有不同的提示,其中包含您想要进行的更改——这可能会成功也可能失败。
两者都能制作出出色的 AI 生成图像
尽管如此,DALL·E 3 和 Midjourney 都能创造出令人难以置信的图像。DALL·E 3 更快、更易于使用,但您对结果的控制较少。Midjourney 有时有点难以理解,但您可以更好地控制出图的外观和细节。
Midjourney 并不是经常出错,而是需要更多指导。我发现与其写长篇描述,不如给它一系列关键词更有效。此外,由于它具有不错的编辑工具,我更愿意接受不太理想的第一张图像,然后使用混合、变化和其他工具来创建我满意的最终图像。
总结:DALL·E 与 Midjourney:您应该使用哪一个?
对于大多数人来说,在 DALL·E 3 和 Midjourney 之间做出选择应该相对简单:
如果您想要目前最好的 AI 图像生成器,希望能够调整和编辑您的图像,并乐于解决它的诸多怪癖,那么 Midjourney 是一个不错的选择。
如果您想要简单且可靠地产生出色结果的选择,那么 DALL·E 3 就是您所需要的。
www.chatgpt5x.com当前均可免费体验两版绘图AI。