使用 Image Playground 生成图像。
Apple Intelligence 又回来了,而且这次是视觉化的。随着 iOS 18.2、iPadOS 18.2 和 macOS 15.2 的更新,苹果正在推出第二轮生成式 AI 功能,包括首批与图像相关的功能,如 Genmoji、Image Playground 和 Image Wand。
总体而言,这些功能比 10 月份发布的第一批功能更加雄心勃勃,其中一些功能建立在这些功能的基础上:例如,现在能够在书写工具中对文本进行特定更改。这也标志着第三方首次将生成式人工智能功能集成到苹果自己的平台中,并能够连接到 ChatGPT。
随着这些版本的发布,Apple Intelligence 功能也在地域上扩展,推出更多英语版本,甚至还包含一些非 AI 相关功能,例如 AirPlay 的改进和 iOS 上的新邮件分类功能。
但最新一轮的人工智能功能是否会推动苹果改善用户生活的努力呢?让我们深入了解一下。
有一个 Genmoji 可以做到这一点
在 Apple Intelligence 的图像相关功能中,似乎没有一个比 Genmoji 更有前途。该功能在 iOS 18.2 和 iPadOS 18.2 上可用,但 macOS 15.2 上不可用,承诺让用户只需提供文本提示即可创建无限的自定义表情符号,与苹果自己的产品完美融合。您可以像使用任何其他表情符号一样使用它们(至少在 iMessage 对话中):包括内联、贴纸,甚至作为回击。
与所有生成人工智能一样,现实更加复杂。虽然 Genmoji 可以很好地提供相对简单的提示(例如,它为我创建了一个相当不错的“鸭子侦探”),但它通常需要一些按摩才能获得完全正确的结果,而且它提供的选项往往最终会很奇怪。同样可能的是,尝试让它生成您想要的内容时也可能会失败;本身并不是因为护栏或不当,而仅仅是因为苹果情报部门似乎不明白你在问什么。
我确实发现用户界面有时有点笨拙。通过点击生成图像下方的按钮,您可以选择使用通常的乐高人物颜色创建表情符号,也可以(与 Image Playground 不同)按照联系人中的真实人物进行图案化。在我看来,这或多或少是成功的:在前一种情况下,因为它超级卡通,看起来比其他任何东西都更像漫画,但作为对立面,它有时仍然令人毛骨悚然和奇怪。我不太喜欢表情符号版本的我的样子,虽然你可以调整起始图像,但我想我的结论是我根本不关心算法解释我的图片的方式。我对此无能为力。
看哪,我创造了各种各样的 Genmoji,从最好到最差排名:白鹭、戴墨镜的狐狸、鸭子侦探、厨师接吻并打着“好”的手势、吐司上的虾、丹播客、吹风笛的苏格兰人、聪明的思维、黑人和白人白色饼干,眼球看着时钟。
综上所述,我确实从 Genmoji 中得到了一些娱乐,即使只是为了解决如何设计正确的查询来生成特定图像的心理难题:说“Jason Snell 双臂交叉说不”(专业提示:点击并按住表情符号键盘中的 Genmoji 将显示用于创建它的查询)。即使是糟糕的表情符号也常常值得分享,只是为了嘲笑人工智能有多么奇怪:见证我尝试创建一个“聪明思考”表情符号,结果却创建了一个可怕的灯泡生物。我确实很感激,如果你不喜欢某个特定的图像,你可以无休止地滑动,让 Genmoji 不断创建新的选项,即使它们通常都是一个整体。
最后,源茂司感觉基本上是无害的。与其他人工智能图像生成工具不同,其风格的局限性意味着它还不太容易被滥用1 ,而且它还有一个好处,就是不会让人感觉它会让大量艺术家失业;唯一面临风险的是苹果自己的表情符号设计师,我认为该公司足够聪明,意识到从自己的人工智能引擎中弹出的内容并不像人们实际创造的内容那么好。但它也让人感觉这可能只是一种新奇的东西。六个月后,我想知道我创建的 Genmoji 有多少实际上仍会经常使用。 ——丹·莫伦
在图像游乐场上幻灯片
使用单独的标记(左),您可以根据特定的人构建图像。
Image Playground 是一款新的 Apple 构建的应用程序,可根据您的提示生成图像。与 Genmoji 一样,Image Playground 可以使用照片库中的人物来生成基于他们的图像。创建的图像符合皮克斯风格的动画或手绘插画风格。
这些图像需要以您图书馆中的人物为模型 – 没有工具可以生成“戴高帽的男人”或“曲棍球运动员”等通用人物 – 相反,它必须是您认识的人的图像。这不仅令人沮丧,而且我的朋友和家人的肖像质量也有很多不足之处。他们中的一些人看起来有点像我认识的人,但大多数时候他们看起来有点可怕和可怕。所以 Image Playground 确实想制作漫画,但它们通常都不是很好。当然,这些图像的质量远远落后于当今其他基于人工智能的图像生成器。
我对Image Playground引擎本身没有太多值得赞扬的地方,但我认为它的界面实际上相当不错。要构建图像,您需要不断将关键字添加到某种“概念云”中,然后查看结果。在任何时候,您都可以单击一个项目并使其消失,并且将生成不涉及该关键字的图像。这是一种可视化数据如何输入生成模型的巧妙方法。
令我印象深刻的是,该应用程序不仅仅返回一张图像并声明工作已完成。相反,生成的图像会显示在特殊视图中,您可以通过该视图滑动到使用相同提示生成的其他图像。整个界面是关于试听不同的生成图像,直到找到令您满意的图像,这正是处理像基于人工智能的图像生成这样分散的系统的正确方法。
这让我觉得苹果的应用程序界面设计游戏仍然很强大,但其图像生成游戏仍然严重缺乏。 Image Playground 可以让你让自己和你的朋友难堪,直到新鲜感消失,但它需要更好(并且更灵活)才能有机会保持远程相关性。 —杰森·斯内尔
挥动你的图像棒
使用关键字和源绘图(每个图像上的小插图)作为输入,Image Wand 生成或多或少反映原始绘图的图像。
新的图像棒工具可让您将粗略的草图变成更详细的图像。要开始生成图像,您可以从 Apple Pencil 工具面板中选择新的图像棒工具,然后圈出您制作的需要 AI 升级的草图。然后,系统会要求您使用文本描述您的图像。
这很重要:虽然您的草图是最终生成图像的输入之一,但图像棒模型也需要文本描述。这感觉有点像作弊,但可以这样想:与 Image Playground 不同,Image Playground 无法对生成的图像进行合成控制,Image Wand 允许您将图像请求与特定的铅笔草图结合起来,因此理想情况下结果将是看起来更像你想要的。
在我的测试中,这个草图确实很有帮助——尽管它并不是一个奇迹创造者。我画了一辆在夕阳下的路上行驶的汽车,一个从左向右飞驰的足球,一只睡莲叶上的青蛙,一只戴着棒球帽的棕熊,甚至还有我小学时画不完的三角形宇宙飞船,并且在大多数情况下,Image Wand 给我的选项都在基本草图附近。
与所有 Apple Intelligence 图像生成工具一样,您可以添加更多文本提示,以期控制输出,尽管它在 Image Wand 中的效果不如其他地方。它还会不断为您提供选项,以便您可以滑动以查看生成您请求的图像的其他尝试。当您接受图像时,它会被交换到您的笔记中,就在您的草图之前所在的位置。
我不确定我对 Image Wand 的感觉如何。它不能创造奇迹,但它可以起到相当于在餐巾纸背面画草图并制作出看起来有用的东西的作用。在某些工作流程中可能有一席之地,例如公司演示和设计组合中仅用于放置的图像。或者只是为了让你自己的笔记内容更漂亮。
Apple 的其他限制也适用。我试图画一个戴着高帽、留着胡子的普通人,但遭到彻底拒绝。苹果似乎非常乐意在 Genmoji 和 Image Playground 中创建代表真人的图像,但它无法绘制通用的安倍·林肯?我实在不明白。 —JS
先生,ChatGPT;聊天GPT、Siri
Siri 经常妨碍 ChatGPT。 (您可以通过明确要求 Siri 使用 ChatGPT 来覆盖此设置。
这波新功能还首次包括与 ChatGPT 的连接。它包括将 Siri 查询传递到 ChatGPT 的能力,这将根据查询类型动态发生。写作工具中还有新的生成功能,我将在稍后讨论。
Apple 允许您选择使用 ChatGPT 的方式。您可以完全拒绝使用它,以免费模式使用它(您每天的 ChatGPT 查询数量受到限制,有关这些限制的信息显示在“设置”的 Siri 和 Apple Intelligence 部分中),或者链接它到 ChatGPT 帐户并获得作为免费或付费 ChatGPT 用户的所有好处,包括更多查询和历史记录列表。默认情况下,Apple 会在向 ChatGPT 发送任何查询之前询问您,但如果您习惯使用该服务,则可以关闭此设置。
这种整合仍然感觉像是一项正在进行的工作。我向 Siri 提出了许多本应触发 ChatGPT 的问题,但却没有触发,而且 Siri 的答案往往比 ChatGPT 提供的答案要糟糕得多。当我知道更好的数据源遥不可及时,我一直觉得 Siri 妨碍了我。 (积极要求 Siri 使用 ChatGPT 是一种解决方法。)
我尝试了很多查询,但举个例子,当我问 Siri 巴斯特·波西一生的战争是什么时,它告诉我一场名为“波西战争”的小冲突。当我告诉它询问 ChatGPT 时,它给了我答案:44.8。 (我还问两位经纪人,波西在大学时是否曾与其他未来的大联盟球员一起打球,两人都给了我错误的答案,后来,ChatGPT 也给了我正确的答案。一如既往,你必须验证每一个“事实”人工智能告诉你。) ——JS
订购书写工具
此更新添加了更多文本输入以及经常连接到大型语言模型的自由联想功能。例如,写作工具(在第一波功能发布中主要允许您点击不同的按钮来更改文本)现在有一个自定义文本输入字段。当您选择某些文本并调出书写工具时,您可以点击输入文本来描述您希望 Apple Intelligence 执行哪些操作来修改文本。例如,我选择了这一段,然后输入“让这更有趣”。
这是它所做的:
此更新增添了更多大型语言模型闻名的文本输入和自由联想魔法。例如,写作工具——在第一波功能发布中主要让你像文本编辑忍者一样点击不同的按钮——现在有一个自定义文本输入字段。当您选择某些文本并调用书写工具时,您可以点击输入文本来描述您希望 Apple Intelligence 对文本执行的操作。例如,我选择了这一段,然后输入“让这个更有趣”,希望人工智能能把它变成一部喜剧杰作。
还有一个新的 Compose 命令,可以直接将您的请求传送到 ChatGPT,允许您使用该模型的功能为您编写新文本。我要求它以苏斯博士的风格创作一首关于法学硕士的八行诗,这就是它给我的内容:
在一个充满零和一的世界里,他们成长,
大型语言模型,可显示信息。
他们在数字世界里喋喋不休、胡言乱语,
用虚拟双手处理文字。
在字节和比特中,他们学习并说话,
他们从庞大的数据树中寻找答案。
他们充满天赋和乐趣,模仿和思考,
在数字眨眼间创作故事和真相。
(你看,当语言模型战斗时,这是一场语言模型之战。当他们在瓶子里战斗时,这是一场语言模型瓶子之战。而且…… )
此更新还添加了对新的书写工具 API 的支持,该 API 允许不使用 Apple 标准文本控件的第三方应用程序仍然提供书写工具作为一项功能,这很有帮助!我已经看到写作工具出现在许多以前版本不支持它的应用程序中,这是一件好事。
总的来说,对于那些与书面文字有困难的人来说,写作工具是一个很好的功能,这些更新让它变得更好了一些。最重要的是,令我感到鼓舞的是,苹果公司在上次更新中迭代了刚刚发布的一项功能。这让我充满希望,随着时间的推移,我们会看到苹果继续推动和改进所有的苹果智能功能。 —JS
让我们视觉化,视觉化
谁知道是什么颜色啊!
将人工智能与相机功能集成对于苹果来说并不是什么新鲜事:该公司多年来一直在其照片管道中构建机器学习,包括能够在照片库中搜索包含狗或猫的图像,甚至获取有关的信息图片中的位置、植物或人物。但随着 iOS 18.2 在 iPhone 16 或 16 Pro 上运行,苹果通过视觉智能更进一步,它可以根据相机当前正在查看的内容为您提供信息。
该功能可通过按住相机控制按钮来调用,它提供了三个按钮:相机快门、询问和搜索。其中搜索是最基本的:就像谷歌自己的搜索应用程序一样,您可以点击它并根据图像中的内容获取结果。例如,在我孩子的一辆玩具火车上使用它时,eBay 上会弹出其他玩具火车的列表,其中至少包括一辆相同型号的玩具火车。这不是一个新想法,但如果您只是想快速获得结果,它会很方便。
“询问”按钮利用前面提到的 ChatGPT 集成,允许您询问有关图像中内容的问题,您可以通过键入或听写来完成此操作。例如,我可以问“这是什么火车?”它将将该查询发送到 ChatGPT,然后提供一个包含答案的文本框。我还尝试了一下,将它指向一袋咖啡,询问烘焙程度有多深,然后让它通过看封面来描述某本书的内容。
只要不以此来判断的话……
正如您所料,简单问题的答案都得到了很好的解答。列车描述相对准确(只要列车文字正面朝上——当它颠倒时,ChatGPT 会错误地将其识别为 MTA 列车),但由于某种原因无法预测颜色;根据我在制造商网站上检查的信息,咖啡的描述是正确的;本书的摘要即使不引人注目,也很合理。然而,它确实认为木制玩具香蕉是形状像香蕉的橡皮擦,所以你的里程可能会有所不同。
如果您不想站在那里将手机指向某个物体,您还可以点击 Visual Intelligence 中的快门按钮拍摄某物的照片,然后使用“询问”或“搜索”。此模式还将尝试推测您可能需要什么信息并提供上下文选项,尽管偶尔会出现滑稽的结果。例如,当我拍摄玩具火车的照片时,它会主动翻译顶部的文字,并将其解释为 MVTA,因为它认为这是俄语。这并没有错——俄语中的字符“B”相当于英语中的“V”,但我不确定什么上下文线索导致它猜测文本需要翻译。
我对视觉智能有一些争议。其中一个是该功能的要点:虽然我确信能够从图片中总结一本书或一部电影是有用的,但我很难找到这个功能实际上适合我的生活的地方,而不是说,做一个谷歌搜索。真正让它有用的是与苹果生态系统其他部分的更直接的联系。例如,如果我可以在商店浏览时将其指向一本书并说“将其添加到我的阅读列表中”,或者拍摄一家餐厅的照片并将其添加到我想吃饭的地方的地图集合中,那么这可能会很方便。但这是一种奇怪的、罕见的孤立体验,它与苹果生态系统的其他部分失去了联系——你用它拍摄的照片不会保存到你的相机胶卷中,甚至无法共享到Notes等应用程序或发短信给联系人。为此,您必须切换回常规相机界面。
视觉智能偶尔会出现一些奇怪的失误。
我的第二个问题是,将此功能添加到“相机控制”按钮中会继续使该功能超载。您按住“相机控制”即可调出“视觉智能”,但如果您忘记单击该按钮,然后按住,您将开始拍摄视频 – 您必须锁定手机并重新开始才能调出“视觉智能”。老实说,我有一段时间甚至忘记了这个功能的存在,我不得不查找如何使用它,而不是相机控制的其他方面。如果这些手机上有另一个控件,您可以专门分配给视觉智能……比如说,一个让您执行操作的按钮。但您找不到任何其他方式来访问 Visual Intelligence:控制中心中没有选项,也没有通过快捷方式访问,甚至无法要求 Siri 打开 Visual Intelligence。也许在 iOS 的未来版本中,这将更好地与 Apple 平台的其他部分集成。目前,视觉智能更多地是一种概念证明,而不是一个实际功能。 —DM
非智能特征
除了最新的 Apple Intelligence 功能外,这些平台更新还包括一些不属于 AI 旗帜的其他改进。其中一些是相当实质性的——邮件分类——而其他的只是一些不错的小增强。
镜子,镜子,只要出示这个应用程序
如果您曾经不得不将 Mac 连接到电视或投影仪(无论是通过连接电缆还是使用 AirPlay),并且因为这是一个全有或全无的建议而感到恼火,那么 macOS 15.2 在这方面带来了一个很好的改进:您可以现在不仅可以选择镜像或扩展您的显示,还可以共享特定的应用程序或窗口。
现在,“系统设置”>“显示”中提供了默认首选项,允许您设置是否默认镜像整个屏幕、扩展桌面、提示您输入应用程序或窗口,或者询问您要执行的操作。不过,在我的测试中,将“询问要显示什么”设置为默认值似乎不起作用 – 它保留在我之前使用的任何设置上。
此对话框可以更轻松地避免意外共享屏幕的错误部分。
您还可以使用“屏幕镜像”菜单栏控件或单击“控制中心”中的“屏幕镜像”来即时更改此设置。您将看到外部显示器所显示内容的缩略图,以及更改模式或停止共享的选项。选择共享一个窗口或应用程序,您的Mac将在其主显示屏的顶部显示一条提示,并在每个窗口上显示一个浮动对话框,让您选择镜像该窗口或该应用程序中的所有窗口;还有一个方便的任务控制按钮,可以显示机器上打开的所有窗口。
屏幕镜像菜单中方便的缩略图(也可以通过控制中心使用)向您显示外部显示器上的内容。
从应用程序镜像多个窗口有点奇怪。无论它们在 Mac 上的大小如何,您都可以在黑色背景上看到它们,并且您可以像往常一样使用 Mission Control,甚至可以使用新的窗口平铺功能 – 这基本上就像共享您的 Mac 屏幕,但其他所有内容都被涂黑。 Windows 还将获得紫色的“共享”徽章,以前用于指示它们是通过 Zoom 等软件共享的,除了其他窗口管理控件之外,它还允许您关闭共享。
我还很欣赏,当您不共享任何内容时,外部显示器上现在有一个默认屏幕,显示“从菜单中选择镜像”,这比默认情况下镜像显示器并意外共享您的电子邮件感觉要好一些或消息或任何打开的内容。
总的来说,对于 Mac 上一直感觉有点准系统的功能来说,这是一个受欢迎的补充。它对于共享内容更加强大和透明,对于那些经常进行演示的人来说,这将是一个实质性的改进。— DM
绝对正确
作为一名长期的 Mail 用户,我随时准备张开双臂欢迎任何实质性的功能添加;苹果的电子邮件客户端可以多年不发生任何重大变化。因此,我对邮件分类的前景感到兴奋,它带来了包括 Gmail 在内的竞争对手多年来提供的功能。
启用分类后,您的收件箱现在分为四个类别:主要、交易、更新和促销。就是这样;您无法更改这些类别或添加您自己的类别。 Apple 会自动将您的各种消息过滤到这些类别中,您可以选择您的“邮件”应用徽章(如果您启用了该功能)是否仅显示主要类别或所有类别中的未读消息。
自动过滤……很好。与苹果的垃圾邮件过滤没什么不同,我发现它时好时坏。如果您不同意邮件的标记方式,您至少可以重新对其进行分类,尽管一开始找到该选项可能有点困难。您必须在消息上向左滑动,点击三点图标,然后选择对发件人进行分类;或者您必须点击消息线程,然后点击右上角的三个点才能找到相同的命令。那时,您的选择要么坚持使用苹果的自动模式,要么手动将其分类为其他选项之一。请记住,它似乎是特定于发件人的,这意味着如果您从同一“源”收到多种类型的电子邮件,则需要将它们单独分类。 (例如,有关您购物过的公司的促销电子邮件应过滤到“促销”,而发货通知应过滤到“交易”。)
一旦找到控件,对发件人重新分类就相对容易了。
在某种程度上,这些类别是你对它们的分类。我参加的会议的电子邮件是否应该包含在“促销”或“更新”中?来自我所在的在线问答联盟的电子邮件怎么样?很多都是想出一个系统,然后坚持下去。它肯定无法解决您所有收件箱臃肿的问题。此外,我不想花时间对电子邮件发件人进行分类 – 如果我这样做,那么我就会在几十年前创建一个复杂的文件夹层次结构。我还发现,更多通过 Apple过滤器的垃圾邮件最终进入了我的主收件箱,这也不是很好。
此功能的另一部分是来自同一源的消息现在被分组在一起。这种情况似乎只发生在非主要收件箱中。这个想法是,如果你订阅了大量的时事通讯,你可以在一个线程中快速浏览它们,而不是让它们在你的收件箱中随意传播。如果您正在寻找特定发件人的内容,这会很方便。
我不完全确定我应该使用这个菜单做什么。
不过,我确实发现一些界面选择令人困惑。例如,每个线程的顶部都有一个标头,其中包含发件人的姓名和图标。 (苹果公司在宣布此功能时表示,发件人将能够添加自己的自定义图标来帮助验证其身份,但这似乎尚未被广泛采用。)在名称下方有一个小标题,上面写着类似的内容“18 项促销活动 • 46 条消息。”点击它可以在“显示所有消息”和“促销”之间切换。我认为这意味着它会向您显示来自该发件人的未归类为促销的消息……但我很困惑为什么会存在这种差异。它似乎将来自单个域的多个发件人分组,但没有得到很好的解释。
我欣赏邮件分类的一个意想不到的好处:当您滑动以删除其中一个类别收件箱中的消息条目时,它会删除该特定线程中的每条消息。这是清除收件箱中旧邮件的好方法:我不需要多年前的时事通讯或我忘记删除的旧促销信息。
然而,这个功能最大的疏忽在于它莫名其妙地仅限于 iOS。因此,您可以习惯对收件箱进行分类……但只能在 iPhone 上进行。在您的 Mac 上,是的,甚至在您的 iPad 上,您将拥有与以往相同的旧单一收件箱。我不知道阻碍是什么,但它不在 iPadOS 上的事实表明,苹果可能更多地在界面上进行斗争,而不是在底层技术上——也许它还没有完全确定这在多方面的表现。窗格用户界面。
尽管我心存疑虑,但我确实很感激苹果公司试图帮助我们平息电子邮件浪潮,我希望这个功能能在这方面有所帮助。接下来做消息! —DM
不管天气如何,它来了
谁不喜欢菜单栏中的温度?不是这些人。现在 Mac 上有了天气应用程序,Apple 也加入了这个游戏:您现在可以将当前的温度和条件放在菜单栏中。
一键查询天气!
这一切都非常简单和基本:您不会在这里找到颜色编码的温度或紫外线水平,甚至找不到当地的超级小气候。单击该图标,您将看到更多详细信息,包括当天的高温和低温、任何当前警报、一些即将到来的每小时天气预报以及其他保存位置的温度和条件(无论如何,前五个 – 更多信息被隐藏)在可折叠的“其他位置”选项下方)。选择这些位置中的任何一个都会打开天气应用程序并打开相关位置。选择警报将带您进入包含详细信息的 Apple WeatherKit 页面,选择每小时天气预报将打开天气应用程序到您当前的位置并弹出“条件”。
对于大多数人来说,这将是一个很好且受欢迎的补充——它花了这么长时间才出现,这几乎令人惊讶。如果您想要更多可定制的东西,那么您可能知道在哪里可以获得它或者很乐意制作自己的版本。
我唯一的小抱怨:弄清楚如何打开此功能!您在天气应用程序中找不到它;相反,您必须打开“系统设置”,选择“控制中心”,然后一直滚动到底部以找到“天气”,然后选择“在菜单栏中显示”。这是来自特定应用程序的选项中唯一的一个,并且它确实也应该在应用程序的设置中可用。 —DM
- 一般来说,如果您输入照片中没有的真人姓名,则不会起作用。但由于某种原因,我能够生成“莱斯利·尼尔森”的源字。看起来像他吗?不是特别。很奇怪。 ↩
原文: https://sixcolors.com/post/2024/12/ios-18-2-macos-15-2-review-picture-not-so-perfect/