这个很长。归咎于谷歌,他们昨天推出了空炮人工智能。总的来说,每个人显然都在急于在年底前发货。这包括我,带着我的笔记本,上面写着要阅读和记录的内容……也就是说, “如果我有更多时间,我会写一封更短的信。”
我谷歌…
? 谷歌推出了可以自行使用网站的人工智能代理——“Mariner”是谷歌第一个真正的代理,与Anthropic 最近推出的代理类似。但实际上,它听起来更像是传闻中的 OpenAI“Operator”,因为它是基于浏览器的(而不是也可以使用其他应用程序的应用程序,例如 Anthropic 的应用程序)。这是有道理的,因为谷歌完全控制了 Chrome——等一下——从视觉上看,如果没有其他问题的话,这可能是一个问题。我猜测,由于反垄断案件和拟议的补救措施,谷歌不会将其完全融入 Chrome,而是将其保留为扩展(请注意其他人工智能产品也有扩展,例如 OpenAI)。无论如何,这个框架让我想起了早期的自动驾驶汽车——也就是说,一个人仍然需要坐在乘客座位上来完成一些任务。事实上,当 Mariner 工作时,您显然无法在该浏览器窗口中执行任何其他操作。本指南应该对这里的信任元素有所帮助——特别是因为它显然是在截取屏幕截图并将其上传到云中的 Gemini 进行实时分析,听起来很熟悉吗? ——但这听起来也有点乏味。 [纽约时报]
? 谷歌的 Astra 项目如何为 AI 代理带来新的视角——谷歌在 Gemini 2.0 揭幕仪式上展示了另一款代理。但是,“Mariner”仅限于网络浏览器,而“Astra”则希望在现实世界中自由。当然,这并不是谷歌第一次展示这个项目。但世界和技术似乎已经为此做好了准备。再次,您会回想起微软的 Recall (撇开隐私问题不谈)与苹果的 Visual Intelligence以及谷歌自己在 Lens 上的长期工作相结合。虽然这一切都可以在智能手机上运行, 但这显然是针对智能/AR 眼镜的技术。谷歌还没有正式生产这些产品。说到视觉智能,这是昨天发布的 iOS 18.2 中我没有提到的一个重要部分——那是因为它仅适用于 iPhone,所以我实际上并没有像其他功能那样在测试版中使用它(因为我已安装在 iPad 上)。但这可以说是苹果迄今为止发布的最有趣的人工智能。不仅仅是因为他们自己的实现,这是非常Google Lens-y(并且使用Google)。但更重要的是,它在主屏幕上也深度集成了 ChatGPT,这对 Apple 来说是大胆的! [轴]
? 谷歌推出更快的 Gemini AI 模型来为智能体提供动力– 你感受到这个主题了吗?代理商。代理商。代理商。代理商。新的“2.0”双子座模型几乎是一个又一个故事的事后想法。尽管这些代理目前仅处于有限的测试中 – 并且显然,存在很多错误且速度缓慢– 谷歌显然希望淹没这里的区域并在该领域占据早期的思想份额领先地位,尽管许多人已经在很长一段时间里都在谈论代理过去的一年。除了上面提到的两个之外, “深度研究”是 Gemini Advanced(即付费)用户现在可以尝试的工具。我用它写了一篇关于我自己的读书报告,效果很好。扎实的 B+。 (因为一些小细节错误而被标记,但我明白为什么,它们在网络上也是错误的。)它以一种很好的方式吸引了一些让我惊讶的花絮。另一位代理“Jules”专注于编码帮助,同时也有一个帮助玩视频游戏。从外部来看,OpenAI 似乎“赢得”了最初的 LLM 模型竞赛(即使基准来回变化),并且由于 ChatGPT 也赢得了消费者/开发者市场(即使其他人,如 Anthropic 的 Claude,通常会获得更好的分数) 。代理竞争已经开始——而且可能会更加分散,不同的代理用于不同的目的——谷歌自己的产品路线图可以证明这一点! [彭博?]
? Gemini 2.0 Flash:具有科幻流媒体模式的杰出多模式法学硕士– 哦,看,这个故事实际上是关于新模型本身的。即使只是第一个“Flash”版本,也有望比 Google 之前的顶级型号 Gemini 1.5“Pro”提高 2 倍的速度。但他们似乎对新模型的流 API 印象最深刻。 “这使您可以打开向模型发送音频和视频并实时返回文本和音频的双向流。”这看起来确实很杀手……[西蒙·威利森的博客]
我认为…
?️ 微软 AI 主管 Mustafa Suleyman:对话式 AI 是下一个 Web 浏览器– 离开 Google,但也有点留在 Google。苏莱曼是一位能够对几乎所有问题给出高度优雅、外交式回答的大师,而尼莱·帕特尔则在一些观点上做得很好,以提取一些有价值的信息。也就是说,对于被广泛报道的微软与 OpenAI日益激烈的关系,Suleyman 确实非常直接地表示,虽然他们现在将在当前一代模型上展开竞争,但微软将退居二线,让 OpenAI 做他们的前沿工作。现在,也许这是因为 OpenAI 已经沿着他们的下一个模型走上了这条道路,一旦它成为“当前一代”,微软也将在那里竞争——考虑到 LLM 预科的“人工智能墙”的概念,这个概念也很有趣。 -训练。鉴于比赛可能已经结束,微软可能很乐意放弃这场比赛!我确实发现他对在谷歌工作与在微软工作之间的区别的想法很有洞察力(当然,注意到他目前的偏见)。一个要点是:他显然认为谷歌比微软对市场的反应更加敏感。最后,他关于对话式人工智能是“下一个浏览器;这是下一个搜索引擎”的想法可能会帮助谷歌处理那个讨厌的反垄断案件! [边缘]
? 微软的人工智能新销售宣传:在人类身上花更少的钱– 与微软一样,有趣的是,但并不奇怪,微软( 和其他公司)在销售其人工智能产品的宣传上变得更加明确。尝试通过演示来说明人工智能工具可以做什么是一回事,这可能有效也可能无效,但为公司提供底线节省数字总是有效的。但关键当然是技术必须有效。现在还为时过早,但目前在某些领域似乎很有希望。转向代理只会让情况变得更糟。这个演讲的另一个关键是:它不能是关于解雇现有员工(我的意思是,在某种程度上,这肯定会发生,但这当然对公司和微软来说都是不好的),而是关于你赢得的员工数量不需要添加前进,否则你会这样做。毫无疑问,有些人仍然会对此提出异议,因为从某种意义上说,人工智能仍然在抢走工作。但这些都是比较理论化的工作,无法知道它们是否会开放。当然,高层的想法仍然是,释放此类工作以及人工智能工具将使现有员工的工作效率大大提高。 [信息?]
? 苹果正在与博通合作开发人工智能芯片——苹果将在数据中心使用他们的 M 系列芯片来帮助他们的人工智能产品供电的想法总是显得有点奇怪和暂时。虽然功能强大(并且拥有自己的“神经引擎”部分),但它们显然不是为此目的而构建的,并且其架构也不像 NVIDIA 的 GPU 那样。因此, 苹果与亚马逊的新“Trainium 2”芯片合作——因为无论出于何种原因他们不想使用 NVIDIA 的芯片——是有道理的。但对苹果来说更有意义的是打造自己的完全为人工智能量身定制的芯片。显然,这就是他们现在在博通的帮助下所做的事情。该报告对博通的实际角色有点回避——他们只是在芯片的链接/网络方面提供帮助,他们的专业,还是更广泛的帮助,就像他们现在对谷歌的 TPU 所做的那样? (感觉就像前者。)此外,这听起来像是将这些芯片带出大门并进入服务器的冲刺(听起来特别是为了推理,而不是训练),可能( 再次) 延迟/结束任何类型的“ M系列芯片的Extreme”变体。似乎每个人都在努力打破 NVIDIA 的市场主导地位,这有点疯狂。但考虑到他们目前的地位,这不足为奇!他们能完全保持领先吗? [信息?]
? 马克·扎克伯格的 Meta 向特朗普的就职基金捐赠 100 万美元– 看, 我对这顿晚餐很满意。如果不出意外的话,这似乎是谨慎的。这……有点多了。确实如此。这不是 Meta 过去做过的事情。这不是大多数公司都会做的事情。显然,除了试图讨好新政府之外,别无他法。这太明目张胆了,也许他们只是认为没有人会关心,因为这里不需要猜测?就是这样。我想起了电影《清晰而现实的危险》中的一个场景( 因为我似乎总是在谈论这个话题! ),杰克·瑞安给总统一些建议:“我会朝另一个方向走。如果记者问你是否和哈丁是朋友,我会说,“不,我们是好朋友”——如果他们问你们是否是好朋友,我会说,“不,不,我们是终生的朋友”——我会给他们没有什么可去的地方。没有故事。”我们距离扎克伯格在政治上保持“中立”的目标还有很长的路要走。那是八月。这次我会引用泰勒·斯威夫特的话——一篇简介中的范围怎么样? —— “八月溜走了。就像一瓶酒一样。” [华尔街日报?]
我链接…
- 谷歌还推出了他们的新 TPU“ Trillium ”,他们称其训练性能是其前代芯片的 4 倍,并“100%”用于训练 Gemini 2.0。他们显然还把超过 100,000 个连接在一起,这似乎是当今此类集群的关键数字…… [ VentureBeat ]
- 从业务角度来看, SiriusXM似乎陷入了困境。有人想知道,这对霍华德·斯特恩来说意味着什么——他现在对他们来说可以说更有价值,但随着他的合同即将到期,他们现在能负担得起他吗? [ 心率]
- 除了其他改进之外, Yelp与Apple Maps的集成还获得了更多功能,例如请求报价。这是有道理的,因为现在随着 Foursquare 关闭他们的指南,Yelp 对于该产品变得更加重要…… [ 9to5Mac ]
- 听起来《拜见父母 4》恰逢原作 25 周年纪念日。顺便说一句,这是我几年前曾在Red Hour Films工作过的联合制片公司。 [ 心率]
- 我们处于人工智能繁荣周期的哪个阶段?埃克森美孚目前正在致力于专门为数据中心开发天然气发电厂。这些将是定制工厂,不连接到更广泛的电网,这将简化并加速开发。 [ 纽约时报]
- Apple 2024 年App Store 大奖由专业视频应用Kino领衔,成为年度最佳 iPhone 应用。 [ 麦克谣言]
- 唷,终于有新的流媒体服务了。 CNBC+将于 2025 年第一季度推出……抛开玩笑不谈,感觉这个频道可能有一定道理,因为它在许多办公室里都是一个很好的后台频道。此外,鉴于康卡斯特的分拆……[ 综艺]
- 众所周知,搭载 M4 的 MacBook Air即将推出。奇怪的是,最新macOS更新中的代码在实际发布之前(明年初)就确认了它们的存在。 [ 麦克谣言]
- 本田,通用汽车关闭Cruise不仅会导致他们遭受财务打击。沃尔玛、软银和微软(以及其他公司)现在也必须注销数亿美元的投资。仅后者就减记了 8 亿美元。哎哟不断出现。 [ TechCrunch ]
- iOS 18.2的一项非人工智能功能让一些人(尤其是音乐家)感到兴奋吗?语音备忘录应用程序中的分层录音…“老实说,我认为这将永远改变我们制作音乐的方式。我确实如此,” Michael Bublé 以最能想象到的 Michael Bublé 方式说道…[ 9to5Mac ]
我引用…
“我们的创立座右铭是用眼睛、耳朵和声音开发人工智能,帮助您在现实或数字世界中生存。”
——Greg Wayne ,DeepMind 研究员,给出了高层授权,谷歌现在显然正在全面交付(或至少预览)该授权。
“现实世界”元素尤其有趣,因为谷歌与苹果(也许还有三星)一样,由于其遍布世界各地的数十亿台设备而拥有独特的优势。随着法学硕士培训的第一波浪潮可能会放缓,真实数据无疑对于持续进步至关重要。也就是说:Meta、微软、OpenAI、Anthropic、亚马逊以及所有其他公司可能仍然会发现自己在这个新世界中由于智能手机的主导地位而再次处于劣势。除非其他一些设备能够大规模运行并交付。眼镜。 AI 引脚。 ETC 。 (或者,我想,如果监管机构强迫苹果和谷歌更多地开放他们的设备……)
望远镜快讯
MG Siegler 每日时事通讯
平日里从远方寄来的…