你好,我是阿泽姆。
这真是一个星期了。 OpenAI 的服务器在新图像模型的重压下“融化”,而 Google 的 Gemini 2.5 Pro 在 Chatbot Arena 中的 ELO 提高了 40 点,从而提高了标准。但您来这里是为了远离头条新闻并了解正在发生的事情 – 所以让我们开始吧!
今天的版本由Sana为您带来——用人工智能做真正的工作。
超越语义启示录
认为生成式人工智能正在创造一种“语义启示录”,艺术和语言的意义正在被耗尽。社交媒体上充斥着以吉卜力工作室风格重新制作的图像,这些图像是由 OpenAI 的新图像模型精心制作的。该公司的服务器正在“融化”。
每个模因都被重新制作成吉卜力风格,家庭照片现在也变成了吉卜力风格,匿名账户也以吉卜力风格进行了脸部人肉搜索。不可否认的是,Ghiblification 很有趣。
埃里克说,大量吉卜力风格的图像一开始令人愉悦,最终导致了“语义上的满足”。一种空虚的感觉。捍卫创作者权利的埃德·牛顿-雷克斯称其为“历史上最大的艺术品抢劫案”。
我的看法是:在某些情况下,这种方法实际上可以提高艺术家的意识——他们的风格、他们的作品、他们的世界。吉卜力风格的我的肖像并不能取代观看吉卜力工作室电影或接触其他人造艺术的体验。如果说有什么不同的话,那就是它会引起好奇心。
我们在互联网时代早期看到了类似的模式,当时同人小说在网上爆发。版权所有者最初试图消灭它,满怀热情地追求停止和停止,而不是将其视为忠诚度加深和可以延长特许经营寿命的混音文化出现的标志。很难想象有人看到辛普森一家的版本后会想:“够了——我不需要再看《辛普森一家》了。”更有可能的是,它激发了怀旧或兴趣,促使他们寻找真实的东西。
但这种连接不是自动的。当一种视觉风格在没有背景的情况下被广泛复制时——就像吉卜力电影脱离了吉卜力电影的实际叙事和主题——它就有变得空洞的风险。这凸显了艺术的真正价值所在。如果风格本身通过人工智能成为一种廉价、容易生成的商品,那么人类创造力将不得不以更有意义的方式使自己与众不同——它需要“向上”移动。
这种转变表明,人们重新强调人工智能难以复制的内容:丰富的概念、原创的故事讲述、由生活经验塑造的个人视角,以及揭示意图和作者身份的透明创作过程。在一个充斥着令人信服的赝品的世界里,真实性——真实的、可验证的和人性化的——变得比以往任何时候都更有价值。这可能会重塑我们创造和消费艺术的方式,让我们更加欣赏艺术家的创作过程不仅存在,而且对作品本身至关重要的形式。
当然,具有讽刺意味的是,吉卜力工作室正是这样的:一个深刻的人性化过程,艰苦的劳动和逆流而上。创作者宫崎骏表示,“我们选择了与潮流相反的立场。”
控制论队友
Fabrizio Dell’Acqua 等人的最新研究。已经表明人工智能不仅仅是一种工具;它的功能就像一个队友。人工智能系统——无论是生成文本、生成图像还是分析数据——都可以充当近乎即时的协作者。最近的一些研究表明,与人工智能一起工作的个人和团队可以更快地交付成果,而且通常不会感到沮丧。 Dell’Acqua 发现,使用人工智能的个人表现与两人团队一样有效,而且速度快了 12-17%。 Harang Ju 和 Sinan Aral 进行的另一项新研究表明,人类人工智能团队的沟通量比纯人类团队多 45% ,但人类对内容创作的关注度高出 23%,对直接编辑的关注度低 20%,因为人工智能承担了大部分起草和完善工作。
然而,为了信任这些“控制论队友”,我们需要的系统不仅强大而且可靠。在这方面,Google 的新 Gemini 2.5 Pro 提供了大型语言模型所取得的进步的快照:超越了其在 Chatbot Arena 上的 40 点 ELO 改进。
在我看来,Gemini 2.5 Pro是大多数人应该使用的型号。忘记基准,氛围非常棒。它快速、透明,其结果具有比其他模型“更明智”的深度。
中国已经领先了
许多西方人仍然以过时的眼光看待中国,关注其历史上的“追赶”阶段——一个通过逆向工程外国技术、依赖低成本制造和攀登价值链所定义的时代。但那个时代已经彻底结束了。中国在几个关键领域已经从模仿者转变为创新者。最近一个引人注目的例子是,据报道, 收入刚刚超过 1000 亿美元的比亚迪推迟了其计划投资10 亿美元的墨西哥工厂,原因是担心其先进技术可能泄露给美国竞争对手! DeepSeek 正在用有竞争力的、具有成本效益的大型语言模型挑战西方实验室——就在本周早些时候,DeepSeek 漫不经心地放弃了最好的开源模型。西方保护其知识产权免受技术饥渴的中国侵害的旧说法已经彻底颠覆。正如 Gavekal Research 首席执行官 Louis-Vincent Gave打趣道:
世界上有两种人:一种人去过中国并看到了未来,另一种人没有去过中国——他们称前共产党为骗子。
这并不是要浪漫化中国的做法——环境外部性、公民自由和国家角色仍然存在严重问题。但忽视中国创新飞跃的现实,就是误读全球科技力量的走向。作为历史学家在周五的讨论中对我说:
任何对中国工程做空的人,对中国 STEM 做空的人都可能在 10 年内输掉赌注。问题在于,你正在押注中共管理中国经济政策和国家安全的能力。
一个月后我将访问中国,并将报告我的第一手经历。
流体智能
Anthropic 对 Claude(其 AI 模型)的新可解释性研究为大型语言模型的内部机制提供了令人着迷的视角。他们的团队深入研究了克劳德创作押韵和解决数学问题的过程。
调查揭示了一些结构化的、看似故意的行为:这里有计划的韵律,那里闪现出心算。然而,除了这些内部一致性的迹象之外,还有许多有动机的闲聊的例子——该模型在没有坚实基础的情况下组装了看似合理的解释。
这些发现让我想起 Murray Shanahan 2024 年的论文《Simulacra as Conscious Exotica》 。沙纳汉认为,法学硕士在根本上陌生的计算基础上进行角色扮演,同时进行类似人类的认知。因为我们的意识概念依赖于共同世界中的共同体现,所以我们在克劳德这样的模型中看到的可能只是一种引人注目的表现,而不是真实的思想。尽管如此,沙纳汉仍然保留了一种可能性,即在更丰富的环境中进行更扎实、持续的互动可能会促使我们修改这些概念——Anthropic 的工作推动我们更接近这一地平线。
考虑到这一切,新的ARC 基准将在未来几周和几个月内成为一项相当有趣的基准——新的 AGI 基准不会惩罚缺乏晦涩的知识,而是强调对流体智能、上下文敏感规则应用和效率的需求——所有这些功能都将单纯的下一个单词模仿与我们在生物思维中看到的多步骤集成区分开来。
别处
-
人工智能增加价值: Earth AI 的算法正在澳大利亚发现被忽视的铜、钴和金矿藏。麻省理工学院的化学家使用 AI 在几分钟内预测 DNA 的 3D 结构,从而加快了基因研究的速度。
-
H&M 计划创建由人工智能生成的真实模特的“数字双胞胎”,其所有权模型中人类拥有其双胞胎的权利。
-
核电初创公司 Terrestrial Energy 通过 SPAC 上市,并通过合并获得 2.8 亿美元的净收益。
-
对生物合成和生物信息技术最近取得的突破的回顾表明,未来我们可以通过将生物学与半导体技术相结合来克服传统计算的物理和能量限制。
-
据报道,苹果公司向英伟达的人工智能服务器下了 10 亿美元的订单,与戴尔和超微电脑合作构建他们的第一个生成式人工智能基础设施,这标志着苹果人工智能方法的战略转变。
-
科学家们设计了蛋白酶——在特定位点切割蛋白质的酶——选择性地降解导致帕金森氏症等疾病的蛋白质。
-
工程师们已经找到了如何在不影响水泥强度的情况下回收水泥。
-
一艘星际飞船在前往一颗(希望如此)适宜居住的系外行星的 250 年旅程中需要什么才能维持人口数量? 一次奇妙的极客探索。
感谢您的阅读!
今天的版本由Sana赞助。
企业人工智能并不一定很难。 Sana 的代理平台提供了一个统一的界面,用于构建基于公司数据的人工智能代理。可扩展的 API。企业级安全。深受最终用户的喜爱。
能力包括:
-
自动执行手动任务
-
出席并总结会议
-
跨工具完成任务
-
跨每个应用程序进行搜索
-
进行深入研究