迈向真正的人工通用智能（AGI）的进展已经碰壁。

大多数人工智能基准衡量技能。但技能并不是智力。可以做什么？

几十年来，对人工通用智能(AGI)的追求一直吸引着研究界的注意力。

AGI指的是人工智能系统执行人类可以执行的广泛任务的能力，而不是明确地编程这样做。这意味着我们寻找一个能够学习、推理和适应新情况的系统，就像人类一样。

然而，尽管在该领域取得了重大进展，AGI仍然是一个难以实现的目标，今天大多数人工智能系统仍然局限于狭窄的任务和领域。

为什么呢？

人工智能不擅长的地方

AGI的主要障碍之一是现代人工智能系统依赖记忆而不是推理。这些系统，我们都知道语言大模型(LLM)，擅长记忆它们训练数据中的模式，并将它们应用于邻近的上下文。

然而，他们缺乏根据新案例产生新推理的能力。

这种局限性是因为LLM严重依赖于记忆而不是推理，并且它们不能基于不寻常或创新的情况产生新的推理。

另一个问题是人工智能系统无法在其训练数据之外进行泛化。例如，一个接受过国际象棋训练的人工智能系统可能能够在国际象棋中击败人类，但它不能将其知识转移到其他棋类游戏中，如跳棋或围棋。

这种未能推广的情况是实现AGI的主要障碍，因为它限制了系统将其知识应用于新情况的能力。

新的范式和新的基准

2019年，被超过250万开发人员采用的开源深度学习库Kera的创建者、谷歌软件工程师兼人工智能研究员François Chollet发表了一篇有影响力的论文《关于智力的测量》，其中他引入了一个衡量未知任务上人工智能技能获取效率的基准：抽象和推理语料库(ARC-AGI)

最后，正如每一门好的科学都应该做的那样，我们必须从定义开始。对AGI的定义是一个普遍共识，它被定义为“一种可以使大多数有经济价值的工作自动化的系统”。虽然这确实可以被认为是一个有用的目标。它也是一种不正确的智力衡量标准。

为了朝着更智能、更像人类的系统有意识地取得进展，我们需要遵循适当的反馈信号：我们需要定义和评估智能。

衡量特定任务的技能并不能很好地代表智商。

技能、记忆力、智力

技能在很大程度上受到先验知识和经验的影响：无限的先验或无限的培训数据允许开发人员为系统“购买”技能级别。这掩盖了系统自身的泛化能力。

现代人工智能(LLM)已被证明是伟大的记忆引擎。他们能够记住训练数据中的高维模式，并将这些模式应用到相邻的上下文中。

这也是他们明显的推理能力的工作原理。LLM实际上并不是推理。相反，他们记住推理模式，并将这些推理模式应用到邻近的上下文中。然而，他们不能基于新的情况产生新的推理。

另一方面，智力在于广泛的或通用的能力；我们必须调整我们对动漫能力的定义，认为它是一个能够有效地获得训练数据之外的新技能的系统：甚至更好的…

系统的智能是对其在一定任务范围内的技能获取效率的衡量，涉及先验、经验和推广难度。--弗朗索瓦·乔莱特，《智力的测量》

我们如何衡量这种智力？

大多数人工智能基准衡量的是技能。但技能不是智力，我们刚刚看到了，对吗？

2019年诞生于同一项研究的人工通用智能抽象和推理语料库(ARC-AGI)被认为是AGI唯一的正式基准。

抽象与推理语料库(ARC)是专门为测试人工智能系统在一定任务范围内的技能获取效率而设计的基准。

ARC-AGI由独特的培训和评估任务组成。每个任务都包含输入-输出示例。拼图般的输入和输出呈现了一个网格，其中每个方块可以是十种颜色中的一种。栅格可以是1x1到30x30之间的任何高度或宽度。

正如我们所看到的那样，它看起来确实像是一组涉及图像的任务，需要推理和抽象来解决。

这里有一个明确的意图：验证人工智能系统从示例中学习并应用这些知识来解决新的、看不见的问题的能力。这是类人智力的一个关键方面，通常被称为“流动智力”。

ARC基准非常重要，因为：

它挑战了当前的机器学习方法，这些方法难以处理需要这种抽象推理的任务。
它帮助研究人员开发更接近实现人类水平智能的人工智能系统。

多学科方法

人工通用智能（AGI）的进展已经停滞。LLM接受了难以想象的大量数据的训练，但他们仍然无法适应尚未接受过训练的简单问题，也无法创造新颖的发明，无论多么基础。

Chollet不败的2019年人工通用智能抽象与推理数据库（ARC-AGI）是AGI的唯一正式基准。

这对人类来说很容易，但对人工智能来说很难。

最近，纽约大学教授、Meta首席人工智能科学家Yann LeCun公开表示，如果我们想在AGI领域取得进展，我们就不应该研究LLM..

我喜欢这种挑衅，我相信每一位人工智能研究人员都很清楚这一挑战。我要说的是，大学的研究人员应该在这方面领先几步。学院通常精通多学科方法来解决问题，但他们缺乏资源(资金和计算能力)。

然而，目前人工智能研究的趋势是走向闭源研究，这限制了思想和知识的共享。这种趋势是由“规模就是你所需要的”的信念和保护竞争优势的愿望推动的。这种方法扼杀了创新，并限制了实现AGI的进展速度。

总是有例外的…

Meta是公平的：免费为世界提供人工智能

Meta的基础人工智能研究团队正在推动人工智能民主化和全球创新

Blog.stackademic.com

另一方面，开源研究促进了合作和知识共享，从而加快了AGI的进展速度。通过开放研究，来自世界各地的研究人员可以为开发更智能的人工智能系统做出贡献，新的想法和创新可以从不同的角度涌现。

人工智能研究缺乏透明度和协作，导致人们误以为AGI即将到来，这正在影响人工智能监管环境。监管机构正考虑在AGI即将到来的错误假设下，为人工智能研究设置障碍。

事实是，没有人知道如何建立AGI，

开源研究可以帮助指导更智能的AI系统的开发，并提供更准确的一般智能衡量标准。

ARC挑战赛有着竞争的历史，从2020年在Kaggle举行的第一届ARC-AGI比赛开始，随后是2022年的ARC挑战赛和2023年的ARC挑战赛，最近的一次是2024年ARC奖，奖金超过110万美元。

结论…

对AGI的追求是一个复杂和具有挑战性的目标，但也不是一个不可能的目标。

要克服现代人工智能的局限性，为AGI铺平道路，我们必须成为开源研究的积极支持者。

但更重要的是，我们必须从不同学科的角度，参与一场关于什么是智能的公开辩论。

只有到那时，我们才能提高AGI的进展速度，因为这将允许任何人，无论他们的编程专长如何，为开发更智能的人工智能系统做出贡献。

准备好向AGI迈出多年来的第一个重大飞跃了吗？无论你是谁，从哪里来，做什么谋生，都欢迎你加入这个大赛。新的想法可能来自任何地方。可能是你？

如果这个故事提供了价值，并且你想表示一点支持，你可以：

-为这个故事拍了很多次 -突出需要记住的相关部分(以后你更容易找到它们，我也更容易写出更好的文章) 学习如何开始构建自己的人工智能，下载这本免费电子书-在Medium上关注我 -阅读我的最新文章https://medium.com/@fabio.matricardi

AI代理的持续崛起

智能体是生成式人工智能的未来吗？让我们开始学习如何在我们的电脑上免费使用它们！

Blog.stackademic.com

人工愚昧与人工智能泡沫

克服自己的偏见，从ABC做起：一条艰难的必由之路。

Pub.towardsai.net

LLMABC：《构建LLM型应用程序》--AI未来的门户

产生式AI?时代，即使是错误也是创新的机会

Generativeai.pub

从随机鹦鹉到用心机器：学习朗链的智能AI之路

诚实地评价本·奥法斯的新书《用朗链生成人工智能》。LLm限制和解决方案…

Medium.com

资源和参考资料：

ARC奖-什么是ARC-AGI？

详细了解衡量AGI进展的唯一AI基准。

Arcprize.org

关于智力的衡量

为了有意识地朝着更智能、更像人类的人工系统迈进，我们需要遵循…

Arxiv.org

ARC奖2024

创造一个能够解决前所未见的推理任务的AI

Www.kaggle.com

GitHub-fchollet/ARC-AGI：抽象推理语料库

抽象推理语料库。通过在GitHub上创建帐户，为Fchollet/ARC-AGI的发展做出贡献。

Github.com

快速灵活：抽象推理任务中的人类程序归纳

抽象推理语料库是…最近提出的具有挑战性的程序归纳数据集