机器能否梦想下一个重大科学突破？

人工智能革命新科学发现的雄心

无限实验推动新的科学发现的梦想可以追溯到催生科学怪人可能性的想象力。19世纪令人毛骨悚然的痴迷于制作没有大脑的人造身体的动画，这与当代科技对没有身体的有活力的人工大脑--或人工智能(AI)--的迷恋相呼应。但人工智能能帮助自动发现新的科学知识吗？最近的一项研究测试了最新的大型语言模型(LLM)如何兑现推动人工智能的科学研究的承诺。

现代科学的挑战

今天，科学知识正以前所未有的速度增长。每年发表数以百万计的新研究论文--这些信息是任何研究人员都无法完全吸收的。在人类认知的局限之外，存在着仍在探索的潜在想法和创新的广阔空间。虽然人类可以创造性地综合不同的观点，但我们处理和整合这些不断扩大的知识的能力超出了我们的身体限制。

这就是为什么汤姆·霍普，艾伦人工智能研究所的研究员，也是最近一篇论文--科学灵感机器为新奇而优化(SCIMON)--的合著者，觉得有必要研究这一迷人的挑战。SCIMON是一个创新的框架，旨在利用LLMS的力量进行科学发现。它的目标是通过从现有文献的海量数据库中检索和合成新的科学想法来增强人类的创造力。

汤姆·霍普：“虽然人类的认知在推断和创造能力上极其强大，但在探索这个巨大的思想潜在空间，这个由你可以组合和研究的各种不同事物组成的组合空间方面，我们的认知仍然非常有限。”

SCIMON说：整体方法是最好的

输入SCIMON。SCIMON框架是由旨在增强科学发现过程的研究人员开发的，它利用LLMS的力量来利用嵌入在科学文献中的集体知识。SCIMON帮助研究人员发现突破性的见解并提出创新的研究方向。这一尖端工具代表着在使用人工智能加速和加强科学发现方面迈出的重要一步。

但与专注于二进制链接预测的传统人工智能模型不同，SCIMON采取了一种更全面的方法，纳入了问题背景并迭代地产生新的想法。

SCIMON通过涉及多个重要组件的复杂框架运营。首先，它将详细的背景背景作为输入，包括当前的问题、实验环境和动机。这种背景为SCIMON的灵感检索过程奠定了基础，该过程可以搜索过去的科学论文以寻找相关的想法和解决方案。

“通过处理我们的问题上下文并以一种能够从大规模库中检索不同金块或知识片段的方式表示它们，我们可以将检索到的任何内容综合为某种可操作的灵感或见解，帮助我们做出决策，甚至有可能自动化其中一些决策和假设。”- 汤姆·霍普

检索到的灵感不仅被激发--它们还被用作产生新想法的种子。SCIMON迭代地将这些生成的想法与现有文献进行比较，在每一步进行新颖性优化。这个过程确保最终输出具有相关性和原创性，突破当前科学理解的界限。

例如，SCIMON团队在他们的论文中描述了一种场景，其中系统处理与优化复杂功能相关的问题，并从热力学和群体智能中获取灵感。这种方法导致了有关基于自然现象类比的优化技术的新颖假设。

实验和发现

在全面评估中，SCIMON通过GPT-4等最先进的LLM进行了测试。结果是有希望的--虽然标准的LLM经常产生通用或渐进的想法，但SCIMON的方法显着提高了生成假设的新颖性和相关性。特别是，迭代新颖性提升机制对于完善想法以确保它们真正具有创新性至关重要。

论文中包含的几个成功的案例研究展示了SCIMON如何帮助产生新的科学发现：

一般NLP领域实验

在其中一项实验中，SCIMON的任务是在自然语言处理领域提出新的研究方向。系统检索了动态知识提炼的相关工作。它提出了一种将终身学习和动态适应技术相结合的方法，这是人类专家认为可行且创新的一种新颖方法。

模型变体：测试了各种模型变体，包括GPT3.5FS、GPT4FS和T5+SN+CL。结果：GPT4FS和GPT4FS+KG在新颖性和技术深度上远远超过其他型号。这些模型产生的想法与输入上下文有很大不同，并得到了人类评估者的高度评价。

生物医学领域案例研究

在生物医学领域，Meditron-7b模型在PubMed数据集上进行了微调，并在训练后集上进行了测试。受过研究生教育的人类评估者对80%的人工智能产生的研究方向给予了肯定的评价。在许多情况下，评估者甚至发现人工智能的建议比最初的想法更详细，技术也更先进，突显了该模型激发创新生物医学研究的能力。

使用的模型：Meditron-7b。程序：该模型在从PubMed检索的大规模数据集上进行了微调，并在超过其培训前截止日期的测试集上进行了评估。结果：具有生物化学领域研究生水平教育的人类评估者对生成的方向中80%给予了肯定的评价。与NLP领域的实验相比，评估者对所产生的输出比关于技术细节的基本事实更满意。

使用检索提升迭代新颖性

SCIMON采用了一种迭代的新颖性提升机制来提炼人工智能产生的研究想法。例如，对用于预测语音单元边界的初始建议进行迭代增强，以提出自适应语音单元边界检测(ASUBD)。这种方法结合了注意力机制和强化学习，使这个想法非常新颖和适应性强，人类专家认为这是非常有创新性的。

方法：该模型生成一个初始想法，并与科学文献的参考语料库进行迭代比较。如果生成的想法与现有研究过于相似，则指示模型更新其概念以使其更新颖。示例：该模型最初为与语音单元边界相关的种子项提出了停顿预测模型。它最终提出了一种新的方法，称为自适应语音单元边界检测(ASUBD)，通过迭代更新，结合注意机制和强化学习进行最优预测。

迭代新颖性助推测评

对SCIMON的迭代新颖性提升方法在提高研究思路新颖性方面的有效性进行了评估。人类注释者发现，更新后的想法与最初的建议不同，但往往更具创造性和原创性。这一迭代过程帮助SCIMON改进了其产出，使其更加独特和创新，受到该领域专家的好评。

程序：人类注释员评估再生的想法是否与原始的、更新颖的想法有实质性的不同，以及第二次迭代是否增加了新颖性。结果：迭代的新颖性提升方法增强了想法的整体新颖性，尽管生成的想法往往会重组常见的概念，而不是创建全新的概念。

SCIMON和科学发现的未来

SCIMON能力的影响是深远的。通过部分假设生成过程的自动化，SCIMON可以帮助研究人员浏览铺天盖地的科学文献，识别隐藏的联系，并提出新的研究方向。这加快了发现的步伐，并使获得尖端科学见解的途径民主化。

“LLM是我们的延伸，扩大了我们搜索相关知识和灵感的方式，让我们看到了狭窄领域之外的东西，发现了我们原本可能错过的灵感金块。”--汤姆·霍普

尽管全自动科学发现的梦想仍在地平线上，但SCIMON代表着朝着实现这一愿景迈出的重要一步。人工智能和人类研究人员之间的合作有望开启科学的新领域，在这个领域，人工智能可以扩展人类创造力和决策的触角。

SCIMON证明，通过正确的框架和迭代过程，人工智能可以帮助我们产生新的科学，推动我们已知的边界，并加速未来发现的旅程。

来源

-采访SCIMON论文的合著者汤姆·霍普：https://rossdawson.beehiiv.com/p/accelerating-scientific-discovery-prompt-building-exercises-amplifying-journalists-case-technooptimi - 西蒙纸： https://arxiv.org/pdf/2305.14259 这个故事发表在Generative AI上。在LinkedIn上与我们联系并关注Zeniteq，了解最新的人工智能故事。

订阅我们的时事通讯，随时了解有关生成人工智能的最新新闻和更新。让我们共同塑造人工智能的未来！

机器能够梦想出下一个重大科学突破吗？