寻找平衡：习惯性行为与目标导向行为的解释

科学家们引入了一种新的人工智能方法，该方法涉及习惯性和目标导向行为的相互学习，以相互支持。通过模拟探索迷宫的计算机模拟，这种方法能够快速适应不断变化的环境，并在个体熟悉特定环境后复制人类和动物的行为。这项研究不仅为快速和一致适应的人工智能系统的发展奠定了基础，还为神经科学和心理学中的决策提供了见解。

生物体和人工智能系统都可以从这种创新的方法中获益。

来自冲绳科学技术大学院（OIST）和上海微软研究院的研究人员发现，使用算法和人工智能的机器需要能够快速反应并适应不同的情况。在心理学和神经科学领域，行为通常分为两个类别——习惯性（快速且简单，但僵化）和目标导向（灵活，但复杂且较慢）。诺贝尔经济学奖获得者丹尼尔·卡尼曼将这两者称为系统1和系统2。然而，关于它们是独立且冲突的，还是相互支持的组成部分仍存在争论。我们提出了一种新的人工智能方法，其中习惯性和目标导向行为的系统学习彼此支持。这种方法能够快速适应变化的环境，并在个体长期适应某一特定环境后再现人类和动物的行为，正如模拟探索迷宫的计算机模拟所示。

这项研究发表在《自然通讯》上，不仅为在快速发展中的人工智能领域开发快速而可靠的系统铺平了道路，还为我们如何在神经科学和心理学领域做出决策提供了线索。研究人员开发了一个模型，该模型结合了习惯性和目标导向的系统，用于学习使用强化学习的人工智能代理的行为，强化学习是一种依赖于奖励和惩罚的学习方法。该模型基于最近备受关注的“主动推理”理论。研究人员创建了一个计算机模拟，模仿老鼠在视觉线索的指导下导航迷宫的任务，当它们到达目标时会获得食物奖励。

他们研究了这两个系统在与环境互动时如何调整和组合，并发现它们能够快速实现适应性行为。观察到人工智能代理利用强化学习来收集数据和增强自身表现。

我们大脑的偏好

一旦工作日结束，我们往往在自动驾驶模式下回家，依赖于习惯性行为。然而，如果你最近搬家并且没有注意，你可能会在无意中出于习惯开车到你的旧房子。当你意识到这一点时，你切换到目标导向行为并重新导航到新家。传统上，这两种类型的行为被认为是独立运作的，习惯性行为快速但僵化，目标导向行为灵活但较慢。“学习中从目标导向到习惯性行为的转变是心理学中的一个著名发现。我们的模型和模拟对此现象提供了解释：大脑偏好提供更大确定性的行为。随着学习的进展，习惯性行为变得 less 不可预测，增加了确定性。因此，大脑在经过大量训练后倾向于依赖习惯性行为，”前OIST认知神经机器人研究单位博士生和论文主要作者韩东琪博士表示。

对于人工智能尚未经过训练的新目标，它利用内部过程。

该模型使用习惯性行为的组合来规划其行动，使规划过程更高效，因为它不需要考虑所有可能的行动。这与传统人工智能方法形成鲜明对比，后者要求在训练中明确包含所有可能的目标以便能够实现。在该模型中，每个期望的目标都可以在没有明确训练的情况下实现，而是通过灵活地组合已学习的知识来实现。

“在灵活行为和习惯性行为之间达到一种平衡或权衡是非常重要的，”认知神经机器人研究单位负责人谷俊教授表示。“实现一个目标的方式有很多种，但考虑所有可能的行为是有代价的，因此目标导向行为受到习惯性行为的限制，以缩小选择范围。”

改善人工智能技术

韩博士在从事人工智能算法工作时，开始对神经科学和人工智能与人类智能之间的差异产生兴趣。“我开始思考人工智能如何能展现出更高效和适应性的行为，类似于人类。我想理解潜在的数学原理，以及我们如何利用这些原理来增强人工智能。这是我博士研究的驱动力。”

理解习惯性和目标导向行为之间的对比。目标导向行为在神经科学中尤为重要，因为它们可以提供关于注意缺陷多动障碍（ADHD）、强迫症（OCD）和帕金森病等神经疾病的见解。“我们正在研究支配多个大脑系统协作的计算原则。我们还观察到，像多巴胺和血清素这样的神经调节物质在这一过程中至关重要，”神经计算单位负责人土屋健司教授表示。“受到大脑启发并能够解决现实问题的人工智能系统可以成为理解大脑活动的宝贵工具。”

韩博士希望创建一种能够更像人类的人工智能，以实现复杂的目标。他希望人工智能在完成日常任务时具备与人类相似的能力。他相信，我们的大脑有两种学习机制相互协作，他希望更好地理解它们的工作原理，以实现目标。

拉斯维加斯著名贝拉吉奥喷泉旁发生枪击事件，2人死亡

特朗普在移民问题上获得选民的最好评价，但总体支持率仍然较低

Chipotle将在五年来首次推出新的蘸酱。你能猜到是什么口味吗？

抵押贷款公司火箭正在收购房地产经纪公司Redfin。两位首席执行官与YSL新闻进行了交谈。

拉斯维加斯著名贝拉吉奥喷泉旁发生枪击事件，2人死亡

特朗普在移民问题上获得选民的最好评价，但总体支持率仍然较低

Chipotle将在五年来首次推出新的蘸酱。你能猜到是什么口味吗？

抵押贷款公司火箭正在收购房地产经纪公司Redfin。两位首席执行官与YSL新闻进行了交谈。

寻找平衡：习惯性行为与目标导向行为的解释

震惊的脑癌突破：电场强化免疫攻击

为美而燃：TikTok护肤趋势如何伤害年轻女孩

一种常见抗生素如何助长细菌抗药性