近日,一项发表在《自然》上的研究报道了创新人工智能(AI)系统——Centaur。它可以预测人们在各种情况下做出的决定,而且比利用心理学经典理论做出的推测要好。
与谷歌Deepmind的AlphaGo不同,Centaur可以模拟一系列任务中的人类行为,包括赌博、玩记忆游戏、解决问题等。在测试过程中,Centaur甚至可以预测人类将如何在未经训练的任务中做出选择。该系统创建团队认为,有一天它可能会成为认知科学领域有价值的工具。
“你可以在没有实际人类参与者的情况下进行硅基实验。”德国慕尼黑海姆霍兹人类中心人工智能研究所认知科学家马克尔 Binz表示,当传统研究太慢,或者很难招募儿童或精神疾病实验参与者时,这种人工智能工具可能非常有用。
长期以来,科学家们一直在努力使用特定的任务模型来模拟人类的广泛行为,但很难模拟大量任务中的人类行为。Binz和他的同事们希望突破这一局限性。他们花了5天时间基于160个心理学实验的大量数据来微调美国Meta公司开发的LLM-LLAMA。在这些心理学实验中,6万人在各种任务中做出了超过1000万的选择。最后,研究人员得到了Centaur。
研究人员测试了centaur预测未包含在训练数据集中的参与者行为的能力。在32项任务中,centaur在预测参与者的选择方面优于llama和其他14种认知和统计模型。唯一的任务是参与者判断句子语法是否正确。
面对培训任务的修改版,centaur表现不错,甚至在逻辑推理等不同于以往培训的任务中也表现不错。
尽管Centaur功能广泛,但研究人员表示,它仍然有局限性。例如,它可以预测一个人在给定的任务中可能做出的选择,但“无法预测他们需要多长时间”。
研究人员表示,他们正在将训练数据集扩展到现有数据集的四倍。目前,许多数据来自受过西方教育的工业人士,这可能会限制centaur在不同群体中的应用。
赞一个