ChatGPT-4在创造力测试中表现不俗

发布时间:2024-03-29 21:02:50 来源: sp20240329

  美国阿肯色大学科学家开展了一项最新研究,让151名人类参与者与人工智能(AI)工具ChatGPT-4在3项测试中进行对决,以评估二者的发散思维。结果显示,AI的表现优于人类。相关论文发表于最新一期《科学报告》杂志。

  发散思维是创造性思维的衡量指标,其特点是能对没有预期解决方案的问题提出独特的答案。在最新研究中,GPT-4提供了比人类参与者更新颖、更精细的答案。

  最新研究使用的3项测试分别是“替代用途任务”、“结果任务”及“发散联想任务”。“替代用途任务”要求参与者针对绳索或叉子等日常物品,提出创造性用途;“结果任务”要求参与者想象假设情况的可能结果,如人类不再需要睡眠会怎么办;“发散联想任务”则要求参与者提供10个语义上尽可能遥远的名词。“狗”和“猫”之间的语义距离不大,而“猫”和“本体论”等词之间的语义距离很大。

  研究团队对人类和AI工具回答问题的数量、长度和单词间的语义差异进行了评估。结果发现,在每一项发散性思维任务上,GPT-4提供的答案都比人类提供的答案更具独创性,且更精确。换言之,在一整套发散性思维任务中,GPT-4都表现出了更高的创造力。

  研究负责人之一、阿肯色大学心理学博士生肯特·休伯特表示,最新研究也有一些需要注意的地方,如研究中使用的指标都是对创造潜力的衡量,但参与创造性活动或获得成就是衡量创造能力的另一个方面。此外,AI依赖人类用户的帮助,除非得到提示,否则AI的创造力一直处于停滞状态。

  尽管如此,研究团队强调,大型语言模型正在迅速发展,并以前所未有的方式超越人类。它们能否取代人类的创造力还有待观察。但不管怎样,让AI作为灵感工具,为人类的创造性活动提供帮助已是指日可待。

(责编:张泰运、姜洁)