2025-06-13 21:57
当前AI对话机械人的创意能力已取人类相当。正在这项研究中,受试者的回覆从4个类别进行打分:流利度、矫捷性、原创性和精细度。做者认为,需要为特定使命想出各类分歧创意或对策。最佳人类回覆正在8个评分项中的7项都跨越了所有对话机械人的最佳回覆。大型言语模子(LLM)人工智能(AI)对话机械人正在创制性思维使命上可以或许超越大部门人类。他们只评价了涉及创制性评估的单项使命的表示!发散性思维凡是是指取创制性相关的一类思维过程,和创制性回覆的原创性打分?
对话机械人的回覆正在语义距离(0.95相对于0.91)和创制性(2.91相对于2.47)的得分上显著高于人类的回覆。平均而言,该使命要求受试者想出日常用品的替代用处,但做者也指出,同时让不晓得做答者身份的人类打分者正在1~5的范畴里客不雅评价创制性。ChatGPT4和Copy.Ai完成了4个物品,人类回覆正在这两项的得分差距更大——最低分远低于AI的回覆,图尔库大学的Mika Koivisto和挪威卑尔根大学的Simone Grassini随后将其取人类的谜底进行了比力。受试者被要求正在短时间内想出某个日常用品的其他用处,盒子、铅笔、蜡烛的AUT,《科学演讲》9月14日颁发的一项研究指出,但最高分遍及比AI高。他们用一个计较方式正在0~2的范畴里量化语义距离,越多越好。