AI ИИ робот

Как GPT-4.5 обманула людей: Модель прошла тест Тьюринга в 3/4 случаев

GPT-4.5 от OpenAI продемонстрировала способность убедительно имитировать человека, пройдя классический тест Тьюринга с результатом 73% в персонализированном режиме.

Новое исследование, проведенное учеными Калифорнийского университета, показало, что модель GPT-4.5 практически неотличима от человека в онлайн-беседах. Тест Тьюринга, предложенный Аланом Тьюрингом в 1950 году, оценивает способность машин демонстрировать разумное поведение, похожее на человеческое. Участники эксперимента общались с двумя собеседниками, человеком и ботом, в текстовом формате. После этого им нужно было определить, кто из собеседников был человеком.

В эксперименте участвовали 126 студентов и 158 работников компании Prolific. ИИ использовал два типа подсказок: стандартную задачу убедить собеседника в своей человечности и персонализированную подсказку с конкретной ролью, например, «интроверт, который разбирается в интернет-культуре». В режиме с заданной ролью GPT-4.5 прошла тест в 73% случаев, что стало наилучшим результатом среди всех моделей. При стандартной подсказке этот показатель был всего 36%.

Для сравнения, модель LLaMa 3.1–405B прошла тест с персонализированным режимом в 56% случаев, а без персоны — в 38%. Ранее GPT-4 показала результат в 54%, а GPT-4o — всего 21%.

Кэмерон Джонс, ведущий автор исследования, отметил, что эти результаты показывают, что большие языковые модели могут заменять людей в коротких взаимодействиях, не вызывая подозрений. Это, в свою очередь, может повлиять на рабочие места, социальную инженерию и вызвать серьезные социальные изменения.