Граница между человеком и машиной становится всё более размытой. В предварительном исследовании, опубликованном на arXiv, языковая модель GPT-4.5 от OpenAI не просто прошла тест Тьюринга, но и в 73 % случаев была признана более человечной, чем реальные собеседники. Это значительно превышает порог в 50 %, необходимый для прохождения теста. Исследователи сосредоточились на качестве общения, а не на технических аспектах, и результаты оказались впечатляющими.
Тест Тьюринга, предложенный Аланом Тьюрингом в 1950 году, проверяет способность машины имитировать человеческое поведение. В классическом варианте судья общается с человеком и машиной, пытаясь их различить. В 2024 году команда из Калифорнийского университета в Сан-Диего (UCSD) модернизировала этот подход, проведя более 1000 трёхсторонних дискуссий с участием людей, ИИ и интервьюеров. Результаты показали, что GPT-4.5 с заданной личностью убедил 73 % участников, в то время как реальные люди были признаны таковыми только в 67 % случаев.
В эксперименте участвовали четыре модели: LLaMA 3.1-405B, ELIZA, GPT-4o и GPT-4.5. Им давали две инструкции: нейтральную («убедите, что вы человек») и с заданной личностью (например, молодого взрослого). GPT-4.5 с личностью достиг 73 % успеха, а без неё — только 36 %. LLaMA-3.1 показала 56 %, GPT-4o — 21 %, а ELIZA — 23 %. Участники часто не могли отличить GPT-4.5 и LLaMA от людей, особенно когда у моделей была заданная личность.
Однако эти результаты не доказывают, что ИИ обладает интеллектом, равным человеческому. Кэмерон Джонс, руководитель исследования, подчеркивает, что это лишь один из индикаторов особой формы интеллекта, присущей крупным языковым моделям. Важнее то, что такие модели могут незаметно заменять краткие человеческие взаимодействия, оставаясь нераспознанными.
Таким образом, GPT-4.5 и подобные модели демонстрируют впечатляющие способности в имитации человеческого общения, но их интеллект всё ещё далёк от человеческого. Тем не менее, их потенциал в замене кратких взаимодействий открывает новые горизонты для технологий и общества.

Дополнительная информация: [2503.23674] Large Language Models Pass the Turing Test
Источник: GPT-4.5 превосходит людей в крупномасштабном тесте Тьюринга