Детектор невроза: что отличает хороший психологический тест и можно ли его обмануть

Фото Chris So / Toronto Star via Getty Images
Фото Chris So / Toronto Star via Getty Images
Все мы склонны к рефлексии и самоанализу — пытаемся разобрать в собственном поведении и характере, выяснить, что о нас думают окружающие. И обращаемся с этой целью к многочисленным психологическим тестам. Психофизиолог Полина Кривых объясняет, что делает тест надежным и какие аспекты нужно учитывать при его использовании

История психологических тестов началась во Франции, когда по заказу Министерства народного образования исследователи Теодор Симон и Альфред Бине начали разработку теста на IQ в 1900-х. Изначально он использовался для распределения школьников по классам с обычной или упрощенной общеобразовательной программой. «Школьный» тест на IQ стал первым среди многих: психологи поняли, что людей можно сравнивать не только по уровню интеллекта, но и по другим параметрам.

Как и любая наука, психология строит свои теории на основании данных, полученных в исследовании. Но так как психология изучает людей, данные для изучения тоже предоставляют люди. Главная проблема состоит в том, что люди не способны предоставлять объективные данные. Или, скажем так, не всегда в этом заинтересованы. Только психофизиологи фиксируют в своих экспериментах объективные физиологические показатели, например электрическую активность мозга или кожно-гальваническую реакцию. Почти все остальные области психологии анализируют субъективные данные, которые они получают при прямом или косвенном разговоре с человеком. Поэтому появились психологические тесты — они позволяют получить от людей данные, которые интересуют исследователя, и структурировать их. 

Тесты на способности или знания составляют на основе набора предлагаемых задач. В них включаются разные типы заданий с вариативными формулировками. Это исключает возможность получения высокого балла случайным образом: испытуемый не может несколько раз отметить правильный ответ, если не понимает алгоритма решения задачи. Следовательно, тесты дают более точный результат, чем данные, полученные в личной неструктурированной беседе.

Как и хороший друг, психологический тест должен быть надежным. Это означает, что тест выдает устойчивые результаты при повторном применении. Например, тест сегодня показал, что у вас хорошо развито творческое мышление, значит, он должен выдать такой же результат и завтра, и через год.

Сбитые с толку. Почему наши интуитивные представления о мире ошибочны

V значит валидность

Валидность показывает, насколько тест измеряет то, что должен измерять. Согласитесь, будет странно, если тест на IQ на самом деле будет измерять лидерские способности человека. Валидность бывает высокая и низкая: чем она выше, тем точнее и лучше тест справляется с поставленной задачей.

Дополнительно выделяют критериальную валидность. Она отражает, насколько результаты, полученные в тесте, согласуются с результатами других тестов, измеряющими то же самое.  Например, если два разных графических теста на определение самооценки покажут примерно одинаковый результат, то это будет свидетельствовать об их высокой критериальной валидности. 

А вот многочисленные популярные короткие тесты на IQ — как раз пример тестов с низкой критериальной валидностью. Все они измеряют один и тот же показатель — коэффициент интеллекта. Но если один и тот же человек пройдет за день пять быстрых тестов на IQ, скорее всего, он получит пять значительно отличающихся результатов. Причина кроется в неточном определении измеряемого параметра и случайном подборе заданий. Получается, что каждый тест измеряет какой-то один из аспектов этой характеристики, а не всю ее целиком.

Никогда не оглядывайся назад: какие ошибки мы постоянно совершаем, принимая важные решения

Everybody lies, или Шкала лжи в психологических тестах

А ведь доктор Хаус был прав: максима «все лгут» абсолютно верна для людей, когда они проходят психологические тесты. Каждый хотя бы раз отмечал желаемый ответ на вопрос. Именно поэтому во многих психологических тест-опросниках есть дополнительная шкала лжи. Она строится на основании нескольких вопросов из опросника и, сопоставляя ответы, показывает, насколько испытуемый искренен в ответах. Более того, часто в первый раз испытуемый отвечает на вопрос, руководствуясь принципом социальной желательности. Да, мы так устроены: люди обычно стремятся давать ответы, которые соответствуют моральным нормам и ценностям общества. Нередко такое искажение даже сам испытуемый не вполне осознает.

Mission: Impossible, или Почему хороший тест нельзя обмануть

Во-первых, в тестах есть шкала лжи. Она опирается на множество параметров: от среднего времени ответа до соответствия (или несоответствия) ответов на аналогичные вопросы. Во-вторых, каждый тест проверяется на обширной выборке испытуемых.  Если результаты не совпадают с показаниями других психологических исследований или тест обладает низкой валидностью или надежностью, то он считается недоработанным и не используется в профессиональной практике. То есть тест на финальном этапе — это отлаженная и «умная» система, в которой практически нельзя скрыть ложный ответ. 

Google it, или Почему тесты быстро устаревают

В век диджитализации соблазн проводить тесты на компьютере возрастает: это значительно облегчает обработку полученных данных. Однако онлайн-тесты быстро устаревают, и их приходится полностью менять.

В интернете множество сайтов, на которых за 5 минут предлагают узнать степень выраженности лидерских качеств или насколько вы интроверт или экстраверт. Постепенно тесты становятся очень известными: люди знают примерные вопросы и что нужно ответить, чтобы получить определенный результат. 

Типична ситуация, когда на компьютере человека, который проходит опросник, открыты две вкладки: с заданиями и подробной статьей в Википедии о трактовке результатов. Или же тест был придуман давно и стал настолько всем известен, что просто перестал работать. Например, есть точка зрения, что цветовой тест Люшера больше не показывает валидный результат. Люди знают, что светлые и теплые цвета — это хорошо, а темные и холодные — плохо.

Бич цифрового общества: как нас всех поразил страх упущенных возможностей и что с этим делать 

Cultural references, или Почему тест нельзя просто перевести

По причине информационной глобализации опросники, разработанные в странах с развитой традицией тестового формата, переводят на русский язык и применяют в России.

Есть два принципиально разных подхода к тому, как именно тесты можно приспособить для применения в другой стране. Первый вариант — это локализация. Все исходные вопросы переводятся на иностранный язык в стране, где тест разработан, а валидность проверяется на небольшой выборке носителей языка (например, студентах, приехавших обучаться в чужую страну). Таким образом, локализация — это экспорт теста. Она предоставляет возможность составить базу ответов на опросник по всему миру, так как вопросы везде одинаковы. Локализация применима для многих графических (невербальных) тестов. Например, матрицы Равена могут применяться на любой выборке независимо от языка — переводят лишь инструкцию.

Однако для многих вербальных опросников локализация дает некорректные результаты, потому что вопросы требуют адаптации в соответствии с культурными нормами общества. Причем необходимо не только изменить формулировки, но и «обкатать» тест на широкой выборке, пересчитать ключи к каждому ответу и т.п. Неадаптированные вопросы ставят испытуемых в тупик: для них описанные ситуации слишком умозрительны и непонятны. Например, сколько раз в жизни вам назначали курс антидепрессантов? В США и Европе их назначают довольно часто, а в остальных странах такая практика лечения не очень распространена.

Второй вариант — это адаптация, или интеллектуальный импорт. Над адаптацией теста работает группа специалистов из страны-импортера, урожденных носителей языка. Они не только переводят вопросы теста, но и пересматривают ключи — соответствие вопросов, ответов и измеряющих шкал. На основании культурных норм специалисты перерабатывают тест так, чтобы он был понятен носителям языка. Иногда в результате адаптации появляется новый тест, который является аналогом исходного для применения в конкретной стране. Такой процесс называется модификацией. К сожалению, часто встречается ситуация, когда тест еще не адаптирован до конца, но уже начинается применяться в таком «сыром» виде. Так у многих западных тестов складывается плохая репутация среди специалистов-пользователей, хотя на самом деле истинная проблема не в качестве теста, а в незаконченной адаптации.

Возможно, у вас возник вопрос, зачем вообще проходить психологические тесты. Как бы банально ни звучало, качественный тест действительно поможет узнать о себе что-то новое или разобраться в том, в чем вы не отдаете себе отчет. Вследствие социального давления люди часто не готовы признать те свои особенности, которые относятся к числу табуированных или кажутся не очень приятными. Тест поможет лучше понять себя и более объективно отнестись к ситуации. 
Но результаты некачественного теста, наоборот, не смогут предоставить вам новую и полезную информацию. Помните, что многие популярные в интернете тесты не имеют научно-доказательной базы. Поэтому тест тесту рознь: на тесты надейся, а сам не плошай.

Дополнительные материалы

И себе, и людям: как и сколько зарабатывают российские онлайн-сервисы психотерапии