Гипотеза Спирмена (Inhkmy[g Vhnjbyug)

Перейти к навигации Перейти к поиску

Гипотеза Спирмена — вариант объяснения различий результатов в тестах интеллекта среди представителей разных рас. Изначальная формулировка была высказана Ч. Спирменом[1] и гласила, что величина различий результатов темнокожих и белых в тестах на когнитивные способности положительно связана с тем, какие факторные нагрузки имеют эти тесты по общему фактору интеллекта (фактору g). Более поздняя формулировка утверждает, что величина различий в средних оценках по тестам когнитивных способностей между выборками темнокожих и белых полностью или в основном зависит от степени, в которой данные тесты измеряют общие умственные способности, или фактор g. Её предложил в своих работах А. Дженсен[2], разделив также сильный и слабый варианты этого утверждения.

Источник расовых различий в интеллекте и, соответственно, в оценках по тестам интеллекта Спирмен и Дженсен видели в биологических предпосылках. Их идеи была с интересом воспринята многими исследователями расовых различий. Например, Дж. Ф. Раштон[англ.] часто обращался к данным Спирмена и Дженсена в своих исследованиях, утверждая, что в основе интеллектуального разрыва между расами лежит генетика[3]. Его работы, однако, неоднократно критиковали за расизм[4] и неточности изложения привлекаемых данных. В 2020 году факультет психологии университета Западного Онтарио официально заявил о признании большей части идей Раштона расистскими[5].

Хотя изначально гипотеза была призвана объяснить лишь различия между представителями популяций белых и темнокожих, в более поздних исследованиях начались попытки перенести её на результаты сравнения разных этнических и национальных групп.

Краткая история

[править | править код]

С самого начала исследований интеллекта была замечена разница между средними тестовыми оценками, получаемыми на темнокожих и белых выборках. Однако величина этой разницы варьировалась в зависимости от выполняемого когнитивного теста. Различия в результатах представителей данных групп, а также нестабильность величины этих различий в разных тестах теоретически могут быть связаны:

  1. с характеристиками самого теста (культурной нагруженностью, языковыми особенностями и т. д.);
  2. с различиями в развитии отдельных когнитивных способностей у представителей разных выборок;
  3. с тем, как данный тест измеряет общие умственные способности (фактор g).

Последнее объяснение было развито из наблюдения, сделанного Ч. Спирменом в работе 1927 года[1]. Комментируя исследование, в котором 10 тестов применялись для измерения когнитивных способностей у белых и темнокожих американских детей, он отметил, что, хотя темнокожие дети в среднем получают более низкие баллы по всем тестам, разница с результатами белых детей сильнее выражена в тех из них, которые имеют бо֜льшие факторные нагрузки по фактору g. В логике факторного анализа это означает, что результаты решения таких тестов в большей степени зависят от уровня общих умственных способностей испытуемых.

В 1985 году А. Дженсен с опорой на идеи Спирмена явно сформулировал гипотезу, которой и присвоил имя последнего. Дженсен описал её в двух вариантах: сильном и слабом.

  • Сильный вариант утверждает, что различия результатов в тестах интеллекта между популяциями темнокожих и белых обусловлены исключительно вариативностью общего интеллекта.
  • Слабый вариант утверждает, что различия результатов в тестах интеллекта между популяциями темнокожих и белых обусловлены в большей степени вариативностью общего интеллекта.

Пытаясь найти эмпирическое подтверждение выдвигаемой гипотезе Дженсен использовал слабый вариант формулировки. Им в основном пользовались и другие исследователи.

В 1998 году Дж. Ф. Раштон[англ.] ввёл в научный обиход понятие «эффект Дженсена»[6] для обозначения случаев значимой положительной связи факторных нагрузок по фактору g в субтестах интеллекта с некоторой переменной Х. Он обобщил явления такой связи с рядом биологических характеристик в контексте своей наследственной теории расовых различий.

Через некоторое время стали появляться работы, в которых проверялась применимость гипотезы Спирмена не только в отношении различия темнокожих и белых, но и в отношении разных национальностей[7], этносов, а также их локальных популяций[8]. Так исследователи пытались определить степень универсальности гипотезы. Некоторое влияние на смену фокуса исследований оказала активно развернувшаяся в научных кругах дискуссия о критериях выделения рас, а также социальные движения против расизма.

В XXI веке, несмотря на неоднократное подтверждение связи различий оценок с факторными нагрузками по фактору g, появляются данные, не согласующиеся с предложенной Дженсеном гипотезой. Вопрос интерпретации этой связи остаётся открытым в связи с неутихающими дискуссиями о научном расизме и этических аспектах расовых исследований. Основное внимание позднейших работ, посвящённых гипотезе Спирмена, направлено на выявление широты области популяционных различий, к которой она может быть применена, а также на усовершенствование метода её проверки.

Метод проверки гипотезы

[править | править код]

Спирмен выдвинул свою идею, не имея прямого эмпирического её подтверждения. Процедура оценки данной гипотезы описана Дженсеном как метод коррелированных векторов (MCV)[2].

Порядок проведения

[править | править код]

В общем виде классическая процедура выглядит следующим образом. Целевые выборки проходят одни и те же тесты интеллекта. Далее для каждой группы в отдельности проводится процедура эксплораторного факторного анализа или анализа главных компонент (PCA). В качестве фактора g выделяется первая главная компонента, первый главный фактор или фактор второго порядка (как утверждает Дженсен, принципиальной вычислительной разницы между тремя этими вариантами нет). Далее вычисляется степень схожести паттернов факторный нагрузок в двух выборках, для этого используется коэффициент конгруэнтности, высокие значения которого указывают на близкие показатели факторный нагрузок тестов в двух выборках.

Среднее значение различий между группами берётся в стандартизированном виде — его показателем выступает величина эффекта (d Коэна).

Основным для непосредственной проверки гипотезы Спирмена является вычисление корреляции между значениями величины эффекта и факторными нагрузками тестов по первому главному фактору. При этом берутся факторные веса большей по объёму выборки (при условии конгруэнтности их значений с меньшей). Дженсен использовал в своих исследованиях метод ранговой корреляции Спирмена, указывая на то, что он не требует допущений относительно дисперсии используемых данных.

Респонденты

[править | править код]

Отдельно Дженсен подчёркивал, что сравниваемые группы не должны отбираться специальным образом по критерию высоких показателей интеллекта, в противном случае репрезентативность данных утрачивается, что играет не в пользу гипотезы.

Используемые тесты

[править | править код]

Исследования, проводимые в рамках когнитивной подхода к изучению интеллекта, неоднократно показывали, что простые тесты, построенные на времени реакции, имеют меньшие факторные веса по фактору g, чем комплексные психометрические тесты. Поэтому чаще в подобных исследованиях применяются именно психометрические тесты интеллекта, хотя в литературе приводятся и показательные случаи различий результатов в исполнении простых заданий (таких как прямое и обратное воспроизведение чисел) с разным вкладом в фактор общего интеллекта.

В последних исследованиях наряду с тестами способностей для проверки гипотезы Спирмена стали использовать также тесты академических достижений, составленные на основе образовательного материала[7]. Такое изменение связано с критикой идеи гипотезы, которая будет обсуждаться ниже.

Связь с другими эффектами

[править | править код]

Эффект Флинна и анти-эффект Флинна[9]

[править | править код]

В 1980-е годы Дж. Флинн обобщил данные о повышении среднего балла по тестам интеллекта приблизительно на 3 единицы в 10 лет. Такой поколенческий рост интеллектуальной способности и был назван эффектом Флинна. Позже в скандинавских странах было зафиксировано обратное явление — спад среднего балла в более поздних когортах. Подобное изменение тенденции позже зарегистрировали и в других странах и назвали его анти-эффектом Флинна, или обратным эффектом Флинна.

Научным сообществом обсуждаются четыре варианта объяснения двух этих явлений: социокультурный, статистический, биологический и гибридный. В рамках биологического и гибридного объяснения рассматривается возможность отнесения эффекта и анти-эффекта Флинна к «эффектам Дженсена». В этом случае предполагается, что рост баллов по тестам и, соответственно, интеллектуальных способностей происходит за счёт увеличения уровня общего интеллекта, имеющего биологический источник. Свидетельством в пользу этого предположения было бы большее изменение баллов по субтестам с более высокими факторными нагрузками по фактору g.

В исследовании[10] 2012 года авторы предприняли попытку проверить данное предположение. Они получили значимую положительную связь величины анти-эффекта Флинна для разных субтестов с факторными нагрузками на g. Это говорит о возможности рассмотрения анти-эффекта Флинна как «эффекта Дженсена» и хотя бы частичного объяснения снижения интеллекта через биологические факторы. Важно отметить, однако, что значимой корреляции с величиной классического эффекта Флинна не было обнаружено, что с одной стороны играет против биологического объяснения, а с другой может сигнализировать о различной природе наблюдаемых явлений. Последнее объясняется в рамках гибридного варианта через компенсацию биологического снижения интеллектуальных способностей экономическими и социокультурными улучшениями.

Закон «убывающей отдачи» (SLODR — Spearman’s Law of Deminishing Returns)

[править | править код]

Другое известное наблюдение Спирмена заключается в том, что у людей с высокими баллами интеллекта фактор g объясняет меньшую часть индивидуальных различий в результатах по тестам когнитивных способностей. Хотя такая дифференциация способностей у групп с высоким интеллектом не связана напрямую с гипотезой Спирмена, в основе её могут лежать схожие механизмы.

Обсуждение и критика

[править | править код]

Критика метода

[править | править код]

Некоторые спорные моменты в процедуре обсуждались уже самим Дженсеном[2].

Прежде всего, уже упоминавшаяся неопределённость показателя, который следует принимать за g. Всё же логика факторного анализа и метода главных компонент приводит к несколько различающейся психологической интерпретации результатов даже при численном сходстве. Более того, описанная процедура требует принять допущение, что в каждом тесте первый главный фактор выражает один и тот же концепт g, что далеко не всегда так. В конечном счёте, в зависимости от специфики тестов, они могут оказаться выражением таких широких факторов как флюидный и кристаллизованный интеллект, что уводит от изначальной гипотезы.

Второй проблемный аспект — это применяемый метод корреляции. Коэффициент корреляции Пирсона считается более точным показателем линейной зависимости переменных, однако он находится под сильным влиянием характеристик распределения данных. В случае же факторных весов и значений величины эффекта трудно говорить о статистической независимости данных, а также их нормальном распределении.

Уже в 1985 году Дж. Шёнеман[11] предположил, что корреляция между величиной различий в выборках темнокожих и белых с нагрузкой тестов по первому компоненту (фактору g) может быть статистическим артефактом. Свои соображения он аргументировал тем, что межгрупповые различия вносят свой вклад в дисперсию результатов по интеллектуальным тестам и в условиях, когда первый главный фактор объясняет наибольшую дисперсию, корреляция различий с факторными нагрузками неизбежна.

Тем не менее, данные некоторых исследований опровергают подобное объяснение. Так, корреляция для групп глухих и хорошо слышащих оказалась, во-первых, незначительной, во-вторых, отрицательной, что выражает совершенно другие паттерны, нежели при рассмотрении расовых различий[12]. Хотя неоспоримо, что при сравнении глухих и хорошо слышащих имеют место групповые различия.

В попытках улучшить процедуру проверки исследователи предложили использовать вместо классического метода коррелированных векторов мультигрупповой конфирматорный факторный анализ (MGCFA), который принимает во внимание также и получаемую факторную модель. Применение этого метода снимает также вопрос о выборе параметрического или непараметрического коэффициента корреляции. Стоит заметить, что одна из работ[13], проведённых с использованием MGCFA, не подтвердила данные двух более ранних исследований о соответствии их результатов гипотезе Спирмена. Хотя этот факт не отменяет все подтверждающие гипотезу результаты, он заставляет с большей осторожностью относится к быстрым и однозначным выводам.

Критика идеи

[править | править код]

Помимо метода проверки критике подвергаются спирменовская и дженсеновская интерпретации получаемых результатов. Как уже упоминалось, факт положительной корреляции различий по тестам интеллекта с нагрузкой по g Спирмен объяснял наличием различий в группах темнокожих и белых общего уровня интеллекта, что напрямую вытекало из его теоретических представлений об общем факторе интеллекта как генетически обусловленном энергетическом потенциале. Дженсен в свою очередь при анализе эмпирических данных делал упор на различия в скорости протекания элементарных психических процессов, также отражающей биологические свойства индивидов.

Ещё до этого, однако, высказывались предположения о том, что наблюдаемый эффект является производным исключительно тестовых характеристик, таких как культурная нагруженность и языковые особенности. Хотя Дженсен в своих трудах[2] обращается к работам, специально исследовавшим вопрос культурных различий и различий в выполнении вербальных и невербальных тестов, их результаты не подтверждают влияния таких тестовых особенностей на групповые различия в выполнении. Тем не менее продолжают появляться статьи, которые в той или иной степени критикуют объяснение феномена исключительно через фактор g.

Так, в нидерландском исследовании[14] делается предположение о том, что выделяемый факторно g совокупно отражает не только сложность теста в аспекте когнитивной нагрузки и скорости обработки информации, но также агрегирует некоторые культурные характеристики теста. На выборках нидерландских детей и детей-мигрантов второго поколения авторы попытались проверить связь полученных различий в оценках с разложенным на культурно-вербальный аспект и аспект когнитивной сложности общим выделяемым фактором g. Исследователи получили результат, подтверждающий положительную корреляцию между культурно-вербальной нагруженностью (названной агрегированным с — от обозначения кристаллизованного интеллекта) и различиями выполнения. Связь же с общим g (как выражением когнитивной сложности) оказалась отрицательной. Это исследование мало согласуется с уже накопленным массивом подтверждающих гипотезу данных и требует внимательного осмысления причин такого рассогласования — лежат они в неверной классической трактовке явления или в методических ошибках исследования.

  1. 1 2 Spearman C. The Abilities of Man. — New York: MacMillan, 1927.
  2. 1 2 3 4 Arthur R. Jensen. The nature of the black–white difference on various psychometric tests: Spearman's hypothesis (англ.) // Behavioral and Brain Sciences. — 1985-07. — Vol. 8, iss. 2. — P. 193–219. — ISSN 0140-525X 1469-1825, 0140-525X. — doi:10.1017/S0140525X00020392. Архивировано 28 октября 2022 года.
  3. J. Philippe Rushton. Race differences and r/K theory: A reply to Silverman (англ.) // Ethology and Sociobiology. — 1990-03-01. — Vol. 11, iss. 2. — P. 131–140. — ISSN 0162-3095. — doi:10.1016/0162-3095(90)90033-3. Архивировано 28 января 2012 года.
  4. Halford H. Fairchild. Scientific Racism: The Cloak of Objectivity (англ.) // Journal of Social Issues. — 1991-10. — Vol. 47, iss. 3. — P. 101–115. — doi:10.1111/j.1540-4560.1991.tb01825.x.
  5. Dr. Philippe Rushton (англ.). www.psychology.uwo.ca. Дата обращения: 28 октября 2022. Архивировано 28 октября 2022 года.
  6. Roberto Colom, Manuel Juan-Espinosa, Luı́s F. Garcı́a. The secular increase in test scores is a “Jensen effect” (англ.) // Personality and Individual Differences. — 2001-03-01. — Vol. 30, iss. 4. — P. 553–559. — ISSN 0191-8869. — doi:10.1016/S0191-8869(00)00054-4.
  7. 1 2 Russell T. Warne. Testing Spearman's hypothesis with advanced placement examination data (англ.) // Intelligence. — 2016-07-01. — Vol. 57. — P. 87–95. — ISSN 0160-2896. — doi:10.1016/j.intell.2016.05.002.
  8. Jan te Nijenhuis, Hanna David, Daniel Metzen, Elijah L. Armstrong. Spearman's hypothesis tested on European Jews vs non-Jewish Whites and vs Oriental Jews: Two meta-analyses (англ.) // Intelligence. — 2014-05-01. — Vol. 44. — P. 15–18. — ISSN 0160-2896. — doi:10.1016/j.intell.2014.02.002. Архивировано 11 мая 2019 года.
  9. Валуева Е. А., Белова С. С. Эффект Флинна: обзор современных данных // Психология. Журнал Высшей школы экономики. — 2015. — Т. 12, № 4. — С. 165—183. Архивировано 28 октября 2022 года.
  10. Michael A. Woodley, Gerhard Meisenberg. In the Netherlands the anti-Flynn effect is a Jensen effect (англ.) // Personality and Individual Differences. — 2013-06-01. — Vol. 54, iss. 8. — P. 871–876. — ISSN 0191-8869. — doi:10.1016/j.paid.2012.12.022. Архивировано 25 февраля 2022 года.
  11. Jeffery P. Braden. Fact or artifact? An empirical test of Spearman's Hypothesis (англ.) // Intelligence. — 1989-04-01. — Vol. 13, iss. 2. — P. 149–155. — ISSN 0160-2896. — doi:10.1016/0160-2896(89)90013-5.
  12. Jeffery P. Braden. The factorial similarity of the WISC-R performance Scale in deaf and hearing samples (англ.) // Personality and Individual Differences. — 1984-01-01. — Vol. 5, iss. 4. — P. 403–409. — ISSN 0191-8869. — doi:10.1016/0191-8869(84)90005-9.
  13. Conor V. Dolan, Willemijn Roorda, Jelte M. Wicherts. Two failures of Spearman's hypothesis: The GATB in Holland and the JAT in South Africa (англ.) // Intelligence. — 2004-03-01. — Vol. 32, iss. 2. — P. 155–173. — ISSN 0160-2896. — doi:10.1016/j.intell.2003.09.001. Архивировано 9 января 2013 года.
  14. Michelle Helms-Lorenz, Fons J. R Van de Vijver, Ype H Poortinga. Cross-cultural differences in cognitive performance and Spearman's hypothesis: g or c? (англ.) // Intelligence. — 2003-01-01. — Vol. 31, iss. 1. — P. 9–29. — ISSN 0160-2896. — doi:10.1016/S0160-2896(02)00111-3. Архивировано 14 июля 2012 года.