Еще один вопрос, широко распространенный в естественных экспериментах, неизменно встает перед исследователем, если тот использует для сравнения статистические инструменты (хотя неявно он присутствует даже тогда, когда сравнение проводится нарративно, без статистических тестов). Может ли статистическая корреляция сама по себе свидетельствовать о наличии причины или механизма?
Конечно нет: чтобы подтвердить наличие причины или механизма, требуется по меньшей мере еще три шага, и все они подробно описаны в обширной методологической литературе. Во-первых, существует проблема обратной причинно-следственной связи: если А и В коррелируют, то, возможно, не А вызвало B, как предполагает исследователь; возможно, наоборот, B вызвало A. Часто эту проблему можно решить, обратившись ко временны́м отношениям — то есть, попросту говоря, изменилось ли А до появления B, или наоборот? Для определения вектора причинно-следственной связи часто применяется статистический метод, называемый тестом Грейнджера на причинность. Также используются и более сложные методы. Возьмем, например, недавнее исследование[394], в котором объясняется, какие участки мозга стимулируют другие определенные участки мозга, когда люди переходят от расслабленного состояния к настороженному. Его авторы нашли ответ, рассмотрев, как разности фаз между независимыми и зависимыми переменными изменяются с частотой их колебаний.
Во-вторых, следует учитывать то, что называют смещением опущенной переменной: возмущающая переменная, идентифицированная в ходе «эксперимента», на самом деле может быть частью взаимосвязанного комплекса изменений, в рамках которого имеются и другие переменные, и в действительности дисперсию результатов, возможно, вызывает именно одна из них. (По сути, это и есть тот самый риск, который исследователи, изучающие естественные эксперименты, пытаются минимизировать, хотя и без возможности полного успеха, как мы описали тремя абзацами выше.) С этой проблемой борются как Банерджи и Айер в своем исследовании последствий британского колониального налогообложения в Индии (глава 6), так и Аджемоглу и соавторы в исследовании наполеоновского влияния (глава 7). Среди множества методов, которые статистики используют для ее решения, часто применяют технику множественной регрессии: иными словами, непосредственно проверяют воздействие других возможных объясняющих факторов и смотрят, не пропадает ли кажущаяся объяснительная сила изначально выбранной переменной, когда во внимание принимаются эти остальные переменные.
В-третьих, даже если имеются убедительные доказательства того, что А является причиной В, для того чтобы определить механизм, посредством которого А вызывает B, часто требуется дополнительная информация. Например, расселение людей на экологически уязвимых тихоокеанских островах коррелирует с обезлесением, последовавшим за прибытием человека, и, конечно, нет сомнений, что именно колонизация повлекла за собой обезлесение, а не обезлесение вызвало произошедшую до него колонизацию. Тем не менее это наблюдение само по себе не объясняет, как именно человеческое расселение привело к обезлесению. Возможно, это были прямые действия людей (например, сжигание лесов, вырубка деревьев или использование древесного топлива) или различные косвенные последствия появления человека (например, поедание или повреждение крысами, привезенными человеком, семян деревьев). Дополнительная информация, которая может помочь выделить среди этих механизмов верный, включает в себя археологические и палеоботанические свидетельства: пни с отметинами от топора, угли от древесины опознаваемых видов в очагах и семена со следами крысиных зубов.
В статистическом анализе, как и в нарративном, несравнительном, неквантитативном историческом исследовании, необходимо искать золотую середину между чрезмерно упрощенным и чрезмерно усложненным объяснениями. С одной стороны, существует опасение, что статистический анализ приведет к упрощенным объяснениям, если исследователь после выявления одного-двух первых факторов перестанет искать дальнейшие причины, объясняющие результат. Но в действительности статистики стараются добавлять во множественную регрессию как можно больше независимых переменных, а также проводят анализ остатка, чтобы обнаружить еще больше объясняющих факторов, чем в ходе первого этапа анализа. И наоборот, можно с подозрением относиться к излишне сложным объяснениям — вспомнить хотя бы такую часто встречающуюся насмешку: «Дайте мне две переменные, и я нарисую вам слона; дайте мне третью переменную, и он начнет махать хоботом». На самом деле же статистики обязательно используют специальные тесты, например, так называемый F-тест, чтобы убедиться, что объяснительная сила каждой дополнительной проверяемой переменной больше, чем та, которой можно ожидать просто от случайно выбранной новой переменной.
В общем, чем более многочисленны потенциально важные независимые переменные, тем больше частных случаев необходимо сравнить, чтобы проверить воздействие этих переменных. И наоборот, чем больше случаев доступно для анализа, тем больше число объясняющих факторов, которые можно проверить. Второй по масштабу анализ в этой книге — это сравнение 81 тихоокеанского острова или островного региона по степени обезлесения, проведенное Ролеттом и Даймондом (глава четвертая). Столь обширный массив данных позволил установить существование статистически значимых и механистически объяснимых эффектов девяти независимых переменных: уровня осадков, температуры, возраста острова, количества принесенных ветром пепла и пыли, наличия макатеа (поднятого атолла), площади, высоты над уровнем моря и степени изолированности острова. На некоторые из этих эффектов указали Ролетту и Даймонду коллеги в ходе исследования; поначалу потенциальная их значимость даже не пришла авторам в голову. При таком множестве факторов, воздействующих на обезлесение, было бы совершенно невозможно оценить степень влияния каждого из них без обширной базы данных и