• Иногда вам говорят то, что вы хотите услышать, а затем делают совершенно другое.
• Иногда люди участвуют в опросах ради получения подарка или бонуса. Тогда их волнуют не столько вопросы, на которые им предлагают ответить, сколько подарок по окончании опроса.
Давайте вернемся к графику. Что с ним не так? Сложно делать выводы, если только речь не идет об одних и тех же компаниях и в той и в другой выборке. Не вызывает сомнения только факт, что они сотрудничают с C Space. Это может быть частью истории, но право на существование имеют и альтернативные версии, которые могут оказаться правдой (или нет).
• Показатели компаний, получающих большую прибыль, лучше показателей по рынку в целом. Эти организации в состоянии выделить больше средств на привлечение внешних консультантов, поэтому более прибыльные компании в среднем могут оказаться в индексе C Space.
• Возможно, C Space специально отбирает более успешные компании для сотрудничества, потому что они быстрее оплачивают счета за услуги.
• Может быть, с C Space сотрудничают компании из определенной отрасли и именно эта область сейчас больше всего интересует инвесторов.
Не менее важно применять этот подход и при анализе собственных данных. Специалисты по маркетингу часто рассылают опросы по электронной почте: «Пожалуйста, выскажите свое мнение…» Такие компании, как Survey Monkey[19], очень быстро делают красивые исследования, и, возможно, вы даже получаете по два-три еженедельно. Представим, что вы проводите опрос по электронной почте среди руководителей бизнеса, которых тщательно отобрали из вашего списка рассылки, что они думают о вашей компании и готовы ли потратить больше на ваши продукты в будущем. Получив ответы, вы узнаете, что 72 % респондентов считают, что вы великолепно справляетесь с работой, и 67 % опрошенных готовы потратить больше на ваши продукты в будущем.
Проанализируем эти результаты с позиции логики и здравого смысла.
• Сколько успешных руководителей бизнеса из тех, кого вы знаете, располагают временем отвечать на электронные опросы? Более вероятно, что вы получили ответы от большого числа не слишком эффективных руководителей или же тех, которые поручили помощнику отвечать на несрочные письма.
• Представьте, что большинство руководителей не вполне довольны качеством ваших услуг или даже не могут толком вспомнить вашу компанию. Они просто проигнорируют опрос, хотя для вас это была бы важная информация.
• Не упоминали ли вы (пусть даже мимоходом), что за положительный отзыв вы готовы предоставить скидку или расширить спектр предлагаемых услуг? Тогда вы получили больше всего ответов от тех, кто надеется заработать скидку и, скорее всего, сказал вам то, что вы надеялись услышать.
Так что не делайте крупных ставок на информацию такого рода. Хотя она может послужить как рекомендация при необходимости сузить выбор или как стимул к проведению более тщательного исследования. Дешевая колбаса очень похожа на элитную, а графики и диаграммы, построенные на основании искаженных данных, выглядят не менее убедительно, чем те, которые были построены на основании достоверной информации. Но с графиками, как и с колбасой, важно то, из чего они сделаны, а не то, как они выглядят.
20. Корреляция не гарантирует причинно-следственную связь
Обычно данные не отвечают на вопрос «почему?», а только на вопрос «что?».
Возможно, вам доводилось слышать это утверждение ранее, но вы не вполне понимаете его смысл. Тогда скажем иначе: если кто-то утверждает, что нет дыма без огня, он ошибается.
Корреляция между двумя явлениями означает, что, если мы стали чаще видеть одно из них, мы также отмечаем изменение частоты, с которой встречаем второе. Причинно-следственные отношения гораздо сильнее. При этом, если мы отмечаем одновременное изменение двух количественных показателей и предполагаем, что один из них стал причиной второго, это предположение вполне может оказаться ошибочным.
Следующие три примера иллюстрируют корреляцию: ваш индекс массы тела и вероятность инфаркта; количество сообщений в твиттере о телевизионной программе и число зрителей этой программы; потребление сыра на душу населения и число смертельных случаев, когда люди умирают, запутавшись в простынях в собственной кровати. Какие из этих отношений также относятся к числу причинно-следственных? Для нас чрезвычайно важно это знать, так как процесс принятия решений – это давление на воображаемые рычаги. Нажимая на них, мы должны знать, что случится в итоге. При этом мы часто получаем чудовищные советы от людей, которые путают причинно-следственные отношения и корреляцию.
Давайте разберемся с каждым из приведенных примеров в обратном порядке. Последний пример сначала кажется полным абсурдом. Это одна из корреляций, созданных Тайлером Вигеном на его весьма забавном сайте Spurious Correlations («Ложные взаимосвязи»), где еще много подобных примеров сочетания вещей, которые, кажется, не имеют между собой ничего общего. Это результат доступности данных в современном обществе. Мы измеряем тысячи трендов, и вдруг оказывается, что у явлений, никак между собой не связанных, в точности совпадает динамика изменений. Этого можно избежать, если выдвинуть гипотезу, которую вы хотите протестировать, прежде чем изучать корреляции. Об этом речь в книге пойдет далее.
Ложные корреляции – это то, что получается, когда вы просто собираете большой массив данных и начинаете копаться в них в поисках взаимосвязей. Вы обнаружите несколько важных причинно-следственных отношений и целый ряд бессмысленных взаимосвязей. Компании постоянно отвлекаются на этот процесс. Конечно, в приведенном примере вы вряд ли поверили, что между этим двумя явлениями может быть причинно-следственная связь, но как быть в других ситуациях, когда наличие подобной связи кажется вполне возможным?
Статистика по сообщениям в твиттере и числу зрителей телевизионного шоу – более сложный случай. Между этими показателями может быть причинно-следственная связь, но при этом возможны три сценария.
• Эффект социального воздействия: когда пользователи пишут о телевизионном шоу в твиттер, это стимулирует других смотреть передачу.
• Сплетни о ТВ: когда зрители смотрят телешоу, им хочется написать об этом в твиттер.
• Высокое качество: у интересных телевизионных шоу большая зрительская аудитория, и они вызывают оживленное обсуждение.
Все это действительно важно, если вы работаете в телевизионной компании. Как вы используете социальные медиа? Велико искушение поверить в первый сценарий, инвестировать в то, чтобы побудить пользователей писать сообщения в твиттер, и ждать, что ваша аудитория вырастет. Многие компании примерно так же обосновывали выделение бюджета на продвижение в социальных сетях и обнаружили, что, когда они искусственно стимулировали количество сообщений в социальных сетях, ничего не происходило. Может быть, дело в том, что причинно-следственная связь здесь обратная: люди пишут сообщения о том, что они делают. В этом случае социальные медиа по-прежнему остаются полезным инструментом, но только для неформального аудита того, что собираются делать ваши потребители.
Третий сценарий также выглядит вполне достоверным. Он означает, что оптимальный способ потратить деньги – это вложить их не в социальные медиа, а в создание более качественного сценария и приглашение хороших актеров.
Между этими тремя сценариями может существовать взаимосвязь: А становится причиной В, В – причиной А или С (неизмеряемый показатель) становится причиной как А, так и В. Определением этих взаимосвязей занимается наука эконометрика. При наличии достаточного массива данных можно проверить две вещи: заметен ли эффект, когда А происходит до В, но не наоборот, когда В происходит до А (тогда можно предположить, что А становится причиной В); а также при прочих равных условиях (например, качестве) по-прежнему ли А вызывает В?
На основании доказательств, собранных на протяжении определенного периода и путем многочисленных наблюдений, можно с определенной долей уверенности утверждать наличие