Прелесть плоских столбиковых диаграмм в том, что они отражают одну зависимость: высота столбца соответствует данным. Это невозможно игнорировать. Но Excel (как и другие программы работы с таблицами) предлагает нам 3D-диаграммы, если вдруг нам хочется развлечься, а не получить информацию. В лучшем случае дополнительное измерение не дает новой информации, отвлекая при этом от высоты столбца.
В худшем случае эта диаграмма дезинформирует пользователей. В Excel есть возможность строить 3D-диаграммы с конусообразными элементами. Пользователи должны оценивать высоту конусов, но человеческий мозг имеет тенденцию к преувеличению разницы.
Самый худший из грехов – использование объемных иллюстраций. Ниже представлен один из таких примеров.
Второй мешок с деньгами в два раза выше первого. Однако, помимо этого, в нашем воображении он еще и в два раза шире, и в два раза глубже, чем первый. Объем второго мешка в восемь раз больше объема первого. Этот прием всегда используется для преувеличения разницы. У нас нет «полиции», следящей за использованием изображений, поэтому при желании вы вполне можете так поступить. При этом вы исказите смысл данных. Тем не менее если вы осведомлены об этом приеме, то будете начеку, если его попробуют применить в отношении вас.
Наша прибыль удвоилась!В данном случае, если вы все-таки не готовы отказаться от идеи картинок с мешками, то правильный способ это сделать – использовать во втором случае изображение, на котором в два раза больше точно таких же мешков и чтобы при этом они лежали друг рядом с другом, дабы можно было сравнить длину линии, которую образуют эти мешки. Это сопоставимо с линейной диаграммой, которая составлена из изображений маленьких мешков.
Слишком много «пирога»Круговые диаграммы, напоминающие куски пирога, повсеместно встречаются в презентациях, так как формат таблиц считается устаревшим. К сожалению, нередко они не несут полезной информации. Ниже приведен такой пример. В этой диаграмме есть легенда и все, что нужно, но какой ее сектор самый большой? На практике большинство людей ответили бы, что передний сектор (он кажется самым крупным, потому что расположен ближе всего к смотрящему). Но даже на плоской секторной диаграмме было бы сложно различить эти три практически одинаковых «куска пирога».
Можно поместить цифры на сектора диаграммы или указать процентное соотношение. Это лучше, но обычно на чтение и понимание этой истории уходит много времени, особенно если секторы не расположены в очевидном порядке от большого к маленькому.
Покажите кому-нибудь вашу круговую диаграмму и попросите быстро сказать, о чем она. Если вы не получите ответ в течение 10 секунд, вероятно, вам лучше использовать столбиковую диаграмму:
Это отвратительная диаграмма, в которой горизонтальные столбцы затенены так, словно это маленькие трубки. Почему? Потому что Excel предлагает этот вариант по умолчанию. Привет компании Microsoft! К счастью, теперь хотя бы видно, что средний столбец самый длинный, а еще через несколько секунд мы даже посчитаем значения каждого столбца с помощью вертикальных линий. Уже лучше. Возможно, более удачным вариантом было бы сделать ряды маленьких человеческих фигурок вместо горизонтальных столбцов, к тому же это напомнило бы, что речь идет о людях. Однако такой подход потребовал бы больше времени, и в Excel это нельзя сделать автоматически, хотя, казалось бы, сегодня программа уже должна предлагать такие опции.
У меня радикальное предложение. Если у вас очень небольшой объем данных, скажем пять цифр или меньше, и вы хотите представить их, почему бы не оставить все в форме таблицы, как раньше? В таблице содержится вся информация, представленная в предыдущих двух диаграммах, она быстрее читается, и ее невозможно неправильно понять.
Сколько времени вы добираетесь до работы?
9. Устанавливайте закономерности
Графики часто рассказывают историю взаимосвязи данных. Разобравшись с этой историей, вы сможете принять правильное решение.
Графики, как мы увидим далее, не доказывают наличия взаимосвязи, но определенно помогают ее выявить, и по многим причинам с этого стоит начинать. Ниже приводится таблица, демонстрирующая, как часто британское правительство называло состоятельных людей «производителями материальных благ», год за годом.
Я не буду комментировать, действительно ли люди, у которых больше денег, производят материальные блага (создавая компании и новые рабочие места или покупая большие дома, позволяя тем самым заработать другим) или потребляют их (если они покупают несколько домов, которые стоят пустыми, кто-то другой мог бы на эти деньги приобрести необходимое жилье). Это относится к разряду субъективных мнений, и у разных политиков своя точка зрения на этот счет.
Как мы видим, цифры увеличиваются, но не сильно. Теперь мы можем составить точечную диаграмму, как показано далее.
Соотношение числа статей в британской прессе с упоминанием «производителей материальных благ» (2000–2012)
Это весьма интересно: теперь стало очевидно, что цифры увеличиваются. При анализе диаграммы слева направо вырисовывается определенная история. Кажется, мы уловили закономерность.
Сейчас впервые в этой книге настало время серьезно задуматься о проблеме интерпретации данных. Точки на диаграмме рассеивания – это статистические данные. Статистика представляет собой информацию, но это не сама информация. В данном случае это измерение количества статей в прессе в базе данных под названием Factiva.com, которая собирает публикации газет и журналов со всего мира. Тем не менее статистика тоже может ошибаться (база данных может быть неполной), и закономерности в реальной жизни не бывают такими же четкими, как в школьных научных экспериментах. Эти данные подвержены влиянию множества факторов. Так что история, которую я рассказываю, – это всего лишь один из многих возможных вариантов.
В чем заключается моя история? Есть веские основания предполагать наличие закономерности: политики все чаще использовали этот термин на протяжении периода времени, обозначенного на диаграмме. Обратите внимание, если бы я просто отметил первый и последний годы и показатель последнего года был бы выше, речь шла бы о разнице, а не о закономерности.
Тогда, может быть, стоит соединить точки, чтобы сделать закономерность более очевидной, как на следующей диаграмме.
Соотношение числа статей в британской прессе с упоминанием «производителей материальных благ» (2000–2012)
Визуально стало лучше, но можно пойти дальше. Никто не может предполагать, что количество статей было в точности таким. Одна хаотичная линия внесла ясность в диаграмму, но не в историю, которая стоит за ней. Лучше провести прямую линию, чтобы обозначить закономерность.
Чтобы начертить такую линию, прибегнем к методу наименьших квадратов, который активно используется в статистике. Для этого берутся все точки и рассчитывается линия с минимальным квадратом расстояния от каждой точки до линии. Эта черта называется линией наилучшего соответствия. Не переживайте, если до этого вы не имели дела со статистикой, – функция для создания этой линии заложена в программу по работе с таблицами. Однако одна линия может оказаться не слишком информативной. Как видно, точки располагаются не по прямой. Получается, что в начале и конце графика большинство точек находятся выше линии наилучшего соответствия, а в середине большинство точек располагаются под этой линией. Это не очень хорошо.
Взгляните на следующий график. Я разделил данные на две части. В период с 2000 по 2006 год линия наилучшего соответствия была горизонтальной. В период с 2006 по 2012 год она пошла вверх. Из этого можно сделать вывод,