Одураченные статистикой: как могут обмануть линейные графики
В прошлом материале рубрики «Одураченные статистикой» мы разобрали, как работает визуализация данных и как недобросовестные авторы графиков могут нарушать базовые правила построения диаграмм, чтобы искажать восприятие.
В этот раз углубимся в манипуляции, которые могут встречаться в линейных графиках — одном из самых распространенных видов графиков.
Для чего используют линейные графики
Такие диаграммы обычно применяют, чтобы продемонстрировать, как показатели меняются со временем. Важная их особенность — оси здесь не только можно, но и часто необходимо строить не от нуля. Сравните, как выглядят два графика ниже, которые показывают динамику численности населения России. В первом случае кажется, что с 2001 по 2015 год население практически не менялось. Во втором — заметно, как оно снизилось с 2001 по 2010.
Когда мы смотрим на такие графики, важно понимать, какую мысль хочет донести до нас автор. Во многих случаях изменение величины нельзя сопоставлять с ее размером. Падение численности населения, заметное в масштабе от нуля, было бы настоящим бедствием. Однако даже изменение на 100 тысяч человек здесь важно для понимания демографических тенденций.
Почему важно соотношение сторон диаграммы
Еще одна возможность визуально «приукрасить» изменение величины — растянуть график по горизонтали или по вертикали. Вот два варианта визуализации изменения цены биткоина за месяц. В одном случае создается впечатление, что курс цифровой валюты сильно упал, а в другом изменение не кажется таким уж внушительным.
Если график имеет нестандартные пропорции и сильно вытянут по ширине или высоте, это повод лишний раз задуматься, не хотят ли от нас что-то скрыть. Хорошим ориентиром всегда будут числовые значения: они точно дадут понять, стоит ли внимания изменение величины.
Как обманывают, используя двойные оси
Один из часто встречающихся способов запутать читателя — использование двойной шкалы на вертикальной оси. График Financial Times буквально кричит о том, что коренное население США сокращается. В подтверждение мы видим синюю линию, число приезжих, которая пересекает красную — коренное население. Лишь внимательный читатель заметит, что у каждой линии на графике своя ось — и синяя к концу периода достигает 40,5 млн, в то время как красная падает незначительно, с 169,8 до 168,3 млн.
Кроме того что график Financial Times выглядит как некрасивая манипуляция, вывод в заголовке слишком смелый: по этим данным действительно видно, как растет количество приезжих, но число местных при этом практически не меняется.
В примере FT для одного показателя использованы разные оси, но один масштаб. На графике с двойными осями любые две линии можно представить так, что смысл высказывания полностью исказится. Одну линию можно изобразить таким образом, что все колебания будут казаться очень большими, а другую, напротив, сжать — чтобы изменения были не видны.
Чтобы «разгадать» график с двойными осями, лучше всего посмотреть на обе: проверить, как они соотносятся друг с другом и насколько сильно изменилась каждая из величин. Так вы сможете получить более правильное представление о данных.
Как обманывают, используя «удобный» временной период
Иногда, чтобы подтвердить свою идею, авторы инфографики выбирают подходящий временной период — например, такой, на котором показатель все время растет. Вернемся к примеру с населением России: даже с 2001 по 2024 год показатель численности населения ведет себя по-разному: c 2001 по 2006 — падает, с 2007 по 2022 — растет, потом снова падает.
Недобросовестный автор мог бы взять фрагмент этого изображения с 2007 по 2022 год, заявив, что население страны увеличивается.
В таких ситуациях особенно сложно уличить автора в манипуляции. Подозрение могут вызывать только косвенные признаки:
- Слишком явный тренд — показатель либо все время растет, либо только падает.
- Маленький временной период — например, на основе данных о числе преступлений за три месяца делается вывод о росте преступности в целом.
- Нет данных за последнее время. Например, в статье 2018 года публикуют график, где последняя информация — за 2014 год.
Как накопительный эффект всегда демонстрирует рост
Есть тип величин, которые не могут убывать со временем. Например, общее число проданных Айфонов, число выполненных за год задач, количество погибших от оспы. Визуализация таких данных может выглядеть эффектно и впечатляюще — как, например, число тестов на коронавирус в примере ниже из презентации Дональда Трампа.
Смотря на такие графики, важно помнить, о чем хочет рассказать вам их автор. Сам по себе рост количества тестов не говорит о том, что их стали делать больше. Даже если темпы тестирования замедлятся, такой график все равно будет показывать рост, так как проявляется накопительный эффект.
Что стоит помнить про линейные графики
- Цель линейного графика — показать, как меняется величина со временем, а не сравнивать значения. Поэтому оси таких графиков часто строят не от нуля — чтобы изменения не казались слишком незначительными.
- Если вы увидели слишком узкий или слишком маленький по высоте график — возможно, от вас пытаются что-то скрыть. Проверьте числа — действительно ли изменение такое серьезное, как оно выглядит.
- Двойные оси могут искажать восприятие данных. Если на графике с несколькими осями линии пересекаются, это не обязательно значит, что одна величина стала больше другой. Лучше посмотреть на оси и убедиться, что вы правильно понимаете визуализацию.
- Иногда авторы графиков могут подбирать нужный временной отрезок, чтобы доказать свой тезис. Если тренд вызывает подозрение, стоит проверить, за какой период показаны данные.
- Если на графике показывают сумму каких-то величин, полезно помнить, что она всегда растет и такой график не говорит о скорости ее роста.
Жизнь россиян в цифрах: что едят, сколько работают, куда ездят и на что тратят деньги. Подписывайтесь, чтобы не пропустить самое интересное: @t_stata