Мы попросили специалиста по визуализации данных и нашего постоянного автора Анастасию Кузнецову составить список из 15 самых запоминающихся инфографик года и рассказать занимательные факты из них. 

От автора: Это топ не только по инфографикам, но также по интерактивным историям, проектам и другим интересным картинкам на основе данных. Все охватить невозможно, но очень советую подробнее посмотреть на проекты от The Pudding, New York Times, Washington Post и Flowing data — там всегда много хорошего дата-виза, подкрепленного качественным анализом данных. Ожидаемо, в списке не обошлось и без историй про коронавирус и здравоохранение.

Части тела мужчин и женщин в литературе

Проект от The Pudding (команды журналистов, которые любят рассказывать истории в формате data storytelling и делают это потрясающе) включает в себя качественный текстовый анализ и визуализацию данных. Автор материала Эрин Дэвис взяла 2000 книг из классической литературы и проанализировала каждую из них при помощи Python-библиотеки spaCy, выделяя мужские или женские существительные и местоимения (по типу she, her), части тела и прилагательные, которые стоят рядом.

Какие части тела мужчин и женщин часто упоминаются в книгах

Факт: из «женских» частей часто упоминается грудь и бедра, а из «мужских» спина и руки. Глаза женщин зачастую описываются как зеленые, большие и красивые, а самое популярное «мужское» описание — глаза, налитые кровью.

Система здравоохранения Индии в стетоскопах

Студент инфодизайна в NID Bangalore Саджай Мадхав визуализировал данные о том, как доктора и больницы в Индии справляются с коронавирусом. Данные он собирал из разных источников, включая национальный портал здравоохранения Индии, Всемирную организацию здравоохранения и Википедию, а обрабатывал их в обычном Excel. Каждый штат изображен в виде стетоскопа — чем он больше, тем выше показатель количества госпиталей на население. А внутри также зашита информация об этих госпиталях, например ширина между дужками показывает количество больничных коек. Вышло не только красиво, но и немного тревожно.

Факт: Меньше всего госпиталей в Индии в штате Бихар — всего один на 400 тыс. человек населения, там же максимальное количество пациентов на 1 доктора (более 35 тыс.) 

Рекордные синглы на Sony Music

В прошлом году компания звукозаписи Sony Music помимо классической награды вручала исполнителям инфографику с их топовыми синглами. Дизайн разрабатывала потрясающая Надие Бремер (data scientist и дизайнер инфографик). Каждая инфографика похожа на диск и содержит информацию о звуковых характеристиках, а также о результатах прослушиваний. Полная информация о создании доступна в ее блоге, там задействованы языки R и Java Script и есть много других интересных технических решений.

Инфографика по синглу Say So, который оказался одним из самых ярких по своей статистике

Факт: у большинства песен количество попаданий в плейлисты Spotify снижается со временем после выхода песни, а сингл Say So исполнителя Doja Cat был достаточно популярен в течение всего времени, возможно из-за популярности в Tik Tok.

Кто и о чем говорит на ТВ?

Сервис The Stanford Cable TV News Analyzer показывает упоминаемость человека или темы на телевидении. Все показано в виде линейных графиков и похоже на Google Trends — просто вводите слово и сравниваете, как часто про это говорили в телевизоре (можно даже отследить канал). Для автоматизированного анализа используются методы искусственного интеллекта.

Сравнение упоминаемости Трампа и Байдена в новостях по телевизору

Факт: Трамп активно начал упоминаться в телевизоре после 2015 года и старта своей президентской кампании. Упоминаемость Байдена схожим образом выросла только в 2019.

Здоровье и благосостояние

Статья от NY Times о связи между состоянием здоровья населения (хроническими заболеваниями) и уровнем дохода. Хороший пример того, как при коронавирусе проявляется неравенство между расами и слоями населения с разным уровнем дохода. Каждая линия на графике — хроническое заболевание (например, астма или диабет), положение линии на левой оси — процент людей, страдающих этим заболеванием относительно медианного показателя по городу среди 10% самого бедного населения, а на правой оси — 10% самого богатого. Посередине пунктиров также показано медианное значение.

Распространенность хронических заболеваний среди 10% самых богатых и бедных группах в крупнейших городах США

Факт: города с одним из самых высоких уровней неравенства по состоянию здоровья между богатыми и бедными — Чикаго, Вашингтон, а ниже всего уровень неравенства — в Гонолулу и Сан-Хосе. 

Музыкальные предпочтения разных поколений

Интерактивный музыкальный проект от дата-виз проекта The Pudding в форме опроса, где в конце вы можете сравнить свои знания песен с другими людьми из разных поколений. В итоге вы получаете оценку своих познаний и статистику — сколько процентов людей из других поколений тоже знают эти песни. 

Факт: Под каждой песней, которую предлагается послушать есть информацию о том, насколько другие представители поколений ее знают. Например, песн Butterfly исполнителя Crazy Town знают 81% миллениалов и только 25% бумеров

Все дороги мира

Сервис, в котором можно посмотреть на карты любой точки мира. Сделано при помощи API OpenStreetMap — некоммерческого картографического сервиса, цель которого получить бесплатную карту мира, опираясь на данные добровольцев с GPS-устройствами. Информация о разработке проекта есть на Github.

Факт: Можно визуально сравнить разные города с похожими названиями (например St. Petersburg во Флориде и Санкт-Перербург). Во втором первом случае структура улиц очень понятная и похожа на плитку, а в Северной столице все намного сложнее.

Результат на примере Санкт-Петербурга (Россия) и Сент-Питерсберга (США)

Во сколько обходится личный автомобиль?

Исследование Яндекса о том, насколько дорого владеть личным автомобилем и где каршеринг и такси выйдут может даже дешевле, чем покупка нового. Данные у Яндекса всегда очень интересные и большая часть их них — их собственные сервисы. Есть некоторые спорные графики (по типу длинных барчартов с группировкой), но интерактивность спасает.

Затраты на собственный автомобиль относительно каршеринга и такси

Факт: если смотреть на Москву, то машины стоимостью до миллиона выходят дешевле каршеринга и такси, от двух до трех миллионов — уже дороже, но в сравнении с тарифом «Комфорт» своя машина все еще более дешевый вариант.

Объемные винтажные карты 

Находка года для меня — фантастический проект картографа Шона Конвэя, в котором он объединил старые карты и данные о рельефе местности. Работа не только красивая, но и трудоемкая — к каждому изображению населенного пункта нужно было создать географическую привязку, чтобы данные о физическом положении объектов сходились с красивыми, но не всегда точными рисунками старых карт. 

Карта Канады 1956

Миллиардеры мира

Занимательная инфографика от HowMuch, проекта, цель которого — сделать деньги понятнее. Визуализировано все на своего рода картограмме, где размер стран соответствует количеству миллиардеров, а не своему реальному. Одна точка внутри страны — один миллиардер. Данные взяты из списка миллиардеров Forbes 2020.

Факт: в Малайзии и Мексике по 12 миллиардеров, но Мексика на карте кажется больше, потому что суммарное состояние мексиканских миллиардеров $103 млрд, что намного больше, чем у малазийских ($44,7  млрд.). 

Поисковые запросы по время коронавируса

Совместный проект Schema Design (фирма, специализирующаяся на дизайне и визуализации данных), Google News Initiative (организация для журналистов) и Axios (JavaScript-библиотека). Тут показано изменение запросов в Google во время пандемии. График сделан на основе Google Trends, а за визуализацию отвечал талантливый инфодизайнер и автор книг по визуализации данных Альберт Каиро.

Пример визуализации запросов про Zoom

Факт: Многие азиатские страны рано начали использовать маски для лица, в то время как западные страны по-прежнему уделяли особое внимание дезинфекции (это проявляется в динамике запросов по теме масок и санитайзеров).

История пандемий

Инфографика от компании Visual Capitalist, которая обычно занимается визуализацией показателей, связанных с бизнесом и экономикой. Но в этот раз — история об основных исторических пандемиях. Каждый вирус-шар — определенное заболевание, его размер — смертность, а справа отражена временная шкала. 

Факт: на 31 декабря 2020 года было зарегистрировано 1,8 млн смертей от коронавируса, а эпидемия чумы в Италии 1629-1631 унесла жизни около миллиона людей.

Дата-виз на каждый день

Дэвид МакКэндлесс, создатель премии Kantar Information is Beautiful Awards, вместе со своей командой сделал проект, в котором с октября 2019 ежедневно выходили новые мини-инфографики по разным наборам данных. Получилось 365 отличных визуализаций на разные темы. Вот одна из них — про продолжительность жизни в африканских странах.

Факт: продолжительность жизни в Нигерии в 1960 году составляла ниже 40 лет, в 2015 этот же показатель перевалил за 50 лет. 

Процент мужчин и женщин в Европе с высшим образованием 

Карты Милоша Поповича, постдока в Лейденском университете в Нидерландах. В этом году он также сделал много полезных и интересных карт, которые можно посмотреть на его сайте. Например, про государственную цензуру, коррупцию, изменение среднего количества смертей в 2020 и 2016-2019 годах. Он фокусируется в основном на картах по Европе, куда, при наличии данных, попадает Россия. 

Разница между количеством мужчин и женщин с высшим образованием в странах Европы

Факт: в скандинавских странах высшее образование есть у 40% женщин в возрасте 25-64 лет, а в Турции у 20%.

Безработица по профессиям

Американский специалист по статистике и визуализации данных Натан Яу тоже сделал много интересного в этом году. Мне больше всего приглянулась его визуализация об изменении уровня безработицы по отраслям. Данные взяты с сайта федерального бюро статистики труда США. Интерактивная визуализация в виде микса графиков beeswarm (одномерный график, где положение точек определяется одной осью) и пузырьковой диаграммы (где размер пузырьков соответствует количеству безработных).

Уровень безработицы в 2019 и 2020 годах в США

Факт: в 2019 самый высокий процент безработицы был в сельскохозяйственной отрасли, в 2020 — в области приготовления еды.

    Полезные материалы в одной еженедельной рассылке
    Подписывайтесь, не пожалеете.