Занятие 4
Визуализация данных
Блок-схемы
Визуальные переменные
Теория цвета
Типы графиков
Правила и частые ошибки
Блок-схемы
  • Diagrams.net — инструмент для рисования блок-схем.
  • Блок-схемы позволяют визуально зафиксировать алгоритм исполнения кода или функции.
  • Нужны не для внешнего читателя, а чтобы вы сами не запутались в собственных действиях.
  • Узнать больше в Википедии
Визуализация данных
Это один из последних шагов при работе над дата-журналистской статьёй. Перед этим шагом вы должны быть готовы ответить хотя бы на эти вопросы:

1. Какие параметры вы хотите визуализировать?
2. Ради чего? Какова цель? (например, сравнить два тренда или подчеркнуть 5 лидирующих значений и т.д.)
3. Какова ключевая идея вашей визуализации, что читатель должен понять, увидев ваш график?

Используйте визуализации, когда они помогают следовать принципу:
"A picture is worth a thousand words"





В отличие от визуализаций технических профессий, где важно следование ГОСТам и прочим стандартам, в визуализациях для медиа нужно блюсти чистоту, опрятность и понятность.

Статистик Эдвард Тафти среди ключевых принципов визуализации назвал Ink-Data Ratio, согласно которому чем меньше «чернил» использовано в визуализации, тем лучше.

Узнать больше:
Визуальные переменные
Визуальные переменные — это изобразительные характеристики, с помощью которых мы можем воспринимать визуальную разницу как разницу между числовыми значениями.





Иными словами, это набор способов, которыми данные могут быть «переведены» в изобразительный формат с помощью дизайн-инструментов.​

Узнать больше:
Выбираем переменную
Правило: Одна характеристика данных (один столбец) — одна визуальная переменная.

Размер:
  • ✅ Хорошо для количественных данных (показываем числа, например, 2 кошки vs 3 кошки).
  • ✅ Хорошо, если нужно показать точную разницу в данных и однозначно подчеркнуть различие между объектами.
  • ❌ Плохо для отражения качественных данных (показываем группы, например, чёрные кошки vs белые кошки).





Тон цвета:
  • ✅ Хорошо для качественных данных (показываем группы, например, чёрные собаки vs белые собаки).
  • ❌ Плохо для количественных данных (показываем числа, например, 2 собаки vs 3 собаки).

Яркость цвета:
  • ✅ Хорошо для примерного визуального сопоставления, где читателю нужно понять картину в целом.
  • ✅ Хорошо для подчеркивания самых важных данных.
  • ❌ Плохо, если нужно показать точную разницу в данных.
Hue — Тон — разные цвета

Intensity — Насыщенность —
от цветного к чёрно-белому

Value — Яркость —
от тёмного к светлому
Цвет
Правило №1: Чем меньше цветов, тем лучше

Человеческий глаз может воспринимать до 7 цветов за раз, но лучше использовать до 3 основных цветов и их оттенков + серый как нейтральный цвет.​

Правило №2: Одна категория — один цвет.

Если у вас есть барчарт с населением по городам, все столбики должны быть одного и того же цвета, потому что число населения уже выражено с помощью размера столбцов. А категория для всех столбцов одна — город. ​

Правило №3: Использование разных цветов должно быть последовательным на протяжении всей статьи

Если на одном графике собаки изображены голубым, а кошки — красным, то и на следующем графике собаки должны быть голубыми, а кошки красными — а не жёлтыми и розовыми.




Правило №4: Цвета должны соответствовать устоявшимся культурным ассоцияциям​

Например, в Китае красный считается цветом удачи, а в англоязычных культурах удачу сулит зелёный​. При этом в Китае зелёный головной убор — признак, что человеку изменяют.

Правило №5: Контраст — ключ к успеху

Ваш график должен быть понятен даже людям с дальтонизмом.​

Правило №6: Всё не то, чем кажется​
  • Чёрный — лучше не #111111, а подтон в любую сторону​
  • Белый — лучше не #FFFFFF, а подтон в любую сторону
  • Серый — не чисто серый по шкале от белого до чёрного, а оттенок серо-голубого
Полезные инструменты
Как компьютеры воспринимают цвета:
  • rgb — красный+зелёный+синий— (27,131,137)
  • rgba — красный+зелёный+синий+прозначность — (27,131,137,0.8)
  • hex — число из шести символов — #1B8389
  • cmyk — cyan+magenta+yellow+key/black — голубой, пурпурный, жёлтый и чёрный; используется в печати —
  • C 43% M 2% Y 0% K 46%
ТУТОРИАЛЫ
БЖУР231

БЖУР233

Ищем с помощью пробела в Coolors:

1. Основной цвет на глаз для основного ряда данных (подобрать на глаз).

2. Светлый цвет для фона.

3. Тёмный цвет для шрифта.

4. Контрастный яркий цвет для второго ряда данных.

by Christine Chan and Dave Sherwood, Reuters Graphics, 2019
  • Линейный график
  • Барчарт
  • Столбчатая диаграмма
by Lauren Leatherby, Financial Times Data, 2017
  • Линии для непрерывных данных
  • Столбики для дискретных данных
  • Важные моменты
by Heather Long and Andrew Van Dam, Washington Post, 2020
  • Линейный график с двумя главными цветами
  • Столбчатая диаграмма с двумя основными цветами и серым
  • Линейный график с двумя основными цветами и серым
Корреляция на графиках
  • Линейный график
    https://www.washingtonpost.com/business/2020/07/16/9-charts-that-show-good-bad-alarming-this-early-economic-recovery/
  • Диаграмма рассеяния
    https://www.nytimes.com/2017/10/09/learning/whats-going-on-in-this-graph-oct-10-2017.html
  • Потоковая диаграмма
    https://www.nature.com/articles/s41599-020-00608-6#Tab3
ЧТО ВЫ ХОТЕЛИ БЫ ПОКАЗАТЬ?
Visual vocabulary — шпаргалка по типам графиков
от Financial Times

Аналог FT Visual vocabulary на русском
от Александра Богачёва

Более 60 графиков New York Times Graphs для обучения студентов — коллекция графиков и карт, организованная
по топикам и типам графиков
Основные типы графиков
Линейный график
Тип данных: непрерывный по оси x (например, даты).
Цель: изменение с течением времени, статистические выбросы.

Барчарт
Тип данных: качественный по оси y или дискретный.
Цель: иерархия, ранжирование, сравнение.
Используется, если названия объектов длинные.

Столбиковая диаграмма
Тип данных: качественный по оси x или дискретный.
Цель: иерархия, ранжирование, сравнение.
Используется, если названия объектов короткие.

Ответ: вагадане



Пайчарт
Тип данных: проценты.
Цель: пропорция.
🌻 Сумма всех значений должна быть 100%.
🌻 Лучше показывать 1-3 категории, а остальное упаковывать в «Другое».

Диаграмма рассеяния
Тип данных: две качественные категории с числовыми измерениями.
Цель: корреляция, сравнение, статистические выбросы.
Частые ошибки
1. «Лапша» — слишком много линий на линейном графике — настолько, что никто не может различить, где одна, а где другая.

2. Неуместные пайчарты
  • сумма значений не равна 100 %,
  • разные категории на одном графике — лучше использовать столбиковую диаграмму.​​​

3. Столбиковые диаграммы начинаются не с нуля — это манипуляция восприятием читателя за счёт визуального усиления разницы между значениями.

4. Читатель должен поворачивать голову вверх ногами, чтобы прочитать текст — лучше писать всё горизонтально.

5. Слишком много цветов, не несущих никакого смысла.

6. 3D графики — сбивают читателя с толку.

Ответ: вагадане

7. Значения не отсортированы ни по какому признаку.

8. Подписи данных либо неразличимо маленькие, либо их слишком много.

9. Избыточное украшательство — декоративные элементы, не несущие смысла.

10. Название графика и сам график не связаны.

Узнать больше:
Как создавать понятные графики
Примеры плохих графиков
из телеграм-канала «Отвратительные графики» и сайта viz.wtf
Шаблон

Форматы изображений, в которых можно экспортировать из RAWGraphs и Flourish Studio.

  • Raster — jpg, png — Adobe Photoshop, Gimp
  • Vector — svg — Figma

Узнать больше:

Пять стратегий придумывания заголовков
для дата-визуализаций, статей
и карточек с инфографикой
  • Показатель как он есть
    «Число лягушек в мире»
  • Наводящий вопрос
    «Растёт ли число лягушек в мире»
  • Конфликт
    «Лягушки VS жабы: кого в мире больше»
  • Тенденция
    «Число лягушек в мире стремительно растёт»
  • Ключевой инсайт
    «Юго-Восточная Азия — лидер по числу лягушек»
Как сделать линейный график в DataWrapper
Как сделать пузырьковую диаграмму
(bubble chart) в DataWrapper
Визуализация таймлайна во Flourish (VPN)
Как долго песня оставалась в чартах
Домашнее задание
БЖУР231 — дедлайн 15 марта, воскресенье, 18:00
БЖУР233 — дедлайн 17 марта, вторник, 18:00
Критерии оценивания
Это задание выполняется индивидуально, на его выполнение даётся две недели.

1. Создайте график на основе ваших данных.

Требования:
  • Квадратный формат (минимум 1000x1000 px).
  • Заголовок любого типа (либо краткое описание сути, либо интересная деталь).
  • Подзаголовок с единицами измерения.
  • На выбор: легенда; подписи частей графика; цветовое кодирование в заголовке или подзаголовке.
  • Сам график.
  • Значения должны быть отсортированы​. Принцип сортировки должен быть либо очевиден, либо упомянут в подзаголовке.
  • Названия осей.
  • Подписи данных (отдельных чёрточек).
  • Источник данных и год их создания.
  • Авторство (ваше имя или организация, город или страна, год создания визуализации).

Загрузите в вашу папку в формате png, назвав его по принципу Фамилия_Тема, чтобы я могла сопоставить график с исходными данными и темой проекта. Например, Ларина_Письма.

2. Найдите похожий график в медиа:
  • схожий тип данных;
  • схожий тип графика.
Нужно найти график именно в медиа (онлайн СМИ, скрины с телевидения, блоги и т.д.) — не корпоративные отчёты или НКО, то есть чтобы эти визуализации были медийного, а не прикладного или бизнес-формата.

Загрузите это изображение в свою папку, назвав его по принципу Фамилия_Медиа.

3. Создайте текстовый документ с префиксом «Фамилия_Виз» — и поместите туда
  • ваш график как статичную картинку;
  • ссылку на датасет, на основе которого вы сделали этот график;
  • схожий график из медиа;
  • ссылку на статью, в которой вы нашли этот график;
  • краткое объяснение (от 1 до 3 абзацев):
а) Какие визуальные переменные вы использовали в своём графике​?
б) Какие визуальные переменные использованы в графике из медиа?
в) Как вы выбрали и использовали цвета для графика?
г) С чем ассоциируются цвета графика из медиа? Можете ли вы предположить, по какому принципу выбраны эти цвета?
д) Почему вы выбрали этот конкретный тип графика (барчарт, пайчарт и т.д.)?
This site was made on Tilda — a website builder that helps to create a website without any code
Create a website