Теорія: З чого складається візуалізація даних?

В цьому дописі ми розглянемо основні елементи, з яких складається візуалізація даних, а також їх значення для комунікації даних.

структура візуалізації даних

структура візуалізації даних

Кодування даних

Інші можлива назва - data encodings, тобто спосіб візуальної презентації даних, який ви обрали (це може бути позиція точок на осі координат та їх колір, як у цьому прикладі, або розмір, довжина тощо). Власне, це і є основа візуалізації даних.

Заголовок

В ідеалі заголовок візуалізації має бути твердженням та висловлювати головну її тезу. Заголовок задає спосіб витлумачення візуалізації, пояснює читачам, на що потрібно звертати увагу.

Нещодавні дослідження показали, що заголовки є дуже важливими для інтерпретації візуалізації, і можна суттєво змінити фокус візуалізації, просто змінивши її заголовок.

Однак “заголовок-твердження” працює далеко не у всіх випадках, тому подекуди можна використовувати і простий формальний опис візуалізації, щоби читачі швидко могли зрозуміти, про що йдеться на графіку.

Підзаголовок

Підзаголовок більш докладно пояснює та контекстуалізує те, що зображено на графіку, надає додаткову інформацію, необхідну для розуміння візуалізації.

Анотація

Анотація має на меті привернути увагу читачів до найбільш цікавих та важливих елементів візуалізації. Ви можете спробувати передбачити, які питання виникнуть у читачів, і дати відповідь на ці питання за допомоги анотацій. Наприклад, пояснити дивні флуктуації на графіку, зростання, падіння чи плато.

Грамотно розставленими анотаціями можна замінити інтеракцію з візуалізацією - кліки або наведення на точки для отримання додаткової інформації.

Легенда

Легенда має пояснювати читачам спосіб кодування даних, а також давати ключ до відчитування графіку. Якщо ви позначаєте щось кольором - у читачів має бути інструкція, в який спосіб інтрепретувати кольори на графіку. Якщо щось кодуєте розміром бульбашок - читачі мають знати, який розмір якому значенню відповідає.

Іноді легенду можна замінити прямими підписами на графіку (так званий direct labelling). Це може зекономити читачам час та трохи когнітивних ресурсів.

Сітка

Сітка допомагає орієнтуватись на площині, а відтак - порівнювати між собою різні елементи візуалізації даних. Наприклад, маючи сітку, ми можемо порівняти кілька точок на предмет того, як далеко вони знаходяться від певної лінії сітки.

Сітка допоміжний, але все ж другорядний елемент. Не варто робити її дуже яскравою, аби не відволікати від основним елементів. В деяких випадках можна відмовитись від сітки - або ж повністю, або ж частково (наприклад, від горизонтальних чи вертикальних ліній).

Підписи вісей

Підписи вісей також допомагають читачам витлумачувати візуалізацію. Тут, окрім назв змінних, можна також зазначати одиниці вимірювання, аби читачі одразу розуміли, що по осі Y, скажімо, вага в кілограмах, а не в тоннах.

В деяких випадках можна відмовитись від підписів вісей - наприклад, якщо ви згадаєте їх у підзаголовку візуалізації.

Джерело даних

Дає читачам зрозуміти, що ви не вигадали дані для візуалізації. Також може вказувати на час публікації даних або період, який ними описується.

Якщо у вас є можливість, тут можна дати пряме посилання на джерело даних. В такий спосіб всі бажаючі (не варто сподіватись, що їх буде багато, але все ж) зможуть подивитись на оригінальні дані та перевірити, чи вони є адекватно зображеними на вашій візуалізації.