Цикл кодування та декодування Евелін Мюнстер Соловей Медіум

Як працює візуалізація даних?

Tl; dr: Візуалізація даних - це в основному подвійне кодування складної системи. Отже, читачам візуалізації даних потрібно пройти певні етапи декодування, щоб зрозуміти та інтерпретувати дані та базову систему. Щоб створити кращу візуалізацію даних, нам як розробникам даних, розробникам або науковцям даних необхідно зрозуміти процес декодування.

Багато складних систем, з якими ми маємо справу сьогодні, такі як виробничі процеси або життєві подорожі клієнтів, в основному невидимі. Лише через непрямий шлях збору та аналізу даних ми можемо зрозуміти ці системи до такої міри, що зможемо виявити та вирішити проблеми.

Візуалізація даних може бути зручним способом зрозуміти ці дані та отримати до них доступ. Вони також повинні дозволити нетехнологіям читати та інтерпретувати дані.

Візуалізація даних є кінцевим результатом тривалого і складного процесу, в якому часто доводиться долати багато перешкод: злиття даних з різнорідних джерел, очищення, перетворення у придатні для використання формати, а іноді і статистичні розрахунки. Нарешті, ми з гордістю дивимося на барвисту та привабливу презентацію і думаємо: «Так! вперше наші дані видно! ’Ми зробили всю важку роботу і подаємо користувачеві інформацію на срібному блюді. Зараз у користувача це легко, і вже нічого не може піти не так, правильно?

Однак подорож ще не закінчена. Візуалізацію даних часто можна неправильно зрозуміти або навіть не зрозуміти взагалі. Якщо ви вже спостерігали це раніше або як читач, або як творець візуалізації, то вам слід читати далі.

За моїми спостереженнями, багато чого може піти не так. Понад десять років я розробляю користувальницькі інтерфейси для продуктів даних і переживаю болісний досвід того, що мої візуалізації часом не відповідають їх цілям. Користувачі не розуміють візуальну мову, не можуть зрозуміти структуру даних або не можуть зрозуміти значення представлених даних. У деяких особливо амбіційних проектах бізнес-аналітики ми виявили, що візуалізації потім рідко використовували. Але чому це? І як ти можеш зробити краще?

Давайте поетапно розглянемо процес створення та читання візуалізації даних, цикл кодування та декодування:

Створення візуалізації даних не починається з даних, як часто вважають, він починається набагато раніше, за системою. За всіма даними криється система в реальному світі. Зазвичай він непомітний і дуже складний.

Візьмемо, наприклад, веб-магазин. Ніхто не може просто побачити потоки відвідувачів. По-перше, нам потрібна ідея; ментальна карта цього веб-магазину, щоб вирішити, які об’єкти, властивості та події ми хочемо виміряти. Було б безліч цікавих речей - відвідувачі, веб-сайти, кошики для покупок та товари. Але не всі речі ми можемо виміряти технічно, як думки відвідувача веб-магазину, коли він вирішує не купувати товар у своєму кошику для покупок. Як би було приємно це знати!

Виявляючи об’єкти та властивості, які ми насправді можемо і хочемо виміряти, ми вже робимо вибірковий вибір щодо того, які частини системи будуть представлені в наших даних. Якщо наша ментальна карта неповна, неточна або просто неправильна, ми можемо не задавати правильних питань і вимірювати правильні дані.

Вже на першому етапі створення візуалізації даних ми повинні визнати, що ми не можемо охопити всю складність системи. Дані не є повним поданням системи, це лише крихітні шматочки показників.

Далі ми створюємо модель даних. Тут теж багато чого втрачено, оскільки модель даних не може охопити кожну деталь реального світу. Той, хто коли-небудь робив це, знає, що завищена модель даних є небезпечним монстром. Ось чому ми воліємо залишатися якомога простішими та залишати неважливі деталі. Отже, врешті-решт, ми отримуємо акуратну та чисту модель даних, яка вміщує лише крихітні шматочки інформації про систему. Перетворюючи необроблені дані в нашу модель даних, глибина інформації зменшується вдруге.

Після того, як ми зібрали дані та обробили їх, ми нарешті створимо нашу візуалізацію. Знову ж таки, велика кількість доступної інформації, що зберігається в таблицях даних, повинна бути відфільтрована, оскільки технічно типи діаграм можуть відображати лише обмежену кількість об’єктів та об’єктів. Але це не єдина причина, через яку нам потрібно зменшити обсяг представлених даних: хороший дизайн візуалізації даних враховує і людські аспекти. Нам потрібно зосередитись на повідомленні, яке ми хочемо поспілкуватись, на потребах аудиторії та на їхніх сприймаючих навичках. Таким чином, ми маємо вибрати крихітну частину з наявних даних для кожної діаграми: Можливо, один тип об’єкта та одну або дві особливості, такі як товари та показники їх продажів на день.

До цього кроку сталося дві речі, про які слід пам’ятати: по-перше, не вся складність системи видно у візуалізації, по-друге, ми двічі зашифрували систему. Спочатку вони були переведені в дані, а потім - дані у візуалізацію. Ось чому ми називаємо цей процес кодуванням, а виробники візуалізації даних кодерами.

Ми зараз закінчили? Чи остаточна візуалізація даних закінчує процес?

Ні, зовсім не, бо зараз настає друга половина, процес декодування. Декодер - це зчитувач візуалізації. Для того, щоб зрозуміти систему та отримати інформацію, що стосується дії, декодер повинен повернутися назад від візуалізації даних до даних, потім від даних до ментальної моделі. Це може бути досить складним завданням. Мета кодера - підтвердити, вдосконалити або змінити власну розумову модель за допомогою даних.