Візуалізація - очищення та перетворення даних перед обміном стеком даних EDA Data Science

Який найпоширеніший порядок очищення даних, перетворення даних та дослідницького аналізу даних?

даних

Для мене найбільш логічним видається очищення даних, потім EDA і, нарешті, перетворення даних (кодування категоріальних змінних та масштабування функцій).

Перетворення даних до EDA, здається, робить EDA не настільки корисним, оскільки ви не можете колись. перевірити наявність таких речей, як:

Пасажири у віковому інтервалі 0-18 мають вищі шанси на виживання

(якщо масштабування об’єкта застосовано до вікового об’єкта).

Але знову ж таки, роблячи перетворення даних після EDA, також втрачайте шанс кодування категоріальних змінних і тим самим візуалізуйте кореляцію тих із цільовою змінною.

Який порядок згаданих процесів? І чи є навіть порядок?

2 відповіді 2

Хоча це не дуже корисно, відповідь, мабуть, "це залежить".