4.7 - Оцінка лінійності шляхом візуального огляду
Перша умова простої моделі лінійної регресії стосується лінійності: середнє значення відгуку при кожному значенні предиктора повинно бути лінійною функцією предиктора. Акуратна річ про просту лінійну регресію - в якій є відповідь y і лише один провісник x - полягає в тому, що ми можемо добре відчути цей стан, просто подивившись на простий графік розсіювання (отже, в цьому випадку ми не т навіть потрібно дивитись на залишковий сюжет). Почнемо з розгляду трьох різних прикладів.
Рак шкіри та смертність
Чи припускають дані, що лінійна функція є достатньою для опису взаємозв'язку між смертністю від раку шкіри та широтою (набір даних про рак шкіри)?

Відповідь - так! Здається, що зв’язок між широтою та смертністю від раку шкіри справді лінійний, і тому було б найкращим, якщо б ми узагальнили тенденцію в даних за допомогою лінійної функції.
Алігатори
Довжину алігатора можна досить точно оцінити за аерофотознімками або з човна. Однак оцінка ваги алігатора є набагато більшою проблемою. Один із підходів полягає у використанні регресійної моделі, яка узагальнює тенденцію між довжиною та вагою алігаторів. Тоді довжина алігатора, отримана з аерофотознімка чи човна, може бути використана для прогнозування ваги алігатора. Вживаючи такий підхід, деякі біологи дикої природи взяли випадкову вибірку з n = 25 алігаторів. Вони вимірювали довжину (х в дюймах) і вагу (у, у фунтах) кожного алігатора. (Набір даних Алігатор)
Чи дають отримані дані припущення, що лінійна функція є достатньою для опису залежності між довжиною і вагою алігатора?
Відповідь - ні! Чи не вважаєте ви, що крива функція більш адекватно описує тенденцію? Діаграма розсіювання дає нам досить добрий вказівку на те, що лінійна модель в цьому випадку є неадекватною.