Загальний і простий метод отримання R2 із узагальнених лінійних моделей зі змішаними ефектами -

Національний центр зростання і розвитку, Департамент зоології, Університет Отаго, 340 Great King Street, Данідін 9054, Нова Зеландія

метод

Відділ поведінкової екології та еволюційної генетики, Інститут орнітології Макса Планка, Еберхард-Гвінер-Штрассе, 82319 Севізен, Німеччина

Кафедра еволюційної біології, Університет Білефельда, Моргенбрід 45, 33615, Білефельд, Німеччина

Національний центр зростання і розвитку, Департамент зоології, Університет Отаго, 340 Great King Street, Данідін 9054, Нова Зеландія

Відділ поведінкової екології та еволюційної генетики, Інститут орнітології Макса Планка, Еберхард-Гвінер-Штрассе, 82319 Севізен, Німеччина

Кафедра еволюційної біології, Університет Білефельда, Моргенбрід 45, 33615, Білефельд, Німеччина

Резюме

Використання як лінійних, так і узагальнених моделей лінійних змішаних ефектів (LMM та GLMM) стало популярним не тільки в соціальних та медичних науках, але і в біологічних науках, особливо в галузі екології та еволюції. Інформаційні критерії, такі як Інформаційний критерій Akaike (AIC), зазвичай подаються як інструменти порівняння моделей для моделей із змішаним ефектом.

Презентація "пояснення дисперсії" (Р. 2) як відповідна узагальнююча статистика моделей зі змішаними ефектами, однак, рідко, хоча Р. 2 регулярно повідомляється для лінійних моделей (LM), а також узагальнених лінійних моделей (GLM). Р. 2 має надзвичайно корисну властивість забезпечувати абсолютну величину доброти придатності моделі, яка не може бути надана інформаційними критеріями. Як узагальнена статистика, яка описує величину роз'яснених дисперсій, Р. 2 також може бути кількістю біологічного інтересу.

Одна з причин недооцінки Р. 2 для моделей зі змішаними ефектами полягає в тому, що Р. 2 можна визначити різними способами. Крім того, більшість визначень Р. 2 для змішаних ефектів мають теоретичні проблеми (наприклад, зменшені або негативні Р. 2 значення у великих моделях) та/або їх використанню заважають практичні труднощі (наприклад, реалізація).

Тут ми обґрунтовуємо важливість звітності Р. 2 для моделей зі змішаними ефектами. Спочатку ми наводимо загальні визначення поняття Р. 2 для LM та GLM та обговоріть ключові проблеми, пов’язані з обчисленням Р. 2 для моделей зі змішаними ефектами. Потім ми рекомендуємо загальний і простий метод розрахунку двох типів Р. 2 (граничний та умовний Р. 2) як для LMM, так і для GLMM, які менш сприйнятливі до загальних проблем.

Цей метод ілюструється прикладами і може широко застосовуватися дослідниками в будь-яких галузях дослідження, незалежно від програмних пакетів, що використовуються для встановлення моделей зі змішаними ефектами. Запропонований метод може спростити презентацію Р. 2 для широкого кола обставин.

Вступ

Багато біологічних наборів даних мають багатошарові шари через ієрархічну природу біологічного світу, наприклад, клітини всередині особин, особини всередині популяцій, популяції всередині видів та види всередині спільнот. Тому нам потрібні статистичні методи, які явно моделюють ієрархічну структуру реальних даних. Лінійні моделі зі змішаними ефектами (LMM; їх також називають багаторівневими/ієрархічними моделями) та їх розширення, узагальнені лінійні моделі зі змішаними ефектами (GLMM) утворюють клас моделей, що включають багаторівневі ієрархії в дані. Справді, LMM та GLMM стають частиною стандартних наборів методологічних інструментів у біологічних науках (Болкер та ін. 2009), а також у соціальних та медичних науках (Gelman & Hill 2007; Congdon 2010; Snijders & Bosker 2011). Широке використання GLMM демонструє, що статистика, яка узагальнює належність моделі змішаних ефектів до даних, буде мати велике значення. На сьогоднішній день не існує такої узагальненої статистики, яка була б загальновизнаною для моделей зі змішаним ефектом.

Багато вчених традиційно використовують коефіцієнт детермінації, Р. 2 (в діапазоні від 0 до 1), як зведену статистику для кількісної оцінки належності моделей фіксованих ефектів, таких як множинні лінійні регресії, анова, анкова та узагальнені лінійні моделі (GLM). Поняття Р. 2, оскільки "пояснення відхилення" є інтуїтивним. Тому що Р. 2 є одиничним, він надзвичайно корисний як підсумковий індекс для статистичних моделей, оскільки можна об’єктивно оцінити придатність моделей та порівняти Р. 2 значення в дослідженнях подібним чином, як стандартизована статистика величини ефекту за певних обставин (наприклад, моделі з однаковими відповідями та подібним набором предикторів або іншими словами, це може бути використано для метааналізу; Nakagawa & Cuthill 2007).

У таблиці 1 ми коротко узагальнимо 12 властивостей Р. 2 (заснований на Kvålseth 1985 та Cameron & Windmeijer 1996; збірка, прийнята в Orelien & Edwards 2008), яка забезпечить читачеві добре відчуття того, що таке "традиційний" Р. 2 статистика повинна бути, а також забезпечити орієнтир для узагальнення Р. 2 до моделей зі змішаними ефектами. Узагальнююче Р. 2 від лінійних моделей (LM) до LMM та GLMM виявляється важким завданням. Ряд способів отримання Р. 2 запропоновано для змішаних моделей (наприклад, Snijders & Bosker 1994; Xu 2003; Liu, Zheng & Shen 2008; Orelien & Edwards 2008). Однак ці запропоновані методи поділяють деякі теоретичні проблеми або практичні труднощі (детально розглянуті нижче), і, отже, немає консенсусу щодо визначення Р. 2 для моделей зі змішаними ефектами з’явилося в статистичній літературі. Тому це не дивно Р. 2 рідко повідомляється як зведена статистика моделі, коли використовуються змішані моделі.