Виявлення прогностичних особливостей розладів спектру аутизму в клінічній вибірці підлітків

Предмети

Анотація

Вступ

Матеріали і методи

Зразок даних та попередня обробка

Дослідження було проведено в рамках ASD-Net, дослідницької мережі з акцентом на ASD, що фінансується німецьким федеральним міністерством освіти та досліджень 44. Усі дані про учасників надходили з чотирьох спеціалізованих амбулаторних клінік ASD у Німеччині, де для підтвердження або виключення діагнозу ASD застосовувались діючі діагностичні золоті стандартні процедури. Всіх учасників направляли спеціалісти або самостійно направляли в амбулаторні відділення. Дані учасників були зібрані ретроспективно з медичних записів відповідної клініки (огляд ретроспективної діаграми) та об’єднані в один набір даних для аналізу. Ця процедура була схвалена Комітетом з питань етики Charité - Universitätsmedizin Berlin (EA4/129/19), і через ретроспективний характер збору та аналізу даних на основі регулярно отриманих клінічних даних місцевий комітет з питань етики відмовився від необхідності отримання поінформованої згоди. Усі методи виконувались відповідно до відповідних інституційних та міжнародних дослідницьких вказівок та норм.

Процедура діагностики включала стандартизоване спостереження за поведінкою у всіх випадках (модуль ADOS 4 10), стандартизоване опитування, якщо були доступні батьківські інформатори (ADI-R 12; доглядачі були доступні в 62% усіх випадків (ASD: 71%, не -ASD: 50%)) та диференціально-діагностичне обстеження (створені Структуровані анкети та Структурні клінічні опитування, які часто використовуються в німецькомовних країнах), що допомогло кваліфікованим та досвідченим клініцистам у встановленні найкращо оціненого клінічного діагнозу. Для деяких випадків було доступно кілька оцінок, однак для кожного випадку було розглянуто лише останню оцінку.

Наша вибірка включала дані з 673 випадків, з яких 57% отримали діагноз ASD ("ASD", n = 385), а 43% не отримали діагноз ASD, але відповідні диференціальні діагнози, такі як афективні розлади, тривожні розлади, ADHD та/або розлади особистості або відсутність поточного психіатричного діагнозу («не-ASD», n = 288; для більш детального опису фенотипового різноманіття див. Додаткову таблицю 1). Підтипи ASD згідно з МКБ-10 (F84.0, F84.1, F84.5) були згруповані, даючи нам двійковий показник результатів класів "ASD" і "не-ASD" для наших процедур машинного навчання. Не було суттєвої різниці між двома групами щодо віку, статі та рівня інтелекту (Таблиця 1).

ADOS - це стандартизована шкала спостережень, призначена для охоплення важливих соціально-комунікативних форм поведінки та стереотипних та повторюваних особливостей поведінки 10. У модулі 4, який призначений для словесно вільних підлітків та дорослих, ці аспекти кодуються на 31 різних елементах. Коди падають за порядковою шкалою від 0 (відсутність відхилень, пов’язаних з аутизмом), до 2 (певні докази відхилень), а іноді і 3 (глибока тяжкість), з додатковими кодами 7 та 8 для ненормальної поведінки або поведінки, що не проявлялася під час спостереження, код 9 для відсутніх значень (тобто відповіді пропущено або залишено порожніми).

Модуль ADOS 4 забезпечує алгоритм підрахунку, що складається з підмножини діагностично найбільш інформативних 11 пунктів (див. Таблицю 2) із доменів соціальної взаємодії та комунікації для обчислення оцінки порівняння, яка дає інструментальну класифікацію аутизму, аутистичного спектру чи не -спектр.

Для попередньої обробки даних для нашого аналізу машинного навчання ми перекодували коди ADOS від 3 до 2 та коди 7 та 8 до 0 аналогового довідника ADOS. Відсутні значення (тобто коди 9) були зараховані з використанням k найменування найближчого сусіда з k = 5 (knnImpute) за допомогою вбудованого попередня обробка () функція з пакету caret R 45. У нашому наборі даних шість елементів бракувало в 4–10% усіх випадків (елементи A6, B4, C1, E1, E2, E3), а на всі інші елементи бракувало відповідей менш ніж у 2,5% випадків (для більш детальної інформації опис розподілу кодів ADOS та відсутніх значень у нашому зразку, див. додаткову таблицю 2). Крім того, всі числові змінні були нормалізовані до діапазону [0; 1].

Машинне навчання

Попередні класифікаційні експерименти використовували різні техніки машинного навчання, включаючи машини векторної підтримки, моделі на основі дерев та загальні лінійні моделі 32. У цих попередніх публікаціях машини з підтримкою векторів (SVM) були серед моделей, які показали найкращі показники 36,41,42. Крім того, SVM - це один із найбільш часто використовуваних алгоритмів, який був використаний для класифікації ASD завдяки своїй високій потужності прогнозування 32. Тому ми вирішили використовувати класифікацію SVM з радіальним ядром, використовуючи svmRadial пакету caret R 45 як наш класифікатор машинного навчання. Ми провели додатковий аналіз, використовуючи випадковий ліс, який показав дещо нижчі прогнозні показники. Через читабельність та обмеженість місця ми представляємо результати лише для SVM. Результати нашого випадкового аналізу лісу можна знайти в додатку (див. Додаткову таблицю 3).

Усі 31 предмет ADOS використовувались як ознаки, а найкращий клінічний діагноз людей використовувався як наш клас прогнозування (ASD проти non-ASD). Всі етапи перевірки та попередньої обробки даних, включаючи імпутацію та аналіз, виконувались за допомогою R версії 3.5.1 у Rstudio 1.1.456.

Для порівняння показників моделі ми оцінили AUC прогнозів, отриманих із нашого нещодавно виявленого зменшеного підмножини ознак, порівняно з усіма 31 елементами ADOS порівняно з підмножиною 11 елементів, запропонованих алгоритмом ADOS. Крім того, ми порівняли ефективність моделі з класифікатором з 12 елементів, який раніше ідентифікували Косміцький та його колеги 41 у своїх експериментах, розглядаючи дітей та підлітків, як оцінювали за допомогою модуля ADOS 3 (список цих елементів див. У таблиці 2). Для оцінки відмінностей з точки зору AUC ми спирались на тест Делонга 48 для двох корельованих кривих ROC, а також тест значимості повторного вибіркового аналізу початкового рівня 49,50 для двох корельованих кривих ROC (кожен раз порівнюючи перекриття довірчих інтервалів з 10000 завантажені ітерації).