Говорячи про мою допомогу, виявляючи згадки про поведінку прихильності до гормональної терапії в Інтернет-грудях
Чжицзюнь Інь
1 Університет Вандербільта, Нашвілл, штат Теннессі, США
Вей Се
1 Університет Вандербільта, Нашвілл, штат Теннессі, США
Бредлі А. Малін
1 Університет Вандербільта, Нашвілл, штат Теннессі, США
Анотація
Вступ
Рак молочної залози є найпоширенішим видом раку серед американських жінок 1 та другою причиною смерті серед онкохворих жінок (відразу після раку легенів) 2. За підрахунками, близько 12% американських жінок в кінцевому підсумку розвинуть інвазивний рак молочної залози протягом усього життя 3. Загальним початковим методом лікування раку молочної залози є хірургічне втручання (наприклад, люмпектомія або мастектоктомія), тоді як часто застосовується допоміжна терапія (тобто лікування після хірургічного втручання), щоб зменшити ризик рецидиву раку 4. Зокрема, гормональна допоміжна терапія є популярним методом лікування, який має перевірений досвід істотного поліпшення довгострокової виживаності пацієнтів з позитивним на гормональний рецептор раком молочної залози 5. Це примітно, оскільки цей підтип захворювання включає 75% усіх випадків раку молочної залози 1. Щоб максимізувати цю користь від гормональної терапії, пацієнтам призначають режим прийому ліків, який, як очікується, триватиме як мінімум п’ять років 6. Наприклад, прийом тамоксифену (препарат для пероральної гормональної терапії) протягом п’яти років знижує смертність від раку молочної залози на 33% протягом десятиліття після початкового лікування 7. Більше того, новітні дані 8 свідчать про те, що збереження режиму тамоксифену протягом додаткових п’яти років може ще більше знизити смертність приблизно на 50%.
У цій роботі ми прагнемо розробити основу машинного навчання, щоб відрізнити згадки про поведінку прихильності до гормональної терапії (HTAB) від інших менш релевантних матеріалів із вільним текстом на онлайн-форумах з питань охорони здоров’я. Зокрема, ми зацікавлені у вивченні поведінки пацієнтів (та пов’язаних з ними факторів), таких як прийом призначених ліків або переривання лікування (наприклад, зупинка або призупинення прийому полку або перехід на інший препарат). У наших рамках завдання розрізнення згадувань та не згадувань HTAB поставлено як проблема класифікації. Щоб максимізувати прогнозуючу ефективність нашого фреймворку, ми широко адаптуємо та складаємо методи попередньої обробки та інженерних технологій, а також перевіряємо та інтерпретуємо їх ефекти. Наша структура демонструє, що, застосовуючи методи обробки природної мови та машинного навчання, ми можемо отримати ефективний класифікатор для автоматичного виявлення згадувань (і не згадувань) поведінки прихильності до гормональної терапії. Нарешті, ми проводимо аналіз вмісту (з медичної точки зору), щоб отримати уявлення про фактори, що впливають на те, як люди спілкуються, приймаючи ліки та перериваючи поведінку ліків.