Метод кодування наборів клінічних даних за допомогою медичної інформатики та прийняття рішень SNOMED CT BMC

Анотація

Передумови

Протягом останнього десятиліття з'являється все більше літератури про те, як Систематизовану номенклатуру клінічних термінів медицини (SNOMED CT) можна застосовувати та використовувати в різних клінічних умовах. Однак для тих, кому доручено включати SNOMED CT у клінічні програми та словниковий запас своєї організації, існує декілька детальних інструкцій щодо кодування та прикладів, щоб продемонструвати, як це можна зробити та пов'язані з цим проблеми. Ця стаття описує евристичний метод, який може бути використаний для кодування клінічних термінів у SNOMED CT, та ілюстрацію того, як він застосовувався для кодування існуючого набору даних паліативної допомоги.

Методи

Процес кодування включає: ідентифікацію елементів вхідних даних; очищення елементів даних; кодування очищених елементів даних; і експортувати закодовані терміни як набори вихідних термінів. Виходять чотири виходи: еталонний набір SNOMED CT; набір термінології інтерфейсу; Набір розширень SNOMED CT та набір некодуваних термінів.

Результати

Оригінальна база даних паліативної допомоги містила 211 елементів даних, 145 закодованих значень та 37 248 вільних текстових значень. Нам вдалося закодувати

84% термінів, інший

8% вимагають подальшого кодування та перевірки, тоді як терміни, що мали частоту менше п’яти, не кодувались (

Висновки

З пілотного проекту, здається, наш метод кодування SNOMED CT має потенціал стати підходом кодування термінології загального призначення, який можна використовувати в різних клінічних системах.

Передумови

Ця стаття описує евристичний метод, який може бути використаний для кодування клінічних термінів у SNOMED CT, та ілюстрацію того, як він застосовувався для кодування існуючого набору даних паліативної допомоги. Спосіб кодування вперше був розроблений в рамках магістерського проекту і з тих пір був розширений за допомогою кількох невеликих досліджень з різними наборами клінічних даних [7] та інших неопублікованих аналізів. Цей метод був вдосконалений в рамках однорічного пілотного проекту з кодування клінічних термінів з існуючої інформаційної системи паліативної допомоги в канадській організації охорони здоров’я в SNOMED CT.

Фон проекту

Метою проекту "Інформаційна система паліативної допомоги на основі стандартів (PCIS) для медичних служб Альберти, зона Едмонтон" було дослідити прийняття, використання та вплив SNOMED CT. Цілі включали створення підмножини паліативної допомоги SNOMED CT, розширення PCIS за допомогою SNOMED CT та визначення впливу на якість медичної допомоги, включаючи задоволеність лікаря та процеси управління змінами. Оскільки у нас не було заздалегідь визначеного списку термінів для кодування за допомогою SNOMED CT, частиною процесу розробки підмножини паліативної допомоги було вивчення того, які елементи даних в PCIS можуть кодуватися за допомогою SNOMED CT. Оскільки деталі пілотного проекту публікуються деінде, ця стаття зосереджується лише на описі методу кодування, який був використаний для отримання підмножини паліативної допомоги. Цей проект отримав схвалення з питань етики як Регіон охорони здоров’я столиці Едмонтону - Колегія з питань охорони здоров’я з питань охорони здоров’я (Група охорони здоров’я, протокол Pro00005461), так і Колегія з питань етики досліджень людини з Університету Вікторії (протокол 09-182).

Схеми бази даних, допустимі коди та анонімізовані текстові записи були витягнуті з PCIS. PCIS має два поля даних, "діагноз" та "проблема при направленні", які використовуються для кодування клінічних висновків пацієнтів. Існує 20 заздалегідь визначених діагнозів та 14 заздалегідь визначених проблем при перенаправленні, які можна вибрати із списку вибору. Шістнадцять діагнозів стосуються категорій раку (наприклад, "кістка та сполучна тканина", "меланома" та "око, мозок та інші відділи центральної нервової системи"), тоді як чотири стосуються неракових категорій (тобто нервово-м'язових, серцево-легеневих, інфекційні хвороби та інші). Попередньо визначена проблема при направленні включає такі висновки, як "біль", "марення", "нудота/блювота" та "астенія". Будь-які додаткові деталі були записані у вільні текстові поля, позначені як додаткова інформація. Оскільки було лише 34 заздалегідь визначених пунктів списку вибору, переважна більшість цієї інформації була записана як вільний текст. Зразок знімка екрану PCIS наведено на рисунку 1. Для цього пілотного проекту була використана версія міжнародного випуску SNOMED CT від 31 липня 2008 року.

Знімок екрана екрана "Деталь справи" Інформаційної системи паліативної допомоги.

Метод

Наш евристичний метод кодування SNOMED CT складається з чотирьох частин: (а) визначення елементів вхідних даних; (b) очищення елементів даних; (c) кодування очищених елементів даних; і (d) експортувати закодовані терміни як набори термінів SNOMED CT. Огляд цього методу наведено на рисунку 2. У процесі кодування використовуються три програмні засоби - алгоритм пакетного узгодження, браузер CliniClue та Microsoft Excel. Алгоритм пакетного узгодження зменшує обсяг ручної роботи за рахунок автоматизації узгодження очищених елементів даних за допомогою SNOMED CT, браузер CliniClue використовується для ручного пошуку понять, тоді як Microsoft Excel використовується для перегляду результатів.

Огляд методу кодування SNOMED CT.

Визначення елементів вхідних даних

Визначення потенційних елементів даних, що кодуються

Першим кроком є визначення потенційних елементів даних у джерелі бази даних для кодування. Існує три типи: елементи даних, закодовані значення та значення вільного тексту. Елементи даних посилаються на назву полів введення або можуть розглядатися як запитання (наприклад, "Діагностика", як у "Який діагноз має пацієнт?"). Відповідь може мати форму закодованих значень або значень вільного тексту. Кодовані значення - це відповіді, які були визначені заздалегідь і можуть бути обрані зі списку вибору (наприклад, "Рак легенів" або "Рак молочної залози"). Якщо у пацієнта є діагноз, який не був визначений заздалегідь, додаткові деталі діагностики можуть бути записані у вільне текстове поле.

Підготовка списку елементів даних

Під час вилучення елементів даних важливо вести аудиторський слід елементів даних, щоб ми могли простежити, звідки походять терміни. Цей аудиторський слід повинен містити назву таблиці, назву елемента даних, тип даних, а також код та опис, якщо це застосовно. Знімки екрана програми, де використовується елемент даних, також були б корисними для розуміння контексту, в якому він використовується.

Витяг елементів даних

Імена елементів даних можна отримати вручну, переглянувши схему бази даних та скопіювавши ім'я кожного елемента даних, або скориставшись програмним додатком для управління базами даних, щоб експортувати схему в текстовий файл або електронну таблицю. Елементи даних у базі даних можна класифікувати як такі, що стосуються клінічних випадків, ідентифікаторів або сліду аудиту. Клінічні зустрічі стосуються таких елементів даних, як ім’я пацієнта, діагноз та стать. Ідентифікатори посилаються на елементи даних, які зазвичай є первинними або зовнішніми ключами таблиць. Аудиторський слід відноситься до таких елементів даних, як інформація про обліковий запис користувача, журнали аудиту, до кого додано чи відредаговано запис та коли він був змінений. Аудиторський шлях може також посилатися на такі елементи даних, як стан кодованого значення, чи воно активне чи ні. Малоймовірно, що ідентифікатори та елементи даних аудиторії аудиту можуть кодуватися, оскільки SNOMED CT не був розроблений для цієї мети.

Витяг кодованих значень

Закодовані значення зазвичай зберігаються в таблицях пошуку. Ці пошуки, як правило, є зовнішніми таблицями в базі даних і є окремими від програми, хоча існують випадки, коли закодовані значення вбудовуються в саме програмне забезпечення. Якщо закодовані значення вбудовані в програмний код, може знадобитися скопіювати кожне закодоване значення вручну, якщо програмне забезпечення не включає функцію експорту. Для таблиць пошуку, які записані в базі даних, залежно від її конструкції, закодовані значення можуть бути записані в одній таблиці або закодовані значення для кожного елемента даних можуть бути в окремих таблицях. Під час вилучення закодованих значень важливо розрізняти код (тобто значення) та опис коду (тобто значення значення). Наприклад, "Чоловічий" - це опис коду і може бути представлений алфавітним кодом "M" або числовим кодом, таким як 1. При кодуванні термінів у SNOMED CT, слід використовувати опис коду, але важливо мати можливість зв’язати опис коду назад із кодом. Кодування закодованих значень за допомогою SNOMED CT можна вважати формою відображення.