Обробка природних мов pSCANNER

Робоча група pSCANNER по обробці природних мов (NLP) розвиває спроможність забезпечити обмін та повторне використання величезної кількості цінної медичної інформації, отриманої з клінічних текстів усіх інститутів-учасників pSCANNER. Зокрема, це передбачає створення узагальнених та масштабованих інструментів НЛП для вилучення фенотипів трьох умов використання (тобто застійної серцевої недостатності, ожиріння та контролю ваги та хвороби Кавасакі) та зберігання результатів як сховища даних фенотипів пацієнтів у схемі OMOP NLP запропонована робочою групою OHDSI NLP, яка готова підтримати клінічні дослідження. В даний час робоча група забезпечує наступні можливості НЛП для сайтів-учасників pSCANNER, а також інших CDRN в PCORnet. Будь ласка, зв'яжіться з [email protected] для отримання детальної інформації.

Ансамбль CLEAN cNLP та трубопровід

Ансамблевий конвеєр NLP CLEAN (CLinical note rEview and ANnotation) - це захищена платформа, що зберігає конфіденційність, для обробки великих корпусів клінічного тексту. CLEAN здатний зібрати різні NLP-інструменти в ансамбль, який поєднує в собі міцність цих інструментів, щоб максимізувати якість результату. CLEAN також має інтерактивний інструмент анотацій, що забезпечує захищену візуалізацію та огляд NLP, захищений двофакторним входом і віртуальним робочим столом. Ці функції поєднуються для забезпечення високоякісного видобутку з великих корпусів у керовані часові рамки.

CLEAN надає такі послуги з обробки НЛП:

Де-ідентифікація (де-ідентифікатор)
Дедуплікація
Вилучення елемента даних
- CLAMP http://clamp.uth.edu/
- EFEx https://github.com/department-of-veterans-a Affairs/efex
- cTAKES http://ctakes.apache.org/
- MetaMap https://metamap.nlm.nih.gov/

Будь ласка, зв’яжіться з [email protected], щоб скористатися CLEAN. Команда CLEAN працюватиме з вами, щоб включити вашу установу до вже затвердженого IRB. Після затвердження буде створено обліковий запис для надійного завантаження, обробки та візуалізації ваших клінічних текстових даних.

Рамка Лео

Інфраструктура обробки природної мови (NLP), розроблена VINCI, являє собою набір служб та бібліотек, що сприяють швидкому створенню та розгортанню анотаторів Apache UIMA-AS, орієнтованих на обробку природних мов. Основа UIMA-AS дозволяє Leo управляти масштабом, необхідним для обробки в режимі реального часу. Він надає інструменти віддаленої конфігурації для автоматичної оптимізації системи. Завдяки утилітам для розробників функціональність може бути додана та легко інтегрована до існуючих служб NLP. Leo дозволяє користувачам програмно генерувати примітивні та агреговані дескриптори механізму аналізу UIMA та дескриптори розгортання.