Ідентифікація регулона деградації р-кумарату у Rhodopseudomonas palustris методом Xpression

АНОТАЦІЯ

Високопродуктивне секвенування кДНК, приготовленої з РНК, підхід, відомий як RNA-seq, набуває все більшого використання як метод аналізу транскриптомів. Незважаючи на численні переваги, широкомасштабному впровадженню цієї техніки заважає відсутність простих у використанні інтегрованих інструментів з відкритим кодом для аналізу даних генерованих послідовностей нуклеотидів. Тут ми описуємо Xpression, інтегрований інструмент для обробки даних прокаріотичної РНК-послідовності. Інструмент простий у використанні та повністю автоматизований. Він виконує всі основні завдання обробки, включаючи вилучення послідовності нуклеотидів, вирівнювання, кількісну оцінку, нормалізацію та візуалізацію. Важливо, що Xpression обробляє мультиплексовані та специфічні для ланцюга дані послідовностей нуклеотидів. Він витягує та обрізає певні послідовності з файлів і окремо кількісно визначає сенс і антисмислові читання в кінцевих результатах. Виходи інструменту також можна зручно використовувати для подальшого аналізу. У цій роботі ми показали корисність Xpression для обробки специфічних для ланцюга даних RNA-seq для ідентифікації генів, регульованих CouR, фактором транскрипції, який контролює деградацію p-кумарату бактерією Rhodopseudomonas palustris .

ВСТУП

RNA-seq - нещодавно розроблена методика глобального аналізу транскриптів мРНК, яка передбачає використання технології секвенування з високою пропускною здатністю (18). Він має ряд переваг перед традиційними технологіями на основі мікрочипів, зокрема покращена чутливість, збільшений динамічний діапазон та менша вартість. В результаті він стає найкращим інструментом для досліджень експресії генів. Незважаючи на багато переваг, широкому впровадженню РНК-послідовності перешкоджає відсутність простих у використанні інтегрованих інструментів з відкритим кодом для обробки даних послідовностей нуклеотидів, які генеруються як результат техніки. Для кожного експерименту з RNA-seq генеруються мільйони зчитувань необроблених послідовностей, що робить неможливою обробку даних послідовності без біоінформаційних інструментів.

Розроблено ряд інструментів для автоматичної обробки даних RNA-seq. Комерційні рішення, такі як Avadis NGS та Illumina CASAVA, пропонують широкі можливості, але їх вартість непомірна для невеликих лабораторій. Некомерційні інструменти, такі як ArrayExpressHTS (6) та rnaSeqMap (11), нещодавно були випущені, але жоден із існуючих інструментів не призначений спеціально для обробки даних прокаріотичних РНК-послідовностей. Завдяки меншим розмірам генома, дані прокаріотичної РНК-послідовності можна мультиплексувати, додаючи штрих-код до кожного зразка, щоб зменшити витрати на послідовність зразків. Крім того, для побудови інформації про напрямок прокаріотичних розшифровок можуть бути використані специфічні для побудови бібліотеки методи побудови (2, 8). Ці методи дають послідовності у власному напрямку, а також у напрямку зворотного доповнення щодо орієнтації відкритої рамки зчитування (2, 8). Навички програмування потрібні для налаштування існуючих біоінформаційних інструментів для обробки даних цих типів RNA-seq.

Тут ми описуємо Xpression, інтегрований інструмент, який ми розробили для обробки даних прокаріотичних РНК-послідовностей, створених за допомогою технології секвенування Illumina. Інструмент приймає прості команди від користувачів за допомогою графічного інтерфейсу, повністю автоматизований і закінчує всі завдання з обробки, починаючи від вилучення послідовності і до генерації загального файлу формату візуалізації, який можна відкрити за допомогою програмного забезпечення для візуалізації, такого як Artemis (http: // www.sanger.ac.uk/resources/software/artemis/) або вбудований переглядач геноміки (http://www.broadinstitute.org/igv/). Він буде обробляти дані, які не є специфічними для певної галузі. Але він також призначений для аналізу мультиплексованих та специфічних даних. Він витягує та обрізає певні послідовності з файлів і окремо кількісно визначає сенс і антисмислові читання в кінцевих результатах. Виходи з Xpression також можна зручно використовувати для подальшого аналізу. Наприклад, користувачі можуть застосувати статистичну програму, таку як DESeq (1), до звітів про експресію генів, щоб ідентифікувати диференційовано експресовані гени.