Злом алфавіту геному
Джон Дж. Крамер
У цій колонці йдеться про алфавіт генома та новий метод його розширення, описаний у статті, нещодавно опублікованій у Nature Online. Зокрема, кількість букв в алфавіті геному збільшено з 4 до 6. Щоб зрозуміти значення цього розвитку, ми почнемо з огляду деяких основних молекулярних біологічних.

Все життя на землі, починаючи від бактерій і закінчуючи людиною, використовує однаковий генетичний код чотирьох нуклеотидних основ: тимідилової кислоти (Т), цитидилової кислоти (С), аденилової кислоти (А) та гуанілової кислоти (G). Нуклеотиди утворюють пари, так що пари A з T і C з G утворюють сходові ланцюжки ДНК, які діють як бібліотека інструкцій для збирання білків, з яких побудовані всі життєві форми. Фермент транскриптази проходить вздовж ланцюга ДНК, транскрибуючи нуклеотидну послідовність A, C, G і T в ланцюг нуклеотидів A, C, G та U "передавальної РНК" (мРНК), приймаючи уридицилову кислоту (U) місце Т у ланцюзі мРНК. Потім транскрибована мРНК читається як смужка перфорованої паперової стрічки, по 3 літери за один раз, ферментом рибосоми (див. Мою колонку № 106 "Розшифровка рибосоми" у випуску Analog за травень 2001 р.), Який за допомогою "переносна РНК" (тРНК), збирає молекулу білка.
Білок - це, по суті, одновимірна нитка амінокислот, яка складається в тривимірний об’єкт. Такі складені білки є основними будівельними елементами всього живого. Білки утворюють структурні елементи, регулятори, захисники, каталізатори, комунікатори та насоси; рушіїв і струсі всіх живих організмів. Інструкції щодо активного збирання кожного білка кодуються в ланцюжку мРНК. ДНК має основу дезоксирибози та фосфату, що підтримує чергування послідовностей букв A, C, G та T, тоді як мРНК має основу рибози та фосфату, що підтримує чергування послідовностей букв A, C, G та U. Ці структурні відмінності роблять мРНК більш рухливою лінійною послідовністю, яка не має тенденції ДНК до спіралі та утворення подвійної спіралі.
Нещодавно група з Інституту Скриппса в Ла-Хойї, штат Каліфорнія, внесла значні зміни в ці основні правила генетики, розширивши геномний алфавіт з 4 літер до 6. Вони застосували фокус із залученням хлоропластів у рослини, які мають здатність імпортувати нуклеотиди з навколишніх тканин. Ген, відповідальний за це, ідентифіковано, і група Скриппса вилучила цей ген із клітини водоростей і зросла його в ДНК бактерії кишкової палички.
Раніше група Скриппса ідентифікувала "неприродну" пару нуклеотидів, d5SICSTP (X) і dMaMTP (Y), які мають приблизно однаковий розмір і поєднуються так само, як природні нуклеотиди ДНК. У попередніх публікаціях вони продемонстрували, що ці неприродні нуклеотиди поводились як природні пари нуклеотидів, можуть посилюватися за допомогою полімеразної ланцюгової реакції (ПЛР) і можуть бути точно транскрибовані з ДНК в мРНК. У цій роботі вони ввели в геном E. coli невелике кільце ДНК (плазміду), що містить одну пару основ XY, і продемонстрували, відстежуючи процес через 24 цикли розмноження бактерій, що нормальний механізм реплікації клітин бактерій завжди викликав ДНК, що містить пару основ XY, підлягає відтворенню разом з іншим генетичним матеріалом організму. Робота була виконана лише з однією базою X-Y, доданою до клітини, але очікується, що клітини з великою кількістю таких пар основ повинні розмножуватися однаково.
Наслідком цієї роботи є те, що до алфавіту геному додано дві букви, що призводить до 6 x 6 x 6 або 216 можливих 3-літерних комбінацій слів, так що, навіть маючи додаткові надмірності та стоп-коди, багато інших можливих 3- Буквенні слова доступні для командування складання амінокислот у білки. Природний 4-літерний код геному дозволяє використовувати лише 20 амінокислот як білкові компоненти. Підраховано, що за допомогою неприродного 6-літерного коду до 172 різних амінокислот можна використовувати для складання білків, що призводить до набагато багатшого спектру можливих білків. Це має велике значення для дизайнерських препаратів, вироблених бактеріями, та ліків підвищеної різноманітності, потенції та ефективності.
Як встановлюється зв'язок між новими 3-літерними словами, що містять X та/або Y, та зайвими 152 амінокислотами? Це можлива проблема для будь-якого використання розширеного алфавіту. Зв'язок між кодами мРНК та амінокислотами здійснюється за допомогою спеціальних молекул переносної РНК (тРНК), присутніх у цитоплазмі клітини. Це досить короткі нитки РНК, які функціонують як обробники амінокислот у процесі синтезу білка. Молекула тРНК має спеціальний розділ, який містить комплементарну послідовність, яка збігається і стикується з трибуквеним кодом мРНК, а молекула тРНК закінчується послідовністю, яка приєднується до активованої форми конкретної амінокислоти, до якої трибуквенний код посилається. Ці молекули тРНК збирають призначені для них амінокислоти, транспортують їх до рибосоми та беруть участь у збиранні їх у білок.