Ідентифікація та корекція таксономічно неправильно позначених послідовностей з урахуванням філогенезу
Олексій Михайлович Козлов
1 Лабораторія Exelixis, Науково-обчислювальна група, Гейдельберзький інститут теоретичних досліджень, Schloss-Wolfsbrunnenweg 35, 69118 Heidelberg, Німеччина

Цзяцзе Чжан
1 Лабораторія Exelixis, Науково-обчислювальна група, Гейдельберзький інститут теоретичних досліджень, Schloss-Wolfsbrunnenweg 35, 69118 Heidelberg, Німеччина
Пелін Йільмаз
2 Дослідницька група з геноміки та біоінформатики мікробів, Інститут морської мікробіології Макса Планка, 28359, Бремен, Німеччина
Френк Олівер Глокнер
2 Дослідницька група з геноміки та біоінформатики мікробів, Інститут морської мікробіології Макса Планка, 28359, Бремен, Німеччина
3 Університет Якобса в Бремені gGmbH, Campus Ring 1, 28759 Бремен, Німеччина
Александрос Стаматакіс
1 Лабораторія Exelixis, Науково-обчислювальна група, Гейдельберзький інститут теоретичних досліджень, Schloss-Wolfsbrunnenweg 35, 69118 Heidelberg, Німеччина
4 Технологічний інститут Карлсруе, Інститут теоретичної інформатики, Postfach 6980, 76128 Карлсруе, Німеччина
Пов’язані дані
Анотація
ВСТУП
Таксономія - це наука про класифікацію та називання груп організмів, яка, як правило, базується на спільних характеристиках та/або передбачуваній природній спорідненості. Таксономії мають принципове значення для біологічних, медичних та екологічних досліджень. Крім того, вони відіграють ключову роль у таких сферах, як управління інвазивними видами (1) або сприяння торгівлі (2).
Хоча перші спроби класифікації живих організмів можна простежити ще в глибокій давнині (наприклад, Арістотель), сучасна таксономія бере свій початок у роботі Карла Ліннея. Його унікальна біноміальна система, яка використовується і сьогодні, стандартизує назви видів у всіх сферах життя - від бактерій до тварин. Однак за останні десятиліття в систематичних методах класифікації відбулася зміна парадигми, зумовлена прогресом у молекулярній біології та біоінформатиці. Замість того, щоб покладатися виключно на, напр. Морфологічні чи фізіологічні подібності між організмами, таксономісти тепер також беруть до уваги їх філогенетичні взаємозв'язки, як випливає з молекулярних даних (послідовності ДНК або амінокислот).
Хоча молекулярні філогенії пропонують більш надійну основу для розробки таксономій, вони мають деякі потенційні підводні камені. По-перше, філогенез по суті являє собою еволюційну гіпотезу, яка залежить від кількості та якості даних послідовності, якості вирівнювання, а також методу умовиводу та параметрів. Тому таксономії, що базуються на філогенезах, потребують оновлення у міру того, як з’являються нові послідовності та методи. Часто це не так. Крім того, проблеми, властиві молекулярним даним, такі як химерні та/або низькоякісні послідовності (3,4), можуть впливати на філогенетичні умовиводи. Нарешті, людська помилка присутня завжди; неправильні культури для організмів або помилкові позначення в публічних базах даних можуть ще більше ускладнити філогенетичний аналіз та подальшу таксономічну анотацію.