Безкоштовні повнотекстові унікальні к-метри IJMS як специфічні для штаму штрих-коди для філогенетичного аналізу та природних

Розмір «унікальних геномів», представлених k-мерами різної довжини для восьми окремих хромосом E. coli, і ступінь їх перетину ілюструється трьома зазначеними геномами. (а) Суцільні лінії показують нормоване на 1 Mbp у кожному геномі число k-мірів (N), виявлене в хромосомах E. coli (штами: K-12 MG1655, ETEC H10407, O26: H11 str. 11368, ABU 83972, APEC O78, str. 042, O157: H7 str. EC4115 та O7: K1 str. CE10), які відсутні в нуклеотидних послідовностях довідкової бази даних. Штриховими лініями показані криві приросту, побудовані для ΔN/Δ k. (b) Діаграма Венна, що ілюструє перетин між наборами 18-мірних ідентифікованих у геномах двох бактерій із групи A (E. coli K-12 MG1655 та ETEC H10407) та E. coli O26: H11 str. 11368, що належить до групи В1. Кількість унікальних 18-мір у кожному геномі, розмір їх загального набору та перетин між двома наборами групи А вказуються без нормування. Діаграма була створена за допомогою діаграми Венна [54].

безкоштовні

Філогенетичне дерево для 124 штамів E. coli, виведене з конкатенованих вирівняних послідовностей 27 генів у програмі IQ-TREE [70], використовуючи метод максимальної вірогідності. Оптимальною моделлю для заміщення нуклеотидів був GTR + G + I (загальна реверсивна за часом модель, що передбачає фіксовану частину інваріантних ділянок та різницю в еволюційній швидкості, описану гамма-розподілом). Рівень підтримки гілок, показаний у відсотках, був оцінений на основі 2000 ітерацій з наближенням надшвидкого завантажувального ремінця [71]. Смужка шкали відповідає кількості замін нуклеотидів на сайт. Колірний код відповідає восьми вказаним фігрупам. Назви всіх штамів вказуються біля відповідних гілок і розділяються комою для однакових послідовностей у групі B1.