Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Ограничения использования филогенетических деревьев




Построение филогенетических деревьев

В наше время филогенетические деревья, как правило, реконструируются по последовательностям белков или нуклеиновых кислот (ДНК или РНК). Деревья строятся по произвольному числу входных последовательностей с использованием специальных вычислительных (филогенетических) алгоритмов.

Существует большое количество методов построения филогении на основании молекулярных данных. Их можно подразделить на два типа:

 

1. Методы, использующие оценку генетических дистанций  (дистанционные).(Генетическое расстояние (Geneticdistance, GD) — мера генетического различия (дивергенции) между видами, подвидами, или популяциями одного вида.Малое генетическое расстояние означает генетическое сходство, большее генетическое расстояние означает меньшее генетическое сходство.)

Методы, использующие анализ дискретных признаков (дискретные).

Методы, основанные на анализе генетических дистанций

Данная группа методов базируется на данных о генетических дистанциях. Общий принцип заключается в попарном сравнении объектов и построении матрицы дистанций, которая затем используется для построения филогенетического дерева.

· UPGMA

Метод попарного внутригруппового невзвешенного среднего (UnweightedPairGroupMethodwithArithmeticMean, UPGMA) считается одним из самых простых. В нынешнем виде метод был представлен в работе Sneath и Sokal 1973 года. Первоначально использование в филогенетике связано с построением фенограмм по морфологическим признакам. Необходимым условием использования метода является постоянная скорость эволюции исследуемых нуклеотидных последовательностей. При неравномерной скорости эволюции последовательностей (несоответствие модели молекулярных часов) метод UPGMA может приводит к ошибкам в топологии дерева.

· Метод минимальной эволюции (Minimumevolution)

Метод базируется на предположении, что наиболее вероятным будет дерево с наименьшем количеством эволюционных событий.Принципом данного метода является вычисление длин ветвей (которая отражает количество эволюционных событий) всех возможных топологий деревьев.

 

В качестве наилучшего, выбирается дерево с наименьшей длиной ветвей. Если для нескольких деревьев с разной топологией длины ветвей не имеют статистически значимых различий, то эти деревья рассматриваются как равновероятные.

· Метод присоединения соседей (Neighbor-joining)

Для реализации данного метода необходимо вычислить расстояния между каждой парой таксонов (например, видов или последовательностей).

 

 

Методы основанные на анализе дискретных признаков:

· Принцип максимальной экономии (Maximumparsimony)

Для каждой возможной топологии филогенетического дерева в качества узла выбирается такой, который требует минимальных изменений для перехода к непосредственным потомкам. Для каждой топологии подсчитывается суммарное количество изменений и выбирается дерево по критерию минимума их количества. Он дает наиболее простое объяснение для заданного набора данных. Из-за своей простоты метод подвергался критике и был вытеснен методами максимального правдоподобия и Байесовскими методами. Метод максимальной экономии имеет некоторые проблемы и ограничения. Как было показано Фельштейном, метод может оказаться статистически несостоятельным, что означает, что с увеличением размера накопленных данных (например, длина последовательностей) результат может сходиться к неправильному дереву и привести к феномену притяжения длинных ветвей — филогенетическому феномену, при котором таксоны с длинными ветвями (многочисленные изменения состояний символов) имеют тенденцию оказываться более тесно связанными в филогении, чем в действительности.

· Метод максимального правдоподобия (Maximumlikelihood)

Для каждой топологии дерева длины ветвей рассчитываются так, чтобы вероятность дерева при заданной эволюционной модели была максимальной. Введение модели эволюции в метод максимального правдоподобия дает преимущество по сравнению с методом максимальной экономии, так как принимаются в расчет вероятность замен нуклеотидов и интенсивность этих замен, что объясняет филогенетические отношения между таксонами более реалистично. Важным элементом метода является учет длины ветвей дерева так, что изменения происходят более вероятно в длинных ветвях, чем в коротких, в то время как в методе максимальной экономии этот параметр игнорируется. Такой подход может устранить притяжение длинных ветвей. Несмотря на то, что метод максимального правдоподобия является лучшим подходом для вывода филогенетических деревьев с теоретической точки зрения, он является вычислительно сложным: с помощью него почти невозможно исследовать все деревья, так как их слишком много.

· Байесовский подход (Bayesianinference)

Главными преимуществами данного подхода является вычислительная эффективность по сравнению с другими методами, способность работать со сложными моделями эволюции, а также то, что, в отличие от других методов, указывающих на единственное наилучшее по заданному критерию дерево, он позволяет выбрать несколько вариантов филогенетического дерева с наибольшим значением апостериорной вероятности.

 

Методы построения деревьев могут быть оценены по нескольким основным показателям:

· эффективность (сколько времени и памяти требуются для вычислений)

· полезность (есть ли польза от полученных данных или информация бесполезна)

· воспроизводимость (будут ли повторные ответы такими же, если каждый раз даются разные данные для той же проблемной модели)

· устойчивость к ошибкам (справляется ли с неточностями в предпосылках рассматриваемой модели)

· выдача предупреждений (будет ли предупреждать нас, когда неправильно используется, то есть предпосылки неверные)

Кроме того, методы можно разделить на предполагающие и не предполагающие справедливость гипотезы «молекулярных часов» (то есть одинаковой скорости изменений для всех предковых последовательностей).

Первая группа методов строит укоренённые деревья, вторая — как правило, неукоренённые. Чаще всего предполагать «молекулярные часы» нет достаточных оснований, и поэтому большинство компьютерных программ филогенетического анализа по умолчанию выдают неукоренённые деревья.

 

Среди бесплатных пакетов филогенетического анализа большим набором реализованных алгоритмов выделяется PHYLIP, среди платных — PAUP (англ.). Для редактирования и визуализации готовых деревьев наиболее часто используются программы FigTree, Archaeopterix (англ.), iTOL, MEGA (англ.); последняя включает также реализацию основных алгоритмов реконструкции деревьев на основе выравненных биологических последовательностей. На русском языке доступна программа UGENE, распространяющаяся по свободной лицензии и включающая в себя построение и визуализацию деревьев.

 

Ограничения использования филогенетических деревьев

Филогенетические деревья, построенные на основе последовательностей генов или всего генома особей различных видов, могут дать представление об эволюции, но у них есть серьёзные ограничения. Филогенетические деревья не дают полного и абсолютно точного описания эволюционной истории. Данные, на которых основана реконструкция дерева, всегда отражают эволюционную историю с некоторой погрешностью. Из-за этого дерево, построенное на основе ограниченных данных (например, последовательности единственного гена или белка), требует скептического отношения к себе, потому что дерево, построенное на основе другого независимого источника данных, нередко будет отличаться от первого.

 

Следует также скептически относиться к включению в дерево вымерших видов, информация о которых полностью или частично основана на последовательностях ДНК. Хотя небольшие фрагменты «древней ДНК» сохраняются дольше 100 000 лет, но, за исключением некоторых особых случаев, длина таких фрагментов недостаточна для использования в филогенетическом анализе.










Последнее изменение этой страницы: 2018-06-01; просмотров: 318.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...