Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Определение состава и размера выборки молекулярных последовательностей для филогенетического анализа




Этапы молекулярно-филогенетического анализа

 

                                 Исполнитель:

                                                               магистрант 1 курса гр. 01-740-05

                                     Кармазина А.О.

 

 

     

 

Казань 2018 г.

 

СОДЕРЖАНИЕ

 

     
1. Молекулярная филогенетика как отдельная отрасль биологических исследований  
2. Сущность молекулярно-филогенетического анализа: обязательные компоненты, этапы, факторы объективности  
2.1. Определение состава и размера выборки молекулярных последовательностей для филогенетического анализа  
2.2. Выравнивание молекулярных последовательностей  
2.3. Построение филогенетических деревьев: структура и методы  
2.3.1. Понятие и структура филогенетических деревьев  
2.3.2. Дистанционные методы построения филогенетических деревьев  
2.3.3. Методы анализа дискретных признаков  
2.4. Статистическая оценка филогенетических деревьев    

Список использованной литературы

 

 


Молекулярная филогенетика как отдельная отрасль биологических исследований

Молекулярная филогенетика – раздел биологии, занимающийся изучением эволюционных взаимоотношений между живыми организмами с привлечением данных об их строении на молекулярном уровне - ДНК, РНК, и белков. Молекулярная филогенетика исходит из того, что схожесть биологических функций и молекулярных механизмов у разных видов может указывать на то, что они произошли от общего предка. Эту взаимосвязь, сложившуюся в ходе эволюционного процесса, можно установить путем анализа структуры и функций молекул и их изменений во времени, что имеет важное значение для решения проблем фундаментальных биологических дисциплин (например, эволюционных путей развития видов, эволюции генов, биологической систематики), а также для прикладных областей биологических исследований (например, биоразнообразия, исследования механизмов заражения патогенными микроорганизмами, и т.д.) [1].

Сущность молекулярно-филогенетического анализа: обязательные компоненты, этапы, факторы объективности

Занимаясь выявлением родственных связей между организмами и реконструкцией путей их исторического развития, филогенетика изображает последние в виде филогенетических схем. Эти схемы могут быть получены посредством филогенетического анализа, в основе которого лежит идея генеалогической передачи признаков. Если распределения признаков, которые наблюдаются у организмов, как рецентных, так и ископаемых, унаследованы от общего предка, то анализируя эти распределения, теоретически можно получить филогенетические траектории отдельных признаков, а затем на этом основании восстановить эволюционные истории таксонов. Для решения этой задачи необходимо, чтобы в наличии были: (1) сами признаки, (2) модели эволюции этих признаков и (3) методы филогенетического анализа, т.е. обоснованные и систематизированные совокупности шагов и действий, которые необходимо предпринять, чтобы на основании изучения признаков и с учетом модели эволюции этих признаков осуществить филогенетическую реконструкцию [12]. Теоретически для получения филогенетической реконструкции можно использовать изменчивые признаки любой природы, например, экологические и поведенческие. На практике в настоящее время чаще всего используются морфологические, молекулярные и цитогенетические признаки. Главное требование, которое предъявляется к признакам в филогенетике, состоит в том, что признаки должны быть гомологичными. Негомологичные состояния организмов, даже если они похожи, не несут информацию об общем предке, и их нет смысла сравнивать и использовать для филогенетических целей. Некоторую сложность при проведении филогенетической реконструкции представляет тот факт, что эволюционные траектории разных признаков, принадлежащие одной и той же группе таксонов, могут различаться. Филогения признака – не обязательно то же самое, что филогения таксона [13]. В то же время достаточно очевидно, что генеалогические линии разных признаков, относящихся к одной и той же эволюционной линии организмов, должны быть в среднем более или менее конгруэнтны (изоморфны), тогда реконструкция филогении по их совокупности возможна. Второй важнейший компонент филогенетического анализа – это выбор модели эволюции признаков. Модели – это словесные или имеющие вид математических формул описания закономерностей эволюционных преобразований признаков. Обязательный компонент любой филогенетической модели – это топология, то есть геометрическая, обычно двухмерная схема, показывающая генеалогические связи между единицами филогенетического анализа. У филогенетических моделей могут быть различные качественные и количественные параметры, выраженные словами, числами, соотношениями и вероятностями. Третий компонент филогенетического анализа – это собственно построение топологии (или сети) с использованием определенного метода. Каждый метод должен иметь теоретическое обоснование возможности его применения, а также включать набор алгоритмов, которые позволяют с учетом выбранной модели трансформировать изученное распределение признаков в филогенетическую реконструкцию. Эти алгоритмы могут быть неявными, интуитивными, или они могут быть различным образом формализованы. Эти три компонента анализа – признаки, модели и методы – одинаково важны для реконструкции филогении.

В самом общем виде филогенетический анализ включает следующие этапы: 1) Определение состава и размера выборки молекулярных последовательностей исследуемых организмов для последующего анализа; 2) выравнивание молекулярных последовательностей; 3) выбор метода филогенетической реконструкции; 4) построение филогенетических деревьев; 5) оценка достоверности и интерпретация полученных деревьев [1].

Результативность и объективность молекулярно-филогенетических исследований зависит от множества факторов [10]. Важнейшими причинами, которые могут приводить к несогласованности молекулярно-филогенетических гипотез и/или к их низкой статистической поддержке, являются: недостаточный набор экспериментальных данных (длина последовательностей), выбор неадекватных для цели исследования генов, ошибки при секвенировании и выравнивании последовательностей, выбор исследуемых таксонов, их неправильное определение, конвергентная или быстрая эволюция, гибридизация, горизонтальный перенос генов, внутри- и межгенная рекомбинация, смешение орто- и паралогичных генов в анализе, неодинаковая скорость накопления замен в разных таксонах и в разных позициях последовательностей, различия в нуклеотидном составе анализируемых последовательностей, нестационарность нуклеотидного состава, взаимозависимость эволюции отдельных сайтов в последовательностях, принятие неадекватной модели молекулярной эволюции и алгоритма построения деревьев.

Определение состава и размера выборки молекулярных последовательностей для филогенетического анализа

Статистическая достоверность тех или иных группировок на деревьях прежде всего зависит от длины анализируемой последовательности, объема выборки и разнообразия таксонов, которые определяются на первом этапе филогенетического анализа [8, 10]. Считается, что, чем анализировать много разных коротких последовательностей или одну длинную, но всего для нескольких видов, лучше увеличить выборку видов, так как при этом возрастает репрезентативность данных и уменьшается эффект притяжения длинных ветвей. Однако довольно часто в случае слаборазрешенных деревьев статистическую достоверность той или иной топологии можно повысить, анализируя более длинные последовательности. Вопрос о том, что служит потенциальным источником ошибок в филогенетических исследованиях - недостаточный объем выборки или малая длина последовательности, был поставлен и решен Rosenberg и др. [10] в 2001 при помощи компьютерного моделирования по трем основным параметрам: число образцов, скорость эволюции и длина гена на материале из всевозможных геномных баз данных. При использовании максимально возможного или в разной степени сокращенного количества образцов деревья, полученные на основании разных методов (максимальной экономии, максимального правдоподобия и ближайшего связывания) имели одинаковое число филогенетических ошибок по внутренним узлам. Авторы этой работы полагают, что для усиления достоверности филогенетических выводов увеличение длины последовательности важнее, чем расширение набора секвенированных образцов.

Важно отметить, что метод филогенетического анализа предполагает сравнение гомологичных признаков, т.е. для проведения молекулярно-филогенетического анализа требуется сформировать набор гомологичных последовательностей, все они должны относиться к общему предку. Выделяют следующие типы гомологии генов [1, 4]. Ортологичная – последовательность присутствовала в геноме предковой формы и затем перешла к родственным видам в ходе видообразования. Такие гены являются потенциально информативными для молекулярной филогении. Существуют также паралогичные гены, которые произошли в результате внутригеномных дупликаций в геноме данного вида, и в процессе эволюции их функции дивергировали. Такие гены могут стать причиной путаницы при построении филогенетических деревьев. Наконец, ряд генов являются ксенологичными, т.е. появляются в геноме различных видов организмов в результате горизонтального (ненаследственного) переноса генетического материала между организмами. Данный тип гомологичных генов не подходит для построения филогенетических деревьев (филогенетически отдаленные организмы).

Существуют специальные программы поиска гомологов по банку данных (BLAST, Nhunt, FASTA, Search-Anchor) [2]. Принцип работы этих программ таков – в ходе поиска гомологов, последовательность, введенная в строку запроса, сравнивается со всеми последовательностями в базе данных ДНК или белков, в результате чего выводятся загруженные в базу данных последовательности с высоким сходством по отношению к исходной последовательности. При формировании выборки гомологов следует также определить так называемую “внешнюю группу” (outgroup) [2, 3], т.е. корень - точку в основании филогенетического дерева, символизирующую общего предка для всех организмов, для которых строилось это дерево. Внешнюю группу составляют виды, близкородственные исследуемой группе, но менее родственные чем сами виды внутри исследуемой группы [2]. Внешняя группа помогает понять эволюцию признаков.










Последнее изменение этой страницы: 2018-05-31; просмотров: 231.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...