Полная версия страницы  English  

ClustalW-phyl.tree

Feodor, 04.05.2010 15:43
Все привет!
Господа, помогите пожалуйста советом-
В прикреплённом файле 2 дерева: в одном из случаев я сократил, т.е. удалил 30 % от выравниваемых последовательностей (если в первом случае выравнивались последовательности размером около 30-350 п.н., то во втором- около 250 п.н.). Как видно - результаты поменялись кардинально! Дайте рекомендацию по размерам последовательностей: должны ли они быть одной длины, надо сокращать "вылезающие" концы в некоторых из них? Выровненные последовательности - модифицировать? итп
Спасибо.


Файл/ы:

скачать файл ФИФИФИФИФИ.bmp
размер: 1.19
кол-во скачиваний: 136


Guest, 04.05.2010 15:56
Лучше брать одинаковой длины; обрезать вылезающие концы. И соответственно подписать, что дерево получено на основе ххх нт (ак) частичной последовательности гена (протеина).
Делетанский вопрос, 05.05.2010 14:44
Извините, что влезаю в Вашу ветку. Но хотел спросить у знающий людей: а насколько грамотно говорить о родстве тех или инных видов делая множественное выравнивание по одному белку? Вообще, сколько нужно белков взять для выравнивания у соответствующих видов, чтобы иметь право сказать кто от кого произощел?
Заранее спасибо
klav, 05.05.2010 16:53
(Делетанский вопрос @ 05.05.2010 15:44)
Ссылка на исходное сообщение  Извините, что влезаю в Вашу ветку. Но хотел спросить у знающий людей: а насколько грамотно говорить о родстве тех или инных видов делая множественное выравнивание по одному белку?

Довольно безграмотно. О родстве судят по в первую очередь по ДНК. Одного гена мало.
(Делетанский вопрос @ 05.05.2010 15:44)
Ссылка на исходное сообщение
Вообще, сколько нужно белков взять для выравнивания у соответствующих видов, чтобы иметь право сказать кто от кого произощел?
Заранее спасибо

Белки необязательно. Можно и гены, не кодирующие белки (как 16S, например).
Pryanik, 07.05.2010 22:15
Автору темы.
Я бы посоветовала сделать дерево по последовательностям полной длинны. А потом получить bootstrap values, по ним вы сможете определить, какие кластеры у вас устойчивые, а какие -- нет.
Можно еще сделать тест на рекомбинацию, т.е. может у вас последовательности между собой рекомбинируют, но не по всей длинне. Это привело бы к подобнум результатам.


Человеку, задавшему деликатный вопрос.
Вопрос ваш очень интересный и хороший. Часто филогиния разных генов будет поддерживать разные эволюционные сценарии, и даже анализируя один и тот же ген, не кодирующий район или что еще вам могло бы в голову прийти... с помощью разный методов вы можете получить разные результаты.
Думаю один из самых знаменитых споров в этом ключе это coelomata vs ecdysozoa hypothesys о родстве между круглыми червями, членистоногими и вторичноротыми.
Все это происходит либо (1) из-за действительно разных эволюционных историй участков одного и того же генома, такое часто наблюдается у бактерий, для которых горизонтальный перенос генов далеко не редкость, либо (2) из-за несовершенности методов анализа для довольно сильно/мало эволюционировавших от общего предка последовательностей, либо (3) из-за того что у вас в последовательностях присутствует не только signal of ancestry но и signal of function по скольку гены кодируют что-то, белок или РНК, что будет потом с чем-то связываться, выполнять какую-то биологическую функцию, разделить эти два сигнала практически не возможно, хотя люди пытались.

На практике для таких целей (определения эволюционной истории видов), используют либо несколько генов, конкатинируют их последовательности и строят дерево на основе многих генов сразу, либо, как вам уже тут сказали, изпользуют какой-то 1 универсальный гет, 16S рРНК, один из примеров.
Но о родстве конкретных последовательностей вы можете, и должны, говорить основываясь на конкретном дереве, полученном с использованием этих конкретных последовательностей.
Pryanik, 07.05.2010 22:32
Погодите, Feodor, а вы деревья какими прогами получали?
ClustalW -- это програма для выравнивания, не для постройки деревьев, не пользуйтесь ей для этого, да и для выравниваний не стоит.
Возьмите muscle или mafft, он именно для выравнуваний, для деревьев PhyML или RaxML, но круче всего MrBayes. Если это серьезное дерево, для диплома или еще чего, то надо еще и модель эволюции подобрать используйте prottest для белковых деревьев и modeltest для ДНК, а если нет, то просто используйте WAG+I+GAMMA модель для белков и GTR+I+GAMMA модель для ДНК.
Feodor, 08.05.2010 02:59
Да, спасибо. Для диплома. Я вообще планировал делать в МЕГЕ) Через пару дней уж приступлю вплотную. Pryanik, спасибо за советы! Обязательно прислушаюсь. Мега-слабовата?
Pryanik, 08.05.2010 09:38
Mega, на сколько я помню, имеет только нейбор-джойнинг, что обычно используется для больших датасетов, т.к. просто и быстро, но для диплома пойдет и для маленьких деревьев, да и для статей в мол.биол. журналах...

Кстати есть RaxML-сервер. http://phylobench.vital-it.ch/raxml-bb/
Feodor, 08.05.2010 17:39
а

ну у меня будет последовательностей 400-700 где-то
не, там помимо NJ ещеё есть , ну я как раз им и планирую
ну на ней и остановлюсь тогда
Pryanik, 09.05.2010 01:15
Да, тогда делайте в меге, nj. но не забудьте сделать бутстрепы
Это — лёгкая версия форума. Чтобы попасть на полную, щелкните здесь.
Invision Power Board © 2001-2012 Invision Power Services, Inc.