Дорогие друзья! Я выполняю диссертацию (экспрессия некоторых белков при различных патологических состояниях). Экспериментальная часть почти выполнена! Шеф сказал, что диссертацию нужно дополнить биоинформатикой. А я этим никогда не занималась и он тоже . Поэтому прошу у Вас совета: чем можно ее дополнить (какие программы можно использовать в увязке с моей темой)?! Заранее всем благодарна!
Guest, 13.06.2010 00:10
За соавторство.
Митин, 13.06.2010 09:37
Особенно обратите внимание на OMIM.
РИГА, 13.06.2010 14:08
Я индуцирую мышам следующие патологии: сахарный диабет (протамин-сульфатом), токсический гепатит (тетрахлорметаном), болезнь паркинсона и т.д. Скажите, есть ли какие-нибудь программы с помощью которых можно предсказать биологические эффекты CCl4 и протамин-сульфата? Можно ли это включить в диссертацию? Были ли такие работы?
Pryanik, 14.06.2010 07:56
А какие вы белки меряете и почему? Можно посмотреть эволюцию соответстаующих генных семейств, поискать сайты связывания транскрипционных факторов в регуляторных районах. Вы очень расплывчато написали про то что вы делаете, трудно что-то посоветовать.
Про предсказания -- не знаю. Поищите microarray данные, может кто-то делал эксперименты с вашими веществами, может даже на мышах.
РИГА, 14.06.2010 20:08
(Pryanik @ 14.06.2010 07:56)
А какие вы белки меряете и почему? Можно посмотреть эволюцию соответстаующих генных семейств, поискать сайты связывания транскрипционных факторов в регуляторных районах. Вы очень расплывчато написали про то что вы делаете, трудно что-то посоветовать.
Про предсказания -- не знаю. Поищите microarray данные, может кто-то делал эксперименты с вашими веществами, может даже на мышах.
Pryanik, огромное спасибо что согласились помочь. Попытаюсь по подробнее рассказать о своей теме. Я исследую методом real-time PCR , вестернблотом и Elisa как меняется экспрессия некоторых шаперонов и некоторых регулонов в разных органах у мышей при индукции различных патологических состояний. Фактически, я измеряю как уровень транскриптов соответствующих белков (real-time PCR), так и уровень самих белков (westernBlot, Elisa). Это позволяет установить на каком уровне происходит регуляция экспрессии (на уровне трансляции или транскрипции) при соответствующих патологиях. Вот шеф и говорит дополнить биоинформатикой мою работу, потому что денег на реактивы сейчас особо нет. А защищаться уже скоро-Осенью. Поэтому помогите пожалуйста. Как можно посмотреть эволюцию соответствующих генных семейств и сайты связывания транскрипционных факторов в регуляторных районах? Очень прошу написать, с помощью каких программ это можно сделать, каков алгоритм действий и в какой форме представить результаты??! Заранее очень благодарна
Nastja, 15.06.2010 06:38
Вот с этого и надо было начинать: нет денег на реактивы, а что-то делать надо, поэтому посоветуйте, чем можно заняться на компьютере.
Так как Вам, по большому счету, все равно, чем дополнять диссертацию, то надо найти ближайшего к Вам биоинформатика и спросить, чем он занимается, и не научит ли он Вас это делать. Ну а потом научиться и сделать.
Учить Вас чему-то за соавторство вряд ли кто будет, потому как в условиях отсутствия реактивов и внятного научного руководства мало шансов на хорошую статью, а если Вам просто накидать ключевых слов, Вы, похоже, вряд ли сможете что-то сделать.
Pryanik, 15.06.2010 08:18
Это точно, в принципе все равно что делать.
Для начала сделайте семейства. Возьмите свой ген (белковую последовательность) из мыши (найдите в genbank или swissprot) и поищите с помощью blast гомологи в других организмах, также посмотрите в разных базах данных. Ensembl, hogenom, pfam, ucsc genome browser. Посмотрите что сможете отыскать в статьях, многие семейства в млекопитающих очень хороше изучены.
Для регуляторных районов. Начните с поиска консервативных сайтов в регуляторных районах ваших генов. Используете BLAT для этих целей.
Pryanik, 15.06.2010 08:21
а вообще, гугл знает все, т.ч. гуглите, gene family positive selection смотрите что народ делает и как.
РИГА, 15.06.2010 20:15
Pryanik, огромное спасибо! А все гомологи исследуемого мной гена, найденные с помощью бласт в других организмах будут являться его генным семейством? а сам этот метод поиска - gene family positive selection? Правильно я поняла? И в чем принципиальные отличия Blat от Blast?
Настя, если бы у меня был знакомый биоинформатик или даже не знакомый, то я не писала бы сюда. А вообще, все методы я осваивала сама и никто меня ничему не учил. Мне только нужна грамотно поставленная задача, перечень методов с помощью которых ее можно решить. Для этого я и обратилась на форум, чтобы как можно меньше потратить времени, копаясь в интернете. Просто сейчас куча документов и совсем нет времени.
Pryanik, 15.06.2010 22:46
Да, это и есть семейсво, но включать оно может как гены из вашего организма, так и гены из других организмов. Hо берите группу пошире, чтобы захватить какое-нибудь близкородственное семейство, когда построите дерево, по нему будет видно сколько аут-паралогов вы включили в анализ, если несколько, то оставите одного из них, а остальных удалите, эту последовательность вы будете использовать как аутгруппу в дальнейшем.
Потом вставляете гепы в ДНКовые последовательности (только кодирующие части)
Строите дерево для ДНКовых последовательностей
Посмотреть дерево можно на пример с помощью этой проги
В ней же можно root the tree
И обязательно посмотрите в базах данных что уже сделано с вашими белками.
Нет, gene family positive selection это то что вы можете закинуть в гугл чтобы статей откопать по этой теме. BLAST vs BLAT. Откройте то и другое и посмотрите.
Pryanik, 15.06.2010 23:04
Вот еще нашла сервер какой-то для анализа филогении
PhyML из всех этих програм самая хорошая, т.е. она и так хорошая, даже без сравнения.
Nastja, 16.06.2010 04:48
Да, думаю что строить деревья - это самое правильное. Довольно легко и картинки для защиты получатся.
РИГА, 16.06.2010 18:50
PRYANIK, огромное спасибо!!!!!!! Буду разбираться.
Pryanik, 16.06.2010 23:59
давайте, как построите дерево, хоть одно, пишите сюда снова, что-нибудь еще придумаем.
РИГА, 07.08.2010 20:20
(Pryanik @ 15.06.2010 22:46)
Да, это и есть семейсво, но включать оно может как гены из вашего организма, так и гены из других организмов. Hо берите группу пошире, чтобы захватить какое-нибудь близкородственное семейство, когда построите дерево, по нему будет видно сколько аут-паралогов вы включили в анализ, если несколько, то оставите одного из них, а остальных удалите, эту последовательность вы будете использовать как аутгруппу в дальнейшем.
Потом вставляете гепы в ДНКовые последовательности (только кодирующие части)
Строите дерево для ДНКовых последовательностей
Посмотреть дерево можно на пример с помощью этой проги
В ней же можно root the tree
И обязательно посмотрите в базах данных что уже сделано с вашими белками. Нет, gene family positive selection это то что вы можете закинуть в гугл чтобы статей откопать по этой теме. BLAST vs BLAT. Откройте то и другое и посмотрите.
Pryanik, благодаря Вам я уже много освоила. Однако после перелопачивания большого количества информации в Гугле и ПабМеде у меня возникло несколько вопросов: 1.Белковое выравнивание нам нужно только для того, что бы использовать его в PAL2NAL? 2.Правильно ли я поняла, что главное достоинство программы PAL2NAL –это поиск синонимических и несинонимических замен для определения движущей силы отбора? Чем она полезна еще и какие выводы для себя (помимо определения движущей силы отбора) я могу сделать? 3.Филогенетические деревья я буду строить по кодирующим областям (CDS) генов входящих в состав моего генного семейства? 4.Как по филогенетическому дереву определить сколько аут-паралогов я включила в анализ?
Pryanik, 11.08.2010 09:38
1. Да. Белковые выравнивания нужны для того чтобы с их помощью построить ДНКовые выравнивания. Если вы сделаете выравнивание ДНКовых последовательностей с помощью простой выравнивалки, то количество гепов часто не будет кратно 3м, не зависимо от того кодирующие или некодирующие последовательности вы используете.
2. Нет, главное его достоинство -- продукция ДНКового выравнивания. Если вы хотите детектировать эволюционное давление, то стоит использовать что-то более надежное и современное, т.к. pal2nal посчитает частоту синонимических и несинонимических замен только для пары пеоследовательностей. Вот хороший сервер для разных типов эволюционного анализа.
Но учтите, т.к. все популярные методы основаны на оценке частот синонимических и несинонимических замен, детектировать что-то более или менее надежно можно только на довольно близкородственных последовательностях, иначе происходит насыщение синонимических сайтов и корректно оченить частоту синонимических замен не выйдет. Но т.к. у вас мышь главный организм, то возьмете, близких родственников и будете счастливы.
3. Да, по ДНКовым выравниваниям полученым из pal2nal. Кстати, проверьте датаманки, там может можно и филогинию построить.
4. Вот пример картинки.
В данном примере рассмотрены 2 вида В и С, произошедшие от общего предка А. Паралоги -- гены разделенные дупликацией, ортологи -- гены разделенные видообразовательным процессом. инпаралоги -- паралоги появившиеся в геноме позже отпочковывания всех родственных видов, аутпаралоги -- паралоги появившмеся до отделения самого болизкородственного вида. Таким образом, гены В1 и С1 ортологи для друг друга, В2 - ортолог для С2 и С3, С2 и С3 -- инпаралоги, группы В1+С1 и В2+С2+С3 аутпаралоги друг для друга. Часто инпаралоги и ортологи будут иметь одну и ту же биологическую функциу в то время как аутпаралоги имеют разные функции, но конечно это не всегда. Надеюсь это поможет вам понять сколько аутпаралогов в вашем наборе данных. Вас аутпаралоги в конечном счете нужны чтобы понять где "корень" дерева, после этого аутпаралогов можно удалить.
РиГА, 11.08.2010 20:53
Pryanik, громадное громадное Вам спасибо!!!!!!!!!!!! Теперь все прояснилось.
РИГА, 11.08.2010 20:58
(Pryanik @ 11.08.2010 09:38)
1. Да. Если вы сделаете выравнивание ДНКовых последовательностей с помощью простой выравнивалки, то количество гепов часто не будет кратно 3м, не зависимо от того кодирующие или некодирующие последовательности вы используете.
А вот это честно признаться не поняла. А зачем количество гепов должно быть кратно 3???
Pryanik, 12.08.2010 09:30
Ок. 1 кодон это 3 нуклеотида, что соответствует 1 аминокислоте. Ваше выравнивание по идее должно отражать эволюционную историю ваших последовательностей. А т.к. ваши последовательности кодирующи и будут транслированы в аминокислоты, то любая инсерция или делеция, что в выравнивании соответствует гепам, размера не кратного трем приведет к изменению рамки считывания и совершенно отличной последовательности белка или стоп кодону.
РИГА, 13.08.2010 21:54
теперь поняла!спасибо
РИГА, 17.08.2010 20:49
Pryanik, у меня какая-то нелепая ситуация. Сделала выравнивание белковых последовательностей своего семейства (8 белковых последовательностей) в программе . В этом все нормально. Вставила выровненные последовательности и соответствующие им мРНК (из ReferenceAssembly) в соответствующие окна программы Pal2nal. А Pal2nal мне выдает следующее - Error: inconsistency between the following pep and nuc seqs. Проверяла правильность неоднократно и все равно ничего не получается. Потом сократила количество последовательностей до 4 –х и он сделал выравнивание. Все нормально. Почему Palnal2 не выравнивает большое количество последовательностей и выдает ошибку?
Pryanik, 18.08.2010 00:11
Все должно работать, какая-то последовательность у вас не правильная. Ищите какая. Добавляйте по 1 последовательности. Сделайте трансляцию днк в аминокислоты в
Guest, 18.08.2010 01:48
Ольга, извините, вопрос совершенно не в тему.... А "PVC super-phylum" - это суперсемейство поливинилхлорида? С искренним уважением.
TAOLI, 20.08.2010 11:19
Planctomycetes/Verrucomicrobia/Chlamydiae (PVC) superphylum - это надтип соответствующих таксонов Planctomycetes/Verrucomicrobia/Chlamydiae
rubelit, 20.08.2010 13:30
Ольга, прошу прощения, что влезаю не в свою ветку. А правильно я понимаю, что ГЕП - это пробел в выравнивании (соответствует делеции)? И он может состоять из разного количества символов? Например 1-й геп состоит из 9 символов, а 2-геп из 5символов? Заранее большое спасибо
Картинки: __________.JPG — (10.37)
Pryanik, 23.08.2010 02:25
Gap -- пробел, в переводе с английского, я понимаю это как символ пробела, один пробел-один геп, тогда на картинке первый индел (инсерция или делеция) 9 гепов, второй 5. На мой взгляд это не особо принципиально, пока люди понимают о чем идет речь.
И еще, то что я сказала про количество гепов кратное трем относится тольлко к кодирующим последовательностям днк, но не к белкам или некодирующей днк.
РИГА, 23.08.2010 18:10
Pryanik, все получилось! Ура! построила дерево и во всем разобралась! Еще раз спасибо! Если есть какие-нибудь мысли по поводу того, что можно еще сделать по моей теме буду рада их услышать.
Pryanik, 23.08.2010 22:56
Ок, теперь у вас есть деревья и выравнивания. Вы посмотрели [datamonkey]? Я сама им никогда не пользовалась (может там и не надо деревья, кстати, а только выравнивания), как и самим [HyPhy] пакетом, но знаю что это хорошие вещи. Посмотрите, какие типы анализа там пожно провести. Основное -- это выявление силы и направления отбора на разных ветвях дерева и сайтах выравнивания. Этот анализ основан на оценке синонимических и несинонимических замен. В теории синонимические замены не влияют на приспособленность организма, т.к. не приводят к изменению последователиности белка, а значит не "видны" для эволюции и могут служить для нормировки. В то время как несинонимические замены приводят к изменению последовательности белка и влияют на приспособленность организма, либо делая организм более приспособленным к среде либо наоборот менее приспособленным, ну и конечно могут и не влиять на фитнесс никак. В первом случае отбор удет способствовать закреплению замен (в данных вы будете наблюдать больше не синонимических замен чем синонимических), такой режим отбора называется [positive or diversifying selection]. Во втором случае отбор способствует исчезновению измененных форм белка (в данных будет больше синонимических замен несинонимических), такой режим отбора называется [negative or purifying selection]. И наконец в третьем случае отбор не влияет на выживаемость организмов несущих изменеммый вариант белка (в данных будет примерно равное количество синонимических и несинонимических замен), такой режим отбора называется [neutral selection].
Иными словами, если есть признаки [positive selection] -- значит скорее всего белок важен для какой-то НОВОЙ функции, на уровне вида (на пример гены необходимые для функций мозга эволюционировали под таким режимом на человеческой линии) или на уровне популяции (на пример гемоглобин эволюционировал [under positive selection] в мышах живущих высоко в горах). А если наоборот есть признаки [purifying selection] -- то значит что функция гена/белка консервативна во всех рассматриваемых вами организмах, так эволюционируют большинство генов ферментов на пример. И в конце концов, если вы детектируете сигнал [of neutral selection] то значит организму "все равно" какие изменения проис ходят в белке, замены в белке не изменяют приспособенность организма, так эволюционирует на пример казеин, белок молока, т.к. в принципе все равно какова последовательность белка, главное кормить потомство.
Обычно если вы смогли найти признаки [positive selection] то сайты под этим самым позитивным отбором можно прокартировать на трехмерную структуру белка (или промоделировать трехмерную структуру соответствующих белков) и посмотреть где они расположены, в активном сайте, на поверхности белок-белкового взаимодействия, как влияют на стабильность. Но это позже, сначало нужно посмотреть какие сигналы отбора вы сможете подетектировать.
Если не сможете разобраться с [datamonkey], я вам помогу, или могу прогнать [PAML], это пакет для филогенетического анализа, если вы пришлете мне деревья и ДНКовые выравнивания, или сами прогоните, не знаю правда как легко его установить и на каких системах он работает.
РИГА, 24.08.2010 22:36
Спасибо. сижу разбираюсь с datamonkey.
rubelit, 10.01.2011 23:55
(Pryanik @ 15.06.2010 23:46)
Строите дерево для ДНКовых последовательностей
Посмотреть дерево можно на пример с помощью этой проги
Ольга, а зачем смотреть деревья в phylogeny.lirmm.fr/phylo_cgi, если оно и так есть и построено в www.megasoftware.net/] ?
Pryanik, 11.01.2011 10:24
Там его красивее можно сделать, плюс это все же универсальная вещь, может у вас дерево сделано там где его вообще не посмотришь. Ссылки там для примера доступных и легко используемых прог приведены.
Это — лёгкая версия форума. Чтобы попасть на полную, щелкните здесь.