關(guān)于mega4.0建系統(tǒng)進(jìn)化樹的若干問題
?
近日學(xué)習(xí)用mega4.0建系統(tǒng)進(jìn)化樹,大概會操作了,但仍然有很多疑問。壇子里關(guān)于mega的帖子看了遍,迷茫發(fā)問的朋友多,解答的大牛人也有,我的問題和很多求助網(wǎng)友相似,現(xiàn)系統(tǒng)提出,渴望知道的大俠盡早看到此貼,指點(diǎn)下迷津,不甚感激!
一,附件中的小樹是用mega4.0,Bootsrap Value設(shè)置1000次建成。具體步驟如下:
a、打開mega軟件—Alignment 下拉—Alignment exposure/clustal—create a new alignment --然后根據(jù)實際情況(DNA or 蛋白序列)選擇Yes
b、Edit—Insert sequence from file(.fastal的格式);
c、Algin by clustal W---Data—Export Alignment—Mega fomat;
d、打開上一步保存的文件—Distance—compute pairwise—compute;
e、Phylogeny—Bootstrap Test of phylogeny—Neighbor-Joining—將Boostrap(500 replicates;seed=64238修改為1000 replicates)--compute---獲得進(jìn)化樹—設(shè)好格式---image –save as TIF file
問題來了,在壇子里看見各位大俠給出的步驟,要用Clustal X軟件進(jìn)行序列比對之后才能建樹,請問,mega4.0中是不是嵌合了clustal么,為什么有大俠說還要下載一個clustal軟件呢?上面的建樹步驟C是不是算經(jīng)過了clustal呢?
二,附件中小樹節(jié)點(diǎn)處數(shù)值的含義,請各位解釋下為什么HX4和AB546196.1(bootstrap值100)與HX6和AJ308316.1(bootstrap值77)兩類群聚一起后又97呢?是否意味著HX4和AB546196.1親緣關(guān)系很近,甚至是同一個東西,HX6和AJ308316.1關(guān)系較近,這兩類群又聚一起,而且bootstrap值97,大于77,很費(fèi)解呀很費(fèi)解。
三,樹下的標(biāo)尺有什么用?去算枝長嗎?枝長又代表什么,進(jìn)化距離嗎?如果枝長是進(jìn)化距離,那bootstrap值又代表什么?
四,在壇子里逛的時候,看到有大俠說“遺傳標(biāo)度法和步長值法是用來表示兩種不同的結(jié)果時用的 步長值常用在鑒定菌種的進(jìn)化樹中 而遺傳距離法常用在表示不同菌株間進(jìn)化關(guān)系的進(jìn)化樹中 ”。什么是遺傳標(biāo)度法,什么是步長值法?本人建樹目的是想得到菌株間的進(jìn)化關(guān)系
五,看文獻(xiàn)過程中,發(fā)現(xiàn)有部分文獻(xiàn)的進(jìn)化樹要么只有標(biāo)尺,要么只有bootstrap值,而且也沒有對數(shù)值,標(biāo)尺的含義做出解釋,究竟什么樣的樹才算規(guī)范?
昨晚碼了一個求助貼,滿懷希望發(fā)的時候,系統(tǒng)維護(hù),傷啊傷!今天抖擻一下,再次情緒飽滿的發(fā)一個,敬候各位的佳音哈!

?
1、clustalx 也是為了alignment,如果在MEGA里面alignment了,就不用clustalx了;
2、bootstrap值一般是將你的序列保留一部分,把剩下部分隨機(jī)打亂,拼成不同的序列,組成1000個你的alignment文件,做樹,顯示的77表明,1000次做樹的過程有有77%次,也就是770次得到HX6和AJ308316.1聚在一起這個結(jié)果;
3、下面的標(biāo)尺是枝長,也是進(jìn)化距離,bootstrap值是可信度;
4、這個我水平有限,也比較迷惑,個人覺得你現(xiàn)在做成的樹適合的進(jìn)化研究;
5、一般是要有bootstrap值的,這個表示可信度,要是值低于50,一般別人是不認(rèn)同的,有的文章沒有標(biāo)尺,可能是只想得到樹的分枝情況,沒有想要計算各個物種的距離,只要得到的一個樹的拓?fù)浣Y(jié)果吧,但是bootstrap值一般是要的。
對了,你的alignment,排列好了之后,一般要將首尾序列截成一樣齊……
只是個人意見,可能有偏差,有錯誤歡迎指出。
1、為什么標(biāo)尺有時候是1,2,有時候是0.05,0.02?如何設(shè)置標(biāo)尺大小?
2、標(biāo)尺用來算遺傳距離,具體怎么算呢(比如,在附件的圖中HX4與AB546196這一群和HX6與AJ308316這一群的距離看哪根樹枝呢?或者不相鄰的,再遠(yuǎn)一點(diǎn)兒的類群要看它們之間的進(jìn)化距離怎么看呢?)
或者phylip軟件里面的dnadist,我覺得如果不是做進(jìn)化之類的分析的話,一個diversity distance 就可以吧,mage里面好像就有
不過個人感覺有時候截不截影響不是太大
剛試了個一百多個數(shù)據(jù)的比對 有不齊的 和剪切后的
兩種的樹做出來一樣
不過我是做的蛋白樹 不知道金銀的會怎樣=。=
我覺得貌似BOOTSTRAP值這個可信度是不是有待商榷
我做的時候跟老板商量的據(jù)說是75以下的都容易變
這個變是只插入或刪除別的序列后容易擺動
所以具體這個數(shù)值是多少我也沒查文獻(xiàn)
看很多人說50 我覺得對此還是根據(jù)自己不同情況分析以下比較好
bootstrap值低于50確定是不可信的,但高于50只能說針對當(dāng)前數(shù)據(jù),在bootstrap方法檢驗下,是高于一半的支持率的,這個值當(dāng)然越高越好,你選擇不同數(shù)據(jù),不同模型,bootstrap值一般都會有變化的,bootstrap值為100%也只能說是兩個序列聚在一起的概率非常大,是個推測值,也不能絕對說他們就是一類的,我個人覺得就是一個統(tǒng)計分析結(jié)果,低于50%一般是不可信,高于50%可信度就高一點(diǎn)而已……
我還做了一個別的實驗
發(fā)現(xiàn)有些東西剪切掉了對樹是有非常大的影響的 比如說一些LINKER
關(guān)于BOOSTRAP值 我明白你意思 我的意思不是問這個變化怎樣 我的意思是這個值是不是應(yīng)該調(diào)到75=。=b
那不同的物種序列長度肯定是有差異的做作樹時,軟件會自己處理這些長度差異的問題吧!
今年剛接觸分子系統(tǒng)學(xué),當(dāng)時老師上課時說序列不用截齊!