MEGA

 
2021 年 10 月 13 日 改訂
井上 潤
MEGA は,配列のエディット,アライメント,系統関係や時間軸付き系統樹の推定,などを行うソフトウェアです.

BS 値付き NJ tree を推定する

ここでは,Mac のコマンドライン (CC) バージョンを説明します.スライドによる説明も参考にしてください.Documentation はこちらです.

megaNjBoot.tar.gz

megacc -a 010infer_NJ_protein.mao -d 010aaseq.fas -o 020_out

010infer_NJ_protein.mao

解析の設定が書かれています.megaproto で作成します.実際には,エディタでブートストラップ (BS) 計算の回数などを書き換えます.megaproto はmegacc をインストールすると自動的にインストールされます.

010aaseq.fas

ファスタ形式のアミノ酸配列.拡張子は fas でないと,動きません.

020_out

アウトファイルの名前

020_out.nwk

アウトファイル.Newick format です.

まだ充分に確かめたわけではありませんが,NJ 解析ではアウトグループを設定できないようです.おそらく,解析を行った後で,rooting を改めてやることになると思います.また,アミノ酸解析の経験的モデルは, JTT しか対応していません.


年代推定
Mega 7 を使って説明します.mega_reltime_example.tar.gz をダウンロードしてください.Mega 11 でもこの例題を解くことができました。MEGA7 より Mac で操作しやすくなっていました (2021 年 10 月)。


=> Data > Open A File/Session から,Vertebrate6.fas

を選んでください.fasta 形式だと,アライメントファイルの読み込みがスムーズです.Phylip 形式だと,面倒です.その後,以下のように選んでください.

"How would you like to open this fasta file"
=> Analyze
=>Nucleotide Sequences
=> OK

"Protein-coding nucleotide sequence data>"
=> No



=> Clocks > Compute Timetree (ML)

Would you like to use the currently active data (Vertebrate6.fas)?
=> Yes




Step 1: Load Seqence Data
すでに選んだので,何もやらなくて良いです.

Step 2: Load Tree File
Browse..
=> Vertebrate6.tre




Step 3: Specify Outgroup
Select Branch...
=>
Please confirm: ....
=> Yes


Step 4: Specify Calibrations
Add Constraints...
上記の制約を,以下の画面を参考に入力してください.
上記の制約は Calibrations Export ファイルに入っています.
File > Import Calibration Data からこのファイルを選ぶことができます.


Setp5: Choose Analysis Settings
Set Options...


最後に,Execute を押して,解析を走らせます.



以下のような結果が得られるはずです.

こちら「RelTime による分岐時間推定」を参照しました.
2019 年 7 月.


推定された時間軸付き系統樹や時間制約、解析設定の要約などを保存できます。以下の画面は MEGA11 です。

 

なお、各分岐に推定された年代は、私の場合、Newick format を FigTree で開き、Node Labels > Display: Node ages で得ています (2021 年 10 月)。

 

系統樹の描画

こちらのビデオが参考になります.

 

参考文献

Mello B, Tao Q, Tamura K, & Kumar S (2017)
Fast and Accurate Estimates of Divergence Times from Big Data. Mol. Biol. Evol. 34(1):45-50.

ベイズ法によらない分岐年代推定 RelTime は,解析速度が速いが,MCMCTREE や BEAST と同じ結果が得られることを示す.ミトコンドリアゲノムは核ゲノムデータなど 8 つの大規模データを使用.