一般的な使い方
mafft infile > outfile
アライメント済みのデータセットに新たな配列を加える
詳しくはこちらをご覧ください.
mafft --add new_sequences --reorder existing_alignment > output
mafft --addfragments fragments --reorder --thread -1 existing_alignment > output
オプション
mafft --adjustdirection input > output
Reverse and complement を考慮。こちらを参照。
mafft --auto --treein NumTree.mafft --treeout infile > outfile
-- mafft auto
このオプションは小規模テータを丁寧に,大規模データはそれなりに計算するそうです.もしメモリサイズなどに余裕がある場合は,linsi や ginsi を試すこともできます.以下のコラムをご覧下さい.
[2009 年 10 月].
--treein
NumTree.mafft をこちらに従って作成します.Newick 形式の tree は,OTU を番号に置き換える必要があります.sequence file の一番目の OTU を 1,2 番目の OTU を 2 にします.系統樹は樹長付きである必要があるようです.そして,ruby を使って,tree file を mafft の形式に置き換えます.
ruby newick2mafft.rb NumTree > NumTree.mafft
newick フォーマットの tree は,最後にセミコロンがついていても,問題なく変換されました.例題を参照してください.
* 作者の加藤さんに伺ったところ,user tree オプションはまだ問題があるかもしれない,ということでした [2009 年 10 月].
--treeout
output として得られるアライメントの OTU の順番が,系統樹に基づいた並びになります.私はうまく使うことができなかったので (.tree というファイルができました),perl script で後から並べ直しています.
例題: mafft 形式の user tree を作成
樹長付きの newick 形式 tree があれば,perl script を使って tree 内部の名前を番号に変更できます.
ReplaceList.pl という検索置換リストを作成します.sequence file の最初の OTU を 1 として番号を付けます.
perl OTUreplaceListMaker.pl infile
上で作成した ReplaceList.pl を使って tree の OTU 名を番号に置き換えます.
perl -p ReplaceList.pl tree > NumTree
mafft の HP に従って,ruby を使って tree を mafft の形式にします.
ruby newick2mafft.rb NumTree > NumTree.mafft
linsi と ginsi オプションを使う
mafft-linsi --treein tree.mafft input > output
によって,常に丁寧な計算をさせることもできるそうです.
また,入力配列の全長にわたってホモロジーがあると仮定できるときは,
mafft-ginsi --ep 0.123 --treein tree.mafft input > output
の方が,少しだけよい結果を与えるそうです.
加藤さんに伺ったところ,哺乳類のタンパク質転写遺伝子のアミノ酸配列をアライメントする場合は,ginsi で問題ないそうです.ただ,真核生物全体を含むようなアライメントでは,ドメイン構造の変化などややこしい問題がありそうなので,ginsi が良いかどうかわからないそうです [2009 年 10 月].
これらは通常の方法とは多少異なるコンパイル (コマンド?) が必要です
(この問題は解決されたようです.非ルートアカウントで MAFFT をインストールする方法がこちらに書かれているそうです).
私の場合は研究室のクラスターで使いたかったので,non-root user としてインストールしました.こちらに従って Makefile の一行目を
PREFIX = /d/home7/jun/mafft-6.714_MyFile
に書き換えました.この場合,あらかじめルートディレクトリに「mafft-6.714_MyFile」というフォルダを作成しておく必要があります.すると,core, bin, man というフォルダが mafft-6.714_MyFile 内部に作成されます.その後,bin のなかに mafft や mafft-ginsi が作成されています.mafft-ginsi は通常のアプリケーションとは異なるようです.エイリアスでしょうか? 解析時には,
~/mafft-6.714_MyFile/bin/mafft-ginsi --ep 0.123 --treein Tree.mafft infile > Outfile_ginsi
|