MUSCLE

2009 年 5 月 2 日 改訂
井上 潤

MUSCLE はアライメントを行うソフトウェアです.input file と output の両方が fasta 形式なので OTU 名が変更されたりせず,しかも非常に高速です.Unix のためコマンドラインになれない人は使いにくいかも知れませんが,Mac でも Win でも動かすことが可能です.Web 版のマニュアルはこちらです.

インストール
Mac の場合でもコンパイル不要です (Version 3.6).ダウンロードしてそのまま使うことができます.

使い方
ダウンロードしたフォルダから「muscle」というアプリケーションを解析を行うフォルダにコピー & ペーストします.ターミナルで解析を行うフォルダに入って,以下のコマンドをうってください.ここでは seqs.fa という名前の fasta 形式の infile をあらかじめ作成しています (例題は配布されていないようです).「-stable」を入れることで,infile の OTU 順序のまま outfile が作成されます.デフォルトでは,配列の類似度によって outfile の OTU 順序が並び替えられてしまいます.

muscle -in seqs.fa -out seqs.afa -stable

気づいた点
  • 200 種,630 残基のアミノ酸配列を Intel Mac でアライメントを行ったところ,50 秒で解析が終わりました.200 種 100 塩基のアミノ酸配列は 2 分 30 秒かかりました.これらの解析はデフォルトの設定で行っていますが,より高速に解析するオプションもあるようです.

  • Mac で解析を行う場合は,Infile の改行コードを Unix にする必要があります.改行コードがおかしいと,error message が出ます.