MMseq2

2026 年 6 月 5 日 改訂

MMseq2、高速な BLAST 検索ツールです。データベースは、アミノ酸配列だけを対象としており、DNA 配列は解析できません (2024 年 3 月)。



インストール

conda install -c bioconda mmseqs2

例題: BLAST+ との比較

MMseq2_vs_blastn10.zip

MMseqs2はBLASTNの約46倍速く、感度も同等以上でした。

純粋な速度比較

まず以下を走らせて、それぞれデータベース化を一度行いました。

./000command_blastn_vs_mmseqs.py

以下が 1 回目の出力です。データベース化で MMseqs は時間を取られています (mmseqs_dbが新たに作成されます)。

==== Summary ====
BLASTN: 2.87 sec
MMseqs2: 8.78 sec
Speed ratio (BLASTN/MMseqs2): 0.3x

続いて、mmseqs と blastn2.10.0 の比較です。

./000command_blastn_vs_mmseqs.py

==== Summary ====
BLASTN: 2.8 sec
MMseqs2: 0.06 sec
Speed ratio (BLASTN/MMseqs2): 46.7x

MMseqs2はBLASTN v2.10.0より約 47 倍速いという結果になりました。
ただし、以下注意点です。

1. クエリが20配列と少ない
今回は query.fasta の20配列での比較です。クエリが増えるほどMMseqs2の優位性がさらに顕著になる可能性があります。
2. MMseqs2の検索結果の質
速さは明らかですが、BLASTNと同等のヒットが得られているかも確認が必要です。以下で比較しました。

質の比較

ヒット数比較:

BLASTN: grep -c "^>" → 100ヒット
MMseqs2: 151行 → 151ヒット

MMseqs2の方がヒット数が多いのは、--max-seqs 5 と指定したにもかかわらず、クエリによっては5件以上返っているようです。
結果の内容を見ると、MMseqs2は魚類・哺乳類・昆虫・菌類など多様な生物のヒットを返しており、BLASTNと同等かそれ以上の感度があることがわかります。

(2026 年 6 月)

引用するなら以下の論文
Steinegger M & Söding J. "MMseqs2 enables sensitive protein sequence searching for the analysis of massive data sets." Nature Biotechnology 35, 1026–1028 (2017).