Orthofinder

 
2018 年 11 月 9 日 改訂
井上 潤

Orthofinder (Lab, githab) はオーソログを推定するプログラムです.配列類似性 all-in-all 比較の結果を用いた MCL 解析によるグルーピングから,オーソログをオーソグループ (orthogroup) として推定します.

解析手順は,1) オーソグループの推定,2) rooting された種系統樹と遺伝子系統樹の推定,3) オーソログと遺伝子重複イベントの推定,からなります (Emms and Kelly, 2018, bioRxiv, P2中).


Orthogroup

定義
マニュアルに詳しいです.発表論文における OrthoFinder 作者らによる定義は,以下です (Emms and Kelly, 2015, P1右中).

an orthogroup is the set of genes that are descended from a single gene in the last common ancestor of all the species being considered.

[訳] オーソグループとは,解析に用いたすべての種の last common ancestor がもっていた,ある一つの遺伝子から派生した遺伝子の集合である.

オーソグループはオーソログを判定する唯一の方法

マニュアルにある詳しいオーソログの説明でも重要なのが,"Why Orthogroups: Orthogroups are the only way to identify orthologs" の部分です.オーソロジーは遺伝子系統樹によって推定するもので,配列類似性は予想にすぎない,と明記されています.しかし著者らは,遺伝子系統樹を用いたゲノムワードなオーソログ推定の方法は不可能 (Emms and Kelly 2018, P1下) と考えています.このため,オーソグループ (オーソログではない) の推定は all-by-all 配列類似性検索によって行います.オーソログ推定には,選定されたオーソグループのメンバーを用いて遺伝子系統樹を推定する方法が,オプションとしていついています.


必要な他のプログラム

以下は,マニュアルなどで推奨されているプログラムです.しかし,Orthofinder は,オプション機能を用いて,他の解析ソフトを利用することが可能です.

類似性検索 all-in-all

BLAST+ がデフォルトです.BLAST よりも速い Diamond も利用可能です.

MCL 解析

MCL. ダウンロードはこちらから.私は mcl-latest.tar.gz (2014-05-17 00:20 2.9M ) を使いました.

系統樹推定

FastME

種系統樹との比較

DLCpar.README.md によると,version 2.0 以降は使われていないようです.


同じ研究室に所属する A.A. さんに教えていただきました.ありがとうございました.