InterPro は、タンパク質の「基地の機能的・進化的要素(ドメインやモチーフ)」をまとめた統合データベースです。比較ゲノミクスやゲノム注釈で非常によく使われます。以下のような複数のゆめいなドメイン/もチーム DB を統合しています。
Pfam(HMMベースのタンパク質ドメイン) CDD(NCBI Conserved Domain Database) SMART PROSITE SUPERFAMILY など
EMBL-EBI が運営しています。
ゲノム解析での使い方
1. 予測タンパク質配列を用意
2. InterProScan をかける
3. 既知の InterPro domain がヒットする場合は、少なくともどんな種類のタンパク質かわかります。ヒットしなければ、現在の知識では機能がわからないです。