概説

phyloBARCODER は、系統樹を推定することでメタバーコーディング DNA 配列を種判定するウェブツールです。Version1 のデータベースには、真核生物ミトコンドリアゲノムにコードされている全ての遺伝子配列が格納されています。 ユーザーは、
  1. 多重アライメントと系統樹を作成できます。
  2. 環境 DNA やメタバーコーディングサンプルから得られた配列一群 (ここでは anonymous 配列と呼びます) をアップロードして解析します。ただし、全ての配列の種名を一気に種判定するわけではありません。
  3. クエリ配列の種名を判定し、クエリ配列と同時にアップロードした anonymous 配列の一群から、同じ種あるいはグループに属する配列を選定できます。
  4. ユーザー独自のデータベースも用いることができます。例えば、ある地域から得られた参照配列や、核や葉緑体ゲノムの参照配列から作成したデータベースもアップロードして利用できます。


系統樹を用いた種判定が有益な例: クエリ配列と参照配列を比較した際に、phyloBARCODER は同じ BLAST identity を持つ配列の間で、より近い配列を選定することがあります(result674_Tree_vs_similarity.zip)。

(A) Species Identification

ここでは、anonymous 配列の例として、12S rRNA 環境 DNA 配列をアップロードして用います。 Yu et al. (2022) は、MiFish プライマーを用いてこれらの配列を解読しています。
ユーザーは、Fish 12S と書かれたリンクから、これら anonymous (種名のわからない) 環境 DNA 配列を、テキストボックスにコピー&ペースします。二つの OTU を同時に種判定するために、Number of queriesFist 2 sequences にセットします。

Number of queries: このボックスは、「First 10 sequences」 (fasta 配列トップに記載した10 配列) を最大としています。「First 2 sequences」を選んだ場合、BLAST search ではこれら 2 つの配列だけが用いられます。しかし、2 クエリ配列を含んだ全ての anonymous 配列が、「Anonymous DB」に変換されます。このため、fist 2 sequences と類似した、アップロードした anonymous 配列は、その後作成される多重配列に含まれます。残りの、anonymous 配列 (BLAST で選ばれなかった) は、アライメントに含まれません。

-num_alignments-evalue オプション:アライメントに含まれる配列数を調節することで、より正確な種判定を可能にします。
Anonymous DB では、これらの数値は、BLAST hits の数を増加または減少させることで、クエリ配列と同じグループに属する anonymous 配列を明らかにします。
Species DB (Pre-installe DB) では、系統樹内部で、注目する種あるいはグループ判定のために用いる適切なルート配列を選定します。Haplotype DB では、同じ種から得られた異なる参照配列 (haplotypes) を加えることで、種、グループあるいは集団の境界を鮮明にします。
User DB では、このデータベースからアライメントに加える配列数を増減します。もし -num_alignments を 0 にすれば、そのデータベースは利用されません。

結果は、Status > Finished の隣にあるリンクを押すことで得られます

ユーザーは、得られた系統樹を直接目でみて、種判定を確認する必要があります。

種判別の確認に、アライメントも利用できます。

phyloBARCODER は、ユーザーが設定したクエリ配列の種判定結果を種リストとして産出します。種と分類は、Pre-installed DB から得られたBLAST hits* から作成され、taxon_assignment_tree.csv ファイルに保存されます。上の例では、OTU_6 の種名は、Scomber japonicus だけでなく S. australasicusS. colias も候補として挙げられています。より種名を絞るには、それぞれの種の分布を考える必要があります。
*User DB (ユーザーが独自に作成した参照配列) から得られた BLAST hits からは、種名は作成されません。

Example: Fish ASV analysis
Anonymous sequences
KS1815-B06-0m_ASV.fasta.txt
Raw data
KS1815-B06-0m_S50_R1_001.fastq.gz
 
KS1815-B06-0m_S50_R2_001.fastq.gz
 
(Yu et al. 2021)
Example: Copepod analysis
Reference sequence
Metridia_pacifica_lucens_MZGdb_Selected.txt
 
(MetaZooGene Atlas & Database, 11 Oct 2023)

(B) Sequence Extraction

Scomber 属で、12S rRNA 遺伝子の参照配列の登録がある種を数えます。
以下のパラメータを入力あるいは選んでください:
Pre-installed DB
Species
Gene
12S (srRNA)
Classification
Scomber

Scomber 12S rRNA 配列は、これまで知られている Scomber 属全 4 種について登録されていました。このことは、Scomber 属の参照配列がないために、種査定がおかしくなる可能性が少ないことを意味しています。

Citation

Inoue J. et al. phyloBARCODER: A web tool for phylogenetic classification of eukaryote metabarcodes using custom reference databases. Molecular Biology and Evolution, in press. doi: 10.1093/molbev/msae111.

利用しているソフトウェア

Similarity search
BLAST+ (blastn 2.7.1)
Alignment
MAFFT v7.490; trimAl 1.2rev59
Tree search
ape in R, Version 5.6.2
Pre-installed database
MIDORI2 longest (species) and uniq (haplotype)