Claident

2023 年 7 月 10 日 改訂

Claident は、環境 DNA データを解析するソフトウェアです。NGS データのアセンブルから、種判別までを行います。

Claident の概要はこちらの動画、5:30 から。Claident を動かすには、このプログラムの他に、BLASTDB, TaxonomyDB, UCHIMEDBが必要です。Mac には対応していないみたいです (2021 年 2 月)。


リンク

入門者の Linux

ターミナル作業や R での解析について。

R を始めよう 生命科学のための RStudio 入門 (羊土社)

R での解析

メタバーコーディング法概説

1:07:08 から Taxonomic assignment について解説。BLAST + Lowest Common Ancestor (strict consensus) algorithm (MEGAN というプログラムで最初に実装された) などについて。
LCA は multiple sequence alignment が不要なので、計算が速く、系統樹が不要である。あらゆる生物のあらゆる遺伝子座に利用可能。ただ、Blast の上位をいくつ取れば良いかは、自分で決めないとならない。

ClaidentとRによる環境DNAメタバーコーディング分析講座

ClaidentTutorial にある例題 (MiFish 配列) の操作方法。Taxonomic assignment は 1:09:10 から。Assignment は「Query-centric auto-k-nearest neighbor method」(1:13:08) (田辺さん作) を利用。最終的に得られる OTU-種名-リード数 を示すテーブルは 1:33:16。その後、R による群集組成の解析など (1:45:20)。

このチュートリアルでは、「典型的な方法で調製したライブラリをIllumina社製シーケンサで解読した塩基配列データを仮定して、Claidentを用いて群集組成データと分子同定データにするまで、およびRを用いて生態学的な分析を行うまで」が紹介されています。

Claident の出力ファイルは、その後 R を用いた様々な解析に対応しています。R 解析のコードも公開されています。R の解析で必要なパッケージは、以下のコマンドでインストール可能です。

library(parallel)
install.packages(c("vegan", "colorspace", "RColorBrewer", "tidyverse", "ggsci", "khroma", "picante", "bipartite", "geosphere", "foreach", "doParallel", "mpmcorrelogram"), repos="http://cloud.r-project.org/", dependencies=T, clean=T, Ncpus=detectCores())