ダウンロードして得られた GBFV01.1.fsa_nt ファイルを TransDecoder-TransDecoder-v5.3.0 ディレクトリにコピーします.その後ターミナルから TransDecoder-TransDecoder-v5.3.0 ディレクトリに入り,
./TransDecoder.LongOrfs -t GBFV01.1.fsa_nt
と入力してください.解析は数分で終了します.アウトファイルとして,GBKV01.1.fsa_nt.transdecoder_dir ディレクトリに翻訳済みのアミノ酸配列 (longest_orfs.pep) と,これに対応するするコーディング配列 (longest_orfs.cds) が出力されます.
注意: TransDecoder-TransDecoder-v5.3.0 ディレクトリを保存する場所によっては、以下のようなエラーが出ることがあります。macOS Ventura 13.2.1 では、デスクトップ、ダウンロードで解析が動きませんでした。この場合は、ディレクトリをホームディレクトリなどに移動して試してください (2023 年 8 月)。
[inouejun:TransDecoder-TransDecoder-v5.7.1]$ ./TransDecoder.LongOrfs -t GBFV01.1.fsa_nt
-- Skipping CMD: /Users/inouejun/Dropbox/My Mac (rrcs-172-254-99-49.nyc.biz.rr.com)/Desktop/TransDecoder-TransDecoder-v5.7.1/util/compute_base_probs.pl GBFV01.1.fsa_nt 0 > /Users/inouejun/Dropbox/My Mac (rrcs-172-254-99-49.nyc.biz.rr.com)/Desktop/TransDecoder-TransDecoder-v5.7.1/GBFV01.1.fsa_nt.transdecoder_dir/base_freqs.dat, checkpoint [/Users/inouejun/Dropbox/My Mac (rrcs-172-254-99-49.nyc.biz.rr.com)/Desktop/TransDecoder-TransDecoder-v5.7.1/GBFV01.1.fsa_nt.transdecoder_dir/__checkpoints_longorfs/base_freqs_file.ok] exists.
-skipping long orf extraction, already completed earlier as per checkpoint: /Users/inouejun/Dropbox/My Mac (rrcs-172-254-99-49.nyc.biz.rr.com)/Desktop/TransDecoder-TransDecoder-v5.7.1/GBFV01.1.fsa_nt.transdecoder_dir/__checkpoints_longorfs/TD.longorfs.ok
[inouejun:TransDecoder-TransDecoder-v5.7.1]$
BLAST+ で類似配列を収集する
ブラスト検索によって,あるアミノ酸配列に類似した配列のセット (アミノ酸と cDNA 配列) を収集します.GBFV01.1.fsa_nt.transdecoder_dir ディレクトリで以下の操作をターミナルで行います.
データベース化:
makeblastdb -in longest_orfs.pep -dbtype prot -parse_seqids
makeblastdb -in longest_orfs.cds -dbtype nucl -parse_seqids
Blast検索:
アミノ酸配列データベースを検索.
blastp -query query.txt -db longest_orfs.pep -num_alignments 10 -evalue 1e-12 -out 010_out.txt
Blast hit した配列の収集:
アミノ酸配列と共通した ID を使って,cDNA 配列を取得.
blastdbcmd -db longest_orfs.cds -dbtype nucl -entry_batch queryIDs.txt -out 020_out.txt
|