dbCNS: 例題集

25 Sep. 2023
dbCNS (DataBase of Conserved Non-Coding Sequence) を使い方を示した例題集です。

SNP を含む配列の多重アライメントを作成する

ヒト 7 番染色体 156791771 のサイトが G から A/C に変化すると、多趾症を起こすことが知られています (rs606231146)。このサイトは、SHH を調節する ZRS エンハンサーに含まれています。この SNP を含む配列を作成し,これをクエリ配列として用いて,種間アライメントを作成してみましょう.


 

(A2) Sequence extractionで Human (GRCh38/hg38) を選択します。窓に以下を入力し、Mode (A) SUBMIT を押します。

7:156791771>G

この SNP (rs606231146) は, ヒトの疾患,Polydactyly, preaxial II に関係することが知られていま.この座標は VanderMeer and Ahituv (2011) に基づいています.この論文では,hg19 での座標である chr7:156,584,465 が報告されているので (Table 1),この座標を UCSC が提供する Lift Genome Annotations を用いてGRCh38/hg38 に置き換えて上記の座標を得ています.

Finished に続くリンクを押すことで,以下の結果を得ます.


dbCNS は,SNP と前後 100bp からなる配列を GRCh38 (hg38) から取り出します.配列を変更した SNP 部分は小文字で示され、赤でハイライトされます。SNP を含む配列の Fasta format をコピーします (以下).

>Homo-sapiens_GRCh38_7-156791671-156791871
AAGGAAGTTACCTAAAATTTTGTACTTTTTGCTTTTATTATCAGGCACTTTGTTTGAAGTTATAGGAGTT
AACCTCTTAATCCTACAGACCGTGTGCTACgCTCTGGCCATTCAGGGATGTCTGGATGGTTTGGATAATT
GGTCAGGATGTTGCTTATGTTACCTTTTATGCTATGACTTCAAATCAAACATAGGCATTAA


(A2) Sequence extraction で得た配列を (B) Balst & alignment モードの窓 (赤枠) にペーストします。SUBMIT を押して、以下の結果を得ます。

(B) Balst & alignment モードの結果です。アライメント内部に、小文字で示した SNP が赤でハイライトされています。Human_SNP_in_dbSNP には、blast hit した Human 配列のコーディネートが示されており,この範囲に含まれる SNP を NCBI が提供する SNP データベースである dbSNP で表示します。この例では、実際に rs606231146 が座標の範囲に含まれていることが、dbSNP の結果から確認できます。
 
ZRS 領域をヘビとヒトで比較

種間アライメントを作成することで,ヘビ ZRS 領域の欠失 (Kvon et al. 2016) を確認します.アライメントにはヒトとヘビが含まれており,両者の該当配列は大きく異なっています.そこで,複数のクエリ配列 (以下) を用いて,類似配列を BLAST 検索します.

以下の配列を用いて解析を行います.

>Human
TAATAAAAGCAAAAAGTACAAAATTTTAGGTAACTTCCTTTCTTAATTAATTGGACTGACCAGGTGGAAG
CGAAGAGTTCTGTG

今回は,1000 bp 近く離れたクエリ配列をつかいうので (Fig. S1 in Kvon et al (2016),dbCNS で解析を行う際に「5'/3' flanking regions (bp)」を 1000 に設定します.

実際に得られた配列結果には,ヒト疾患である Triphalangeal thumb や Polydactyly に関連した SNP (rs587779752 など) が存在することがわかります.結果として得られる Human SNP in dbSNP: に表示されるリンクを押すことで,その情報が得られます.


ネコゲノムに存在すると考えられる CNS を集める

ネコゲノムに存在する CNS は、推定されていません。そこで、ネコの近縁種であるイヌとウマのゲノムで推定された CNS を出来るだけ多く集めます

CNS DB をクリックします。

dbCNS では,イヌとウマで共有される CNS (126,218 配列) が保存されています。「2 Click」 で、右クリック (Mac はオプションを押しながらクリック) するとファイルがダウンロードされます (以下)。データーベースでは,CNS 配列は fasta 形式で保存されています.Fasta 形式の name line は,CNS 配列が存在するゲノムデータのバージョンや座標,発表された論文などが表示されています.

ここで示した CNS 配列のオリジナルデータは,ANCORA で BLAST 検索によって判定・公開されたものです。

得られた配列が、実際にネコとその近縁種のゲノムに存在するか、確かめてみましょう.
これまでのステップで得られた配列の一つである以下をコピーしてください.

>Canis-familiaris_DogHorse_canFam3_1-76838958-76839013_ANCORA
ATTGCTGTACTAATGATACTTGGCATTGAGTTTAATAAAGGTGACTGGATAACAG



コピーした配列を (B) Blast & alignment にあるウィンドウに貼り付け,解析します。

以下が結果です。


イトヨ Fads2 遺伝子周辺の CNS を集める

タンパク質遺伝子同様,CNS も研究の進んだ生物で情報が蓄積されています.FADS2 遺伝子に関与する CNS をイトヨから得たいのですが,CNS は、イトヨよりモデル生物として研究が進んでいるゼブラフィッシュの方が多く判定されています.そこで,dbCNS に格納されているゼブラフィッシュ Fads2 近くに位置する CNS 配列を探して,この配列をクエリとして BLAST 検索を行なって,イトヨの該当配列を得ます.

(A2) Sequence extraction のテキストボックスに 「FADS2」 と入力します.


得られた配列が、実際にゼブラフィッシュとその近縁種のゲノムに存在するか、一つづつクエリ配列とて dbCNS の Blast & alignment 解析を行い,確かめます.
 上記で得られた配列の一つ (以下) をコピーして 、(2)Blast search & alignment のテキストボックスに貼り付け,解析を行います。

>Danio-rerio_ZebrafishStickeback_danRer10_25-4033965-4034145_FADS2_ANCORA
AGTGCTCCTCAAGATGGAGCACTTGGAGATTCTGGACATGGATCGCAATCGGATATCAGAGTTCCCGAAC
TTGCATCATCTTCCAGCATTGCGCCTTTTCTCCTACGACCACAACCCTGTGAAGGAGCCGCCACGTGTAG
GGGAGGAGGTGTTGATTGTTGGGGAGGGAGCCGAGGAGGT


以下の結果が得られます.ここでは、出力されたコーディネートをクリックして、実際にイトヨゲノムで Fads2 近傍の CNS が得られたか確認しています。

 

jun.inoueATg.ecc.u-tokyo.ac.jp