EMBLデータファイルの読み方

ここではEMBLのV01515を例として内容を解説する。 ID行には配列のデータベース的な名称が記述される。この配列はHSGLUCという名称で、6455残基の長さを持つヒトのDNAである。 何も記述のない行の先頭はXXで始まる。この行は各項目の区切りを示す。 アクセッション番号はV01515である。この番号はGenBank, EMBL, DDBJを通じて固有である。 新しい番号はg31777である。 この配列は最初1983年12月6日に報告され、1993年9月12日に最後の修正がなされた。 DE行にはこの配列についてのコメントが示されている。この配列の場合は、 "プレプログルカゴンをコードしているヒトの遺伝子である。グルカゴンは29残基のアミノ酸からなる膵臓のホルモンであり、インスリンと競合して血中グルコース濃度を調節している。プログルカゴンの配列は2つの部分(GLP-1とGLP-2)からなっており、どちらもグルカゴンであるが同じではない。" と記述されている。 キーワードはglucagonとsignal peptideである。 このDNAはヒトから単離された。 ヒトは真核生物の・・・ヒトに分類される。 リファレンスを示している。 この配列はリリース3.0のCPGISLEと同じであり、SWISS_PROTのP01275が関連情報を含んでいる。 このデータはG.I.Bellによって確認された。 この配列が単離された生物はヒトである。 168〜259、1832〜1993、3661〜3798、5168〜5312残基がコーディング領域であり、これらを結合した配列の翻訳したものが示されている。 168〜227残基がシグナルペプチドの部分である。 260〜1831残基がイントロンIである。 1896〜1982残基がコーディング領域でありプロダクトはglucagonである。 1994〜3660残基がイントロンIIである。 3680〜3790残基がGLP-Iをコードしている。 3799〜5167残基がイントロンIIIである。 5211〜5315残基がGLP-2をコードしている。 この配列は6455の残基からなり、2167個のアデニン、1107個のシトシン、1121個のグアニン、2060個のチミンからできている。 具体的な配列は上記のとおりである。 各々のデータは "//" で終了する。
農業生物資源研究所 遺伝資源第二部 前田美紀
(1997.8.21 by mmaeda)