FAM214A

FAM214A
識別子
エイリアスFAM214A、KIAA1370、配列類似性214のメンバーAを持つファミリー
外部IDMGI : 2387648 ; HomoloGene : 35065 ; GeneCards : FAM214A ; OMA : FAM214A - オルソログ
オルソログ
人間ねずみ
エントレズ
アンサンブル
ユニプロット
RefSeq (mRNA)

NM_001286495 NM_019600

NM_001113283 NM_153584 NM_001359816

RefSeq(タンパク質)

NP_001273424 NP_062546

NP_001106754 NP_705812 NP_001346745

場所(UCSC)15章: 52.58 – 52.71 Mb9章: 74.86 – 74.94 Mb
PubMed検索[ 3 ][ 4 ]
ウィキデータ
人間の表示/編集マウスの表示/編集

タンパク質FAM214Aは、配列類似性214を持つタンパク質ファミリーA(FAM214A)としても知られ、ヒトではFAM214A遺伝子によってコードされるタンパク質です。FAM214Aは、染色体15(ヒト)のq21.2-q21.3遺伝子座に存在する機能不明の遺伝子です。[ 5 ]この遺伝子のタンパク質産物には2つの保存されたドメインがあり、1つは機能不明(DUF4210)で、もう1つはChromosome_Segと呼ばれています。[ 6 ] FAM214Aタンパク質の機能は未解明ですが、DUF4210とChromosome_Segはどちらも減数分裂中の染色体分離に関与すると予測されています。[ 7 ]

遺伝子

概要

FAM214A 遺伝子、15番染色体のマイナスDNA鎖(センス(分子生物学)を参照)の位置52,873,514と53,002,014の間に位置し、そのため遺伝子の長さは97,303塩基対(bp)となる。[ 5 ] [ 8 ] [ 9 ] FAM214Aは、これまでKIAA1370とFLJ10980という2つの別名で呼ばれていた。[ 5 ] FAM214A遺伝子には、転写後に最終的な4231 bpのmRNA転写産物を構成する12のエクソンが含まれると予測されている。[ 10 ]このmRNA産物が、プロモーター配列と転写因子の助けを借りて、最終的なFAM214Aタンパク質に翻訳される。 FAM214A mRNA配列のプロモーターは、GenomatixのEl Doradoプログラムによって予測され、解析されました。[ 11 ]このプロモーターは601塩基対の長さで、5' UTRの一部にまたがっています。[ 11 ]

FAM214Aは15番染色体に位置する[ 5 ]
15番染色体上のイントロンエクソンを含むFAM214A遺伝子の図[ 9 ]

遺伝子発現

FAM214Aの発現データは遺伝子カードから得られた[ 12 ]

BioGPSやExpression Atlasなどの多くの情報源によると、FAM214Aは低レベルで普遍的に(またはほぼ普遍的に)発現していると考えられています。[ 12 ] [ 13 ] [ 14 ]下記のBioGPS画像に見られるように、免疫関連細胞および組織では有意に高い発現レベルが見られ、免疫における役割を示唆しています。しかし、この主張を裏付ける具体的なin situ証拠は存在しません。発現データは、幅広い遺伝子を対象とした多数の研究から収集されているため、一部のデータには矛盾する性質があります。

FAM214Aの発現データはBioGPSから得られた[ 13 ]

タンパク質

概要

FAM214A タンパク質のヒトにおける機能はまだ不明です。しかし、遺伝子オントロジー上でこのタンパク質の機能を説明する「生物学的プロセス」、「細胞成分」、および「分子機能」という3つの機能用語の関連付けがあり、生体内での主要な機能の意味を予測しています。[ 15 ] [ 16 ] FAM214Aのタンパク質産物は1076個のアミノ酸(aa)で構成され、分子量は121,700ダルトンと予測されており、等電点はpH 7.7付近です。 [ 6 ] [ 17 ] [ 18 ]このタンパク質は、シグナルペプチド配列が欠如していることとプログラムPSORTIIの予測に基づいて、転写後に核内に残留すると予測されています。[ 19 ]選択的スプライシングにより、他の2つのアイソフォーム(Q32MH5-2とQ32MH5-3)が観察されています。これらは主要な産物とはわずかに異なります。[ 20 ] アイソフォーム2は、塩基から4つの異なるアミノ酸を持っています。 960-960番塩基の配列末端が欠落している。[ 20 ]アイソフォーム3には、メチオニンの後の配列の先頭に7つのアミノ酸が追加されている。[ 20 ]

FAM214Aタンパク質は、翻訳後、PSORT IIの複数の種類のサブプログラムによって核内に留まると予測されます。[ 19 ]このタンパク質には、残基709から始まる2つの「古典的な」核局在シグナル(NLS)の1つであるpat4シグナルがあります。 [ 21 ] 2番目の「古典的な」NLSであるpat7も、「非古典的な」二分NLSもありませんが、NCNNスコアによって核に標的化されると予測されています。[ 21 ] [ 22 ] このスコアは、アミノ酸配列に基づいて、タンパク質が核に標的化されるか細胞質に標的化されるかを予測します。[ 21 ] [ 22 ] FAM214Aタンパク質の場合、NCNNスコアは94.1%の確実性で核局在を予測しました。[ 21 ] [ 22 ] この情報に基づいて、PSORTはタンパク質の細胞内局在の全体的な予測を生成します。FAM214Aの場合、予測値は核で69.6%、ミトコンドリアで13.0%、細胞質で8.7%、分泌小胞と小胞体で4.3%でした。[ 19 ]

翻訳後修飾

FAM214Aタンパク質内で発見された予測リン酸化部位[ 23 ]

このタンパク質は、ExPASyウェブサーバー上のNetNGlycとNetOGlycによって予測されたシグナルペプチド配列が欠如しているため、有意な数の翻訳後修飾を受けない可能性が高い。[ 24 ] [ 25 ] これは、翻訳後修飾を行う細胞内機構の多くが、タンパク質が小胞体ゴルジ体などの細胞小器官を通過することを必要とするためである。シグナルペプチド配列がない場合、タンパク質は一般的に核から出ることはなく、これは前述のPSORT IIによって予測された。[ 19 ]

このタンパク質のSAPS分析をswp23s.qデータベースに対して行ったところ、このタンパク質には異常に多くのセリンアミノ酸と異常に少ないアラニンアミノ酸が存在することが示された。[ 17 ] Fayardらによるレビュー記事によると、ホスホイノシチド依存性キナーゼ2(PDK2)は、細胞周期の制御に重要なセリン/スレオニンキナーゼである。FAM214Aタンパク質は、正常と考えられるよりも多くのセリングループを持っているため、PDK2がこのタンパク質に重要な影響を与える可能性がある。[ 26 ]過剰な数のセリンが実際にリン酸化されると予測されたかどうかを判断するために、タンパク質配列をExPASyウェブサーバーのプログラムNetPhosで実行した。[ 23 ]このプログラムは、69個のセリン、14個のスレオニン、および9個のチロシンのリン酸化を予測した。[ 23 ]上記のSAPS解析によると、セリンの総数は134個であり、そのうち約半数が生体内でリン酸化されると予測される。リン酸化予測の図を右に示す。

ExPASyのプログラムNetCoronaによって、FAM214Aタンパク質に対するもう一つのタイプの翻訳後修飾が予測された。[ 27 ]このプログラムは、翻訳後のFAM214Aタンパク質配列の位置214と215の間に単一の切断部位が存在すると予測した。[ 27 ]

タンパク質相互作用

FAM214Aプロモーター配列には、多数の転写因子結合部位が予測されている。 [ 11 ] 最も高い予測信頼性を持つ部位のいくつかを下の表に示す。[ 11 ]

FAM214Aプロモーター配列に結合すると予測される転写因子

予測される転写因子始める終わりストランド自信
転写因子IIB(TFIIB)認識要素97103ネガティブ1.0
骨髄性ジンクフィンガータンパク質MZF1151161ネガティブ1.0
ミエリン転写因子1様、ニューロンC2HCジンクフィンガー因子1388400ネガティブ0.945
アンドロゲン受容体結合部位、IR3部位495513ネガティブ0.923
ウィルムス腫瘍抑制因子117ポジティブ0.968
非回文性核因子I結合部位2747ポジティブ0.988
FOXP1の選択的スプライシング変異体、ES細胞で活性化383383ポジティブ1.0
多形性腺腫遺伝子1488510ポジティブ1.0
ETS様遺伝子1(ELK-1)569589ポジティブ0.961
FAM214A非転写因子はタンパク質相互作用を予測した

STRINGによれば、FAM214Aタンパク質と相互作用すると予測される唯一のタンパク質はMFSD6Lと呼ばれる。このタンパク質は主要ファシリテータースーパーファミリーに属し、膜貫通タンパク質であると予測されている。FAM214Aと同様に、このタンパク質の機能は実験や研究によってまだ明らかにされていない。[ 28 ] [ 29 ]このMFSD6Lタンパク質は、確実に相互作用すると予測される唯一のFAM214Aタンパク質であるため、その配列をPSORT IIプログラムで解析した。NLSサブプログラムのデータから、1つのpat4と2つのpat7 NLS配列の存在が予測され、核局在の可能性が示唆された。[ 19 ] [ 21 ] 一方、NCNNスコアは細胞質局在を94.1%の確実性で予測したため、PSORT IIスコア全体は、細胞膜39.1%、小胞体39.1%、液胞4.3%、分泌系の小胞4.3%、ゴルジ体4.3%、ミトコンドリア4.3%、核4.3%となった。[ 21 ] [ 22 ]核局在シグナルが全部で3つあるため矛盾しているが、MFSD6Lタンパク質の膜貫通性がこれらの予測に問題を引き起こしている可能性がある。[ 21 ]

FAM214Aの三次構造のごく一部[ 30 ]

二次構造と三次構造

FAM214Aタンパク質の二次構造は、Biology WorkbenchとP rotein H omology/analog Y Recognition Engine(PHYRE)によって予測されたように、多数のαヘリックスβシートで構成されています。 [ 30 ] [ 31 ] PHYREプログラムは、FAM214Aの二次構造の66%が無秩序であるため、分析して三次構造予測に変換することができないと予測しています。[ 30 ] しかし、タンパク質の構造の約10%を95%の有意性で予測することができました。[ 30 ] この図を左に示します。[ 30 ]

保全

パラログ

ホモ・サピエンスの9番染色体上には、単一のパラログ遺伝子が発見され、FAM214B(配列類似性ファミリー、B)と名付けられている。[ 32 ] FAM214Bはパラログと考えられているものの、FAM214Aとは著しく異なるタンパク質配列を有する。NCBIのBLASTで両者を比較したところ、唯一有意な類似性が認められたのは最後の200アミノ酸(DUF4210ドメインとChromosome_Segドメインが位置する領域)であった。[ 33 ] FAM214AとBの類似性は低いものの、これら2つのタンパク質は同じタンパク質ファミリーに属し、同じ2つの保存されたドメインを含んでいる。[ 7 ] [ 34 ]

オルソログ

FAM214Aタンパク質には、哺乳類鳥類爬虫類両生類、条鰭綱、ウニ上科、昆虫吸虫類、甲殻類、トリコプラシア類、花虫綱、およびユーロチオミセス綱を含む多数の分類群にわたって、相当数の相遺伝子が存在します。[ 35 ] これは、FAM214Aタンパク質が真核生物内ではよく保存されていますが、細菌古細菌では保存されていないようです。すべての相同遺伝子において、最も保存されている領域は、保存ドメインがあるタンパク質の末端近くでした(以下を参照)。ヒトFAM214Aタンパク質の相同遺伝子は、Tuber melanosporum、Talaromyces stipitatus、およびAspergillus nidulansにまで遡って見つかっており、これらはすべて約1億2億1500万年前に分岐しました。

FAM214Aタンパク質のオーソログ

通称人類の系統からの分岐(MYA)[ 36 ]NCBIタンパク質アクセッション番号シーケンスの長さヒト配列との同一性パーセント[ 33 ]共通遺伝子名
ホモ・サピエンス人間-NP_062546.21076100FAM214A
パン・トログロダイトチンパンジー6.3XP_003314724108399FAM214A
パン・パニスカスボノボ6.3XP_003827895.11076100FAM214A
ドブネズミねずみ92.3NP_0011003081074100LOC300836
ウシ94.2XP_6011521087100KIAA1370
狼瘡94.2XP_5446821081100KIAA1370
オルニトリンクス・アナティヌスカモノハシ167.4XP_001515207116995KIAA1370
ガルス・ガルスチキン296.0NP_001005811109399FAM214A
テニオピギア・グッタタキンカチョウ296.0XP_002196177111299FAM214A
アノール・カロリネンシスカロライナアノール296.0XP_003227400108699KIAA1370
アフリカツメガエル熱帯ツメガエル371.2NP_00101570294698FAM214A
ダニオ・レリオゼブラフィッシュ400.1NP_001189349102175FAM214A
ミツバチハニービー782.7XP_393903133945LOC410423
ストロンギロセントロトゥス・プルプラトゥスウニ742.9XP_79917929727FAM214A類似体
キイロショウジョウバエミバエ782.7NP_610688129727CG9005
マンソン住血吸虫住血吸虫寄生虫792.4XP_00257928576626仮説的タンパク質
ミジンコ一般的なミジンコ782.7EFX8751620018仮説上のタンパク質 DAPPUDRAFT_207300
ネマトステラ・ベクテンシスイソギンチャク8億5530万年前XP_00163354019118仮説的タンパク質
塊茎メラノスポルムトリュフ1215.8XP_00284183362215仮説的タンパク質
タラロミセス・スティピタトゥス-1215.8XP_00247856779725保存された仮説的タンパク質
アスペルギルス・ニデュランス糸状菌1215.8XP_65860572815仮説的タンパク質 AN1001.2

系統発生

FAM214Aとその相同タンパク質の進化的関係[ 31 ]

FAM214Aとその相同遺伝子間の進化的関係を示すために、Biology WorkbenchのCLUSTALWプログラムによって20の相同遺伝子の非根付系統樹が生成された。 [ 31 ]

保存されたドメイン

FAM214Aタンパク質内には、3つのよく保存された領域があります。これらには、タンパク質のN末端近くのよく保存された領域と、 C末端近くの未知機能ドメイン4210(DUF4210)とChromosome_Segドメインを含む2つの保存されたドメインが含まれます。[ 7 ]これら3つの領域の模式図を以下に示します。タンパク質のN末端近くのよく保存された領域には、既知のドメインやモチーフは含まれていないと予測されますが、上記のNetCoronaによって予測された切断部位はこの領域内に位置し、FAM214Aと相同なタンパク質の大部分でよく保存されています。[ 27 ]このタンパク質の端にある2つの保存されたドメインは、進化の歴史に基づくとペプチドの最も重要な部分です。上記の相同遺伝子表にある生物のうち、カモノハシ(Chromosome_Segドメインを欠いている)を除くすべての生物は、タンパク質配列内にこれらの保存されたドメインの両方を含んでいます。[ 7 ]

ホモサピエンスFAM214Aタンパク質の概略図。よく保存された領域とその位置を図式化したもの。

参考文献

  1. ^ a b c GRCh38: Ensemblリリース89: ENSG00000047346Ensembl、2017年5月
  2. ^ a b c GRCm38: Ensemblリリース89: ENSMUSG00000034858Ensembl、2017年5月
  3. ^ 「ヒトPubMedリファレンス:」米国国立医学図書館、国立生物工学情報センター
  4. ^ 「マウスPubMedリファレンス:」米国国立医学図書館、国立生物工学情報センター
  5. ^ a b c d「遺伝子カード:配列類似性214、AのFAM214Aファミリー」
  6. ^ a b「タンパク質FAM214A」 NCBI 2013年2月2日閲覧
  7. ^ a b c d「NCBI保存ドメイン」
  8. ^ 「遺伝子FAM214a周辺の遺伝子座位マップ領域」遺伝子カード
  9. ^ a b「配列類似性214、Aを持つFAM214Aファミリー」。NCBI。
  10. ^ 「配列類似性214を持つホモサピエンスファミリー、メンバーA(FAM214A)、mRNA」 NCBI。2013年4月17日。
  11. ^ a b c d「ジェノマティクス: エルドラド」 .ジェノマティクス
  12. ^ a b「遺伝子カードからのFAM214A遺伝子発現」遺伝子カード
  13. ^ a b 「 BioGPSによるFAM214A遺伝子発現」。BioGPS
  14. ^ 「Expression AtlasからのFAM214A遺伝子発現」 。2013年6月16日時点のオリジナルよりアーカイブ
  15. ^ 「遺伝子オントロジー」
  16. ^ 「遺伝子オントロジー:用語の関連付け」
  17. ^ a b「生物学ワークベンチ:SAPS」
  18. ^ Kozlowski, LP (2016). 「IPC - 等電点計算機」 . Biology Direct . 11 (1) 55. doi : 10.1186/s13062-016-0159-9 . PMC 5075173. PMID 27769290 .  
  19. ^ a b c d e「PSORT II 予測」
  20. ^ a b cタンパク質FAM214A - ホモサピエンス(ヒト)」UniProt .
  21. ^ a b c d e f g「PSORT II NLS。PSORT
  22. ^ a b c d Reinhardt A, Hubbard T (1998年5月). 「ニューラルネットワークを用いたタンパク質の細胞内局在予測」 . Nucleic Acids Research . 26 (9): 2230–6 . doi : 10.1093/nar/26.9.2230 . PMC 147531. PMID 9547285 .  
  23. ^ a b c「NetPhos」 . ExPASy .
  24. ^ "NetNGlyc" . ExPASy .
  25. ^ "NetOGlyc" . ExPASy .
  26. ^フェイヤード E、タンティニャック LA、ボードリー A、ヘミングス BA (2005 年 12 月)。 「プロテインキナーゼB/Aktの概要」。細胞科学ジャーナル118 (Pt 24): 5675– 8.土井: 10.1242/jcs.02724PMID 16339964S2CID 8984112  
  27. ^ a b c「NetCorona」 . ExPASy .
  28. ^ 「Gene Cards MFSD6L」 . Gene Cards .
  29. ^ "UniProt MFSD6L" . UniProt .
  30. ^ a b c d e「PHYRE Protein Fold Recognition Server」 。 2022年8月12日時点のオリジナルよりアーカイブ2013年5月12日閲覧。
  31. ^ a b c「生物学ワークベンチ」
  32. ^ 「遺伝子カード-パラログ」遺伝子カード
  33. ^ a b「NCBI BLAST」。NCBI。
  34. ^ 「保存ドメインFAM214B」 NCBI。
  35. ^ 「遺伝子カードオーソログ」遺伝子カード
  36. ^ Hedges, SB; Dudley J; Kumar S (2006). 「TimeTree: 生物間の分岐時期に関する公開知識ベース」 pp.  2971– 2972​​.