人間の遺伝子の5分の1は「本物」ではありません

新しい研究は生物医学の様相を変える可能性があります。ヒトゲノムには、以前に信じられていたよりもはるかに少ない「実際の」遺伝子、つまりタンパク質をコードする遺伝子が含まれていることがわかっています。

私たちのDNAには、当初考えていたよりもはるかに少ない「実際の」遺伝子が含まれている可能性があります。

1990年代初頭、科学者たちはヒトゲノムのDNA配列全体のマッピングに着手しました。

いわゆるヒトゲノムプロジェクトは、病気との遺伝的つながりを見つけ、どの遺伝子がタンパク質をコードし、どの因子が遺伝子発現を調節するかなど、ゲノムのさまざまな要素の機能と構造を理解することを目的としています。

ヒトゲノムプロジェクトの最初の結果では、体の組織や臓器が正常に機能するために不可欠な大きな分子であるタンパク質をコードできる遺伝子が40,000個あると予測されていました。

しかし、そのプロジェクトが2003年に終了するにつれ、その数の推定値は約20,000〜25,000のタンパク質をコードする遺伝子に減少しました。

それ以来、科学者たちは最終的なプロテオーム、つまり遺伝子によって発現できるタンパク質の総数を考え出すことに努めており、これらのタンパク質の遺伝子発現がいくつかの疾患でどのように変異しているかを理解することに焦点を当てています。

この目的のために、スペインのマドリッドにあるスペイン国立がん研究センターのバイオインフォマティクスユニットのマイケル・トレスが率いる国際的な研究者チームが、利用可能な主要なプロテオームデータベースによってタンパク質コーディングと見なされる遺伝子を調べました。

トレスと同僚は彼らの研究結果をジャーナルに発表しました 核酸研究。英国のヒンクストンにあるウェルカムトラストサンガーインスティテュートのフェデリコアバスカルは、この論文の最初の著者です。

少なくとも2,000個の遺伝子が「偽遺伝子」です

研究者らは、タンパク質配列と遺伝子アノテーションの3つのコレクション(GENCODE / Ensembl、RefSeq、およびUniProtKB)のプロテオームを比較しました。

Tressとチームは、タンパク質をコードするものとしてリストされている22,210の遺伝子の総数のうち、3つのコレクションすべてに含まれているのは19,446だけであることを発見しました。

次に、2,764個の遺伝子の違いにズームインし、実験的証拠と注釈から得られる情報を調べました。

証拠は、これらの遺伝子の大部分が「非コード遺伝子または偽遺伝子」であることを示唆しました。

また、科学者たちは、3つのコレクションでタンパク質をコードするものとしてリストされている追加の1,470の遺伝子が、タンパク質をコードする遺伝子の機能的特徴や典型的な進化を持っていないことを発見しました。

したがって、研究者たちは、「3つの参照データベースは、現在、人間のコーディング遺伝子の数を少なくとも2,000過大評価しており、大規模な生物医学実験を複雑にし、ノイズを追加していると考えています」。

「どの潜在的な非コード遺伝子がタンパク質をコードしないかを決定することは困難ですが、人間の参照プロテオームはほとんどの基礎研究の基本的な柱であり、ほとんどすべての大規模な生物医学プロジェクトをサポートするため、非常に重要なタスクです。」

今後の研究の方向性

Tressは、研究者が調査結果をさらに進めている方法を共有しています。 「私たちはこれらの遺伝子の多くを詳細に分析することができました。そして300以上の遺伝子がすでに非コードとして再分類されています。」と彼は説明します。

「驚くべきことに」、研究の共著者であるDavid Juanのチャイムは、「これらの異常な遺伝子のいくつかは十分に研究されており、遺伝子がタンパク質を生成するという仮定に基づいて100を超える科学出版物を持っています。」

したがって、結果は、私たちが知っているように、生物医学の分野を変える可能性があります。ただし、さらに調査が必要です。

「私たちの証拠は、人間が19,000のコーディング遺伝子しか持っていない可能性があることを示唆していますが、19,000の遺伝子がどれであるかはまだわかりません」とAbascalは付け加えます。

none:  白血病 スポーツ医学-フィットネス 刺されて刺される