現在の研究内容

オーファン遺伝子(系統固有遺伝子)の起源解明
オーファン遺伝子とは他生物との間にホモログが一切検出されない遺伝子のことである。つまり、種や系統に固有に存在する遺伝子と言える。これまでゲノム情報が公開された生物からは必ずオーファン遺伝子が見つかっているが、それらが進化においてどの程度の影響を及ぼしているか不明である。本研究では推定ORFのうち、発現情報があるものの中からオーファン遺伝子を検出し、それらの機能や起源を推定する研究を進めている。

タンパク質の収斂進化
収斂進化(収束進化)とは生物がある環境に適応する課程で似た体の形態や性質を獲得する現象である。しかしながら収斂現象自体はタンパク質のような分子レベルでも起こっていることが報告されている。我々はタンパク質の収斂進化が種の進化に及ぼす影響を解明したいと考え、大量の遺伝子データを用いて未知の収斂タンパク質を検出する方法の開発を進めている。

遺伝子の獲得と欠失が進化に及ぼす影響
我々は遺伝子の獲得と欠失が生物の環境適応にどの程度貢献するか理解するために、系統における遺伝子の獲得と欠失を推定し、それらの機能を推定するプログラムを作成中である。

大量遺伝子データを用いた系統推定法の開発
近年、高速シークエンサーの普及により大量の遺伝子配列データが利用可能になっている。我々はその大量データを活かして、従来のような少数の分子を用いた系統推定よりも優れた系統推定の方法を開発中である。


これまでの研究内容

オーソログデータセット作成プログラム(Ortholog-Finderの開発(2008-2016)
今までに公開されているオーソログデータベースは機能予測などには有用だが、パラログも含まれているために系統解析には適していない。以前の我々の研究で系統解析に使用できるデータセット作成を作成したが、手作業が必要だった為、非常に時間と手間がかかっていた。そこで本研究では新たな方法を取り入れつつ、それらの作業を自動化した(Ortholog-Finder)。


遺伝子水平伝播シミュレーションプログラム(HGT-Gen)の開発 (2010-2011)
遺伝子水平伝播は原核生物の進化において、ありふれたイベントの一つである。従って、原核生物の分子系統解析を行う際、遺伝子水平伝播の影響は無視できない。これまで遺伝子あるいはタンパク質の配列の進化シミュレーションによって作成するプログラムは多数開発され、新規系統解析法の開発などに用いられてきた。しかし、遺伝子水平伝播を考慮したシミュレーションプログラムは存在しなかった。そこで我々は新たに遺伝子水平伝播シミュレーションプログラム(HGT-Gen)を開発した。このプログラムは入力した有根系統樹に対し、水平伝播遺伝子の供給元(ドナー)と供給先(アクセプター)の相対的進化時間が合うように水平伝播を起こした系統樹を作成することが出来る。このプログラムは水平伝播遺伝子を含むと仮定される大量遺伝子データセットを用いた系統解析法の開発などに役立つと期待される。
HGT-Gen

マウスDMR(Differentialy methylated region)の特徴の検出 (2007-)
ゲノムメチル化はゲノムインプリンティングの原因となる現象の一つであるが、まだどのようなメカニズムでメチル化される領域がメチル化酵素によって認識されるか分かっていない。現在は休止中である。

大量オーソログを用いた全原核生物門の系統解析 (2004 - 2007)
全原核生物門の系統関係では多数の遺伝子水平伝達や重複遺伝子の欠失の影響により、正確な系統樹作成が非常に困難だった。私はこの問題を克服すべく、MBGDのデータセットを元に独自の方法で共有遺伝子配列データセットを作成した。次に得られた配列データセットを連結し、系統樹(連結系統樹)を作成した。従来は一般的にブートストラップ検定で分岐パターンの信頼性が評価されていたが、この方法は個々の配列の長さにより評価に対する寄与が異なる欠点がある。そこで私は個々の共有遺伝子配列データで系統樹を作成し、それらによって連結系統樹の分岐点の分岐パターンが支持される割合を「分岐点支持率」と定義し、評価を行った。本解析により確からしい全原核生物門の系統関係を示し、それぞれの分岐点の信頼性も正確に評価した。 flashによる説明はこちら

オーソログの数を基にした系統樹解析による真核生物解明の起源解明 (2002 - 2004)
我々の以前の研究により、真核生物の核は古細菌の真正細菌への共生に由来する事が示唆されたが、具体的に共生に関与した生物について言及できなかった。本研究ではゲノムプロジェクトが終了した生物の全推定ORFを用いて、すべての生物間のオルソログの数から距離ら距離行列を計算し、近隣結合法で系統樹を作成した。この時、より正確を期すため、種分岐後に遺伝子重複したORFをグループにまとめ、生物間で共有されるオーソロググループの数を計算した。真核生物のデータはあらかじめ古細菌もしくは真正細菌に有意に相同性が高いものを選び出し、これらのデータを分けて解析を行った。古細菌由来の真核生物ORF群はピロコッカス、真正細菌由来のORF群はγプロテオバクテリアと近隣であるという結果が得られ、それぞれの機能が核、細胞質におよそ対応していることから、これらの生物が真核生物形成時に共生したのではないかと推測した。

Homology-Hit法を用いた真核生物解明の起源解明 (1998 - 2002)
従来、真核生物、真正細菌、古細菌の関係を示した系統樹の樹形は解析に使用するタンパク質の機能により様々で、しかもそれらのタンパク質は任意に選ばれたものでは無かった。一方、ゲノムプロジェクトが終了した全ての生物の全推定ORF(Open Reading Frame)配列データを用いた比較解析が行われるようになってきたが、それらの研究は1対1の比較が殆どだった。我々は全ゲノム配列が明らかになっている酵母とバクテリアのORFデータを用いて、真核生物、真正細菌、古細菌の3つの生物群における進化的な関係を明らかにするために、Homology-Hit法を開発した。この方法は多くの遺伝子(ORF)群間でさまざまな閾値での相同性検索(BLAST)を行い、相同性のある遺伝子数を算出する事で、多数の遺伝子群の相同性をまとめて評価できる。本解析では細胞寄生性細菌を除く15種のバクテリアのORFを機能別に分類された酵母のORFと比較し、酵母の持つそれぞれの機能の由来を考察した。その結果、遺伝情報系の遺伝子群は古細菌ORFと、代謝系遺伝子群は真正細菌ORFと、それぞれ相同性の高い遺伝子を多く共有することが分かった。これらの結果は、真核生物の核は古細菌の真正細菌への共生に由来する事を示唆する。

脊椎動物ゲノムのアイソコア構造と体温の関係 (1996 - 1998)
以前の哺乳類、鳥類、両生類、魚類のゲノムデータを用いた研究により、哺乳類と鳥類(恒温動物)、両生類と魚類(変温動物)との間でゲノムのアイソコア構造(isochore structure)に違いがあることが示されていた。このため、アイソコア構造の違いは動物の体温の違いによると考えられてきたが、爬虫類ゲノムについては不明であった。我々は一連の研究により爬虫類が恒温動物タイプのアイソコア構造を持つことを示した。さらに異温性動物(周期的に体温が変化する恒温動物)としてカッコウとコウモリ、変温動物として生息温度の異なる3種のヘビのαグロビン遺伝子の塩基配列を決定し、コドン第三位のGC含量(GC3)とコドン使用頻度を計算した。これらのデータにデータベースに登録されている既知のαグロビン遺伝子配列データを加えて主成分分析した所、体温とコドン使用頻度に相関は無く、爬虫類誕生以降にアイソコア構造が変化したことが示唆された。