黒田研公開ラボセミナー

ネットワークから生命の制御を読み解く

川上 英良 先生(理化学研究所 医科学イノベーションハブ推進プログラム健康医療データAI予測推論開発ユニット)

2017年12月20日(Wed)    17:00-18:30  理学部3号館 412号室   

近年、医学・生物学領域において、次世代シークエンサーを始めとする測定技術の普及により、膨大な網羅的計測データが生成されている。これらの膨大なデータを活用することで、背後にある疾患や生命現象のメカニズムに迫るデータ駆動型アプローチが着目されてきている。しかしながら、生命現象・疾患は①構成要素が不均一、②作用が非線形(単純な比例関係でない)、③直接観測できない潜在変数が多い、といった特徴を持ち、従来数理解析で基本となってきた物理学的アプローチをそのまま適用するのは難しい。私たちは、今までにネットワークに基づいた手法によって、シグナル伝達ネットワークの制御構造の解明および転写制御因子の推定を行ってきた。
 遺伝的・分子生物学的データが充実しており哺乳類細胞とも共通性の高い出芽酵母については、膨大な文献情報に基づくストレス応答パスウェイの包括的ネットワークモデル化を行った(Kawakami et al. 2016 npj Syst. Biol. App.)。このネットワークモデルに、大規模ネットワーク解析手法を適用することで、ストレス応答パスウェイに特徴的な局所的・大域的な制御構造を明らかにし、ネットワークの中心となる分子周辺に有意に複合体の形成解離反応が多く見られることを発見した。複合体形成解離反応は、コア分子の濃度・活性を一定に保つ緩衝作用を持ち、シグナル伝達における主要な安定化メカニズムであると考えられる。
 また、私たちは、網羅的遺伝子発現データから遺伝子制御に重要な転写因子を網羅的に予測する手法を開発した(Kawakami et al. 2016 Nuc. Acids Res.)。転写因子が遺伝子のどの領域に結合しているかを網羅的に測定した、クロマチン免疫沈降オンチップ(ChIP on chip)やクロマチン免疫沈降-次世代シーケンシング(ChIP-seq)のデータを、世界中から7,000以上集めて再解析を行うことで、転写因子と標的遺伝子間の制御ネットワークである「遺伝子制御ネットワーク」を構築した。さらに、従来のGene Set Enrichment解析に確率的な制御関係を考慮したwPGSA法(weighted Parametric Gene Set Analysis)を導入することで、遺伝子発現データからヒトとマウスの450種類以上の転写因子の活性を極めて高い精度で予測することに成功した。wPGSA法を様々な遺伝子発現データに適用することで、生命現象・疾患を制御する転写因子の抽出を行っている。
 本セミナーでは、ネットワークに基いて生命の制御を理解し、予測するためのフレームワークを概説し、実際のデータ解析における活用事例を紹介する。