株式会社テクノアソシエーツ

健康・医療イノベーション

2015.11.30

ゲノム解析の価格障壁を解決
ゲノム、疾病、体質などのビッグデータをスパコンで分析・解釈する

 文部科学省と科学技術振興機構(JST)が中心となって推進する「センター・オブ・イノベーション(COI)プログラム」では、様々なイノベーション創出へビジョン主導型、バックキャスト型の研究開発が進められている。その一つ、「自分で守る健康社会」の拠点である東京大学では、「入院を外来に、外来を家庭に、家庭で健康に」をコンセプトに、ICT、電子デバイス技術を活用し、産学連携で健康長寿社会実現のための基盤構築を目指している。
 この中で「健康医療ICTオールジャパン標準化グループ」では重点テーマの一つとして「革新的臨床シークエンサーとゲノム解析・解釈システムの開発」を掲げており、東京大学医科学研究所の宮野悟教授、井元清哉教授(写真)らがクオンタムバイオシステム、日本IBMとともに研究開発に取り組んでいる。井元教授に研究内容と、今後の展望を伺った。

——「革新的臨床シークエンサーとゲノム解析・解釈システムの開発」とは、どのような研究なのでしょうか?

 井元 将来国民の一人一人が、自分の全遺伝情報(ゲノム)を病気の予防や治療などの健康向上に活用するための基盤研究です。そのため、まず100万人の全ゲノムを解析し、健康情報と結びつけて解析するためのシステム構築の研究を行っています。研究課題は二つ。一つは大量のゲノムを解析するためのより廉価なシークエンサー(塩基配列を解析する装置)の開発と活用です。もう一つが個人の全ゲノム情報や、腸内細菌など微生物のゲノム情報(メタゲノム)、疾病、体質などの情報を結合したビッグデータに基づく新たな解釈システムの構築です(図1)。

図1●革新的臨床シークエンサーとゲノム解析・解釈システムの開発
図1●革新的臨床シークエンサーとゲノム解析・解釈システムの開発

——新たなシークエンサーは、なぜ必要なのでしょうか。

 井元 それは解析コストを低減するためです。この研究で不可欠なDNAの塩基配列を調べるゲノム解析は、大きく3種類に分けられます。一つ目はある種の疾病に関連する限られた遺伝子のみを解析するもので、疾患にもよりますが数十から百程度の遺伝子を調べます。二つ目は全遺伝子の中でタンパク質合成に関わる領域「エクソン(全ゲノムの3%以下)」の全てを解析するもの、三つ目が全てのゲノム領域、約30億個の塩基配列を解析する

写真●東京大学 医科学研究所 井元清哉 教授
写真●東京大学 医科学研究所 井元清哉 教授
ものです。 当然、解析は、ゲノムの限られた部分にのみ行う方が容易で、かかる時間やコストも少なくて済みます。一方、最近の研究により、遺伝子以外の領域にも様々な機能があり、健康や病気の発症に関わることが分かってきました。そのため、将来を見据え、病気の予防や治療を目指す研究においては、全ゲノム解析が必要なのです。
 全ゲノム解析における最大の課題がコストです。現在、一人の全ゲノム解析にかかる費用は10万円以上です。そこで、新たな技術を活用したシークエンサーを開発しているクオンタムバイオシステムズと連携し、ゲノム解析にかかる費用を、将来血液検査と同レベルの1万円程度にできるようにしたいと考えています。
 クオンタムバイオシステムズのシークエンサーは、シリコンの薄い板に空けた小さな穴をDNAが通過する際に生じるトンネル電流により塩基を識別します。DNAの各塩基の物性に応じてトンネル電流が変動するため、1塩基単位での識別ができます。従来の方法のように蛍光色素を使わないためにコストを大幅に抑えることができます。さらに、この方法の場合、DNAとタンパク質との結合を調節する役割がある「メチル化された塩基」の識別もでき、ゲノムがどのように使われるかを制御するしくみ(エピゲノム)の解析につながる可能性もあります。

——読み取ったゲノム情報を予防、治療に活かすための解析はどのように行うのでしょうか。

 井元 全ゲノムシークエンスデータの解析には、膨大な演算能力を持つスーパーコンピュータと、データを保存できるストレージが必要です。東京大学医科学研究所のヒトゲノム解析センターには、スーパーコンピュータ「Shirokane 3」があります。これは、スーパーコンピュータ「京」の約20分の1の演算能力(420 T FLOPS:テラフロップス)を持っています。これを活用し、全ゲノムシークエンス、RNAシークエンス、エピゲノム、メタゲノムなど、様々なシークエンスデータを網羅的、かつ安全に解析するためのシステムを構築しました(図2)。究極の個人情報と呼ばれるゲノム情報を扱うことから、高セキュリティスパコン領域はインターネットから切り離し、データ管理室はスーパーコンピュータの管理者のみ入室可能で、データ解析室には、USBソケットなどは無くデータは持ち出せません。また、データを運ぶ際には2人以上で運搬するなど、考えうる最高のセキュリティ体制で運営しています。
 解析したデータの解釈には、日本IBMのコグニティブ・コンピューティングを使います。これは、科学論文などのゲノムに関わる大量のデータを読み込むとともに分析し、自然言語による複雑な質問を理解した上で根拠に基づいた回答を提示する技術です。米国立医学図書館が提供する世界最大の医学、生物学の文献データベースであるPubMedには、「がん」をキーワードにした論文が最近では年間約20万報が登録されています。また、その数は年々増加しています。これらの論文を一人の人が全て読み、ゲノム解析の結果を解釈するのは到底不可能なことです。そのため、この作業をコンピュータにやってもらおうというのが、今回のビッグデータ解析のシステムです。
 また、現在は、スーパーコンピュータを用いて解析し、解釈した結果が妥当なものかどうかを検討するため、「Sequence Board」という検討会を月に2回開催しています。ここでは、十数人の研究者が1回に10症例程度についてゲノム情報と臨床情報を解析し、コンピュータが解釈した結果と照らし合わせて議論します。その結果は日本IBMにフィードバックされ、コンピュータの“成長”、実用化に近づくというわけです。今年度より、医科学研究所では既に100例以上の情報が蓄積されています。

図2●東京大学医科学研究所のパーソナルゲノム空間
図2●東京大学医科学研究所のパーソナルゲノム空間

——ゲノム解析における将来展望を教えてください。

 井元 今後は、全ゲノム解析が標準となり、数年のうちには皆さんが自分のゲノム情報を持つようになるでしょう。その時、自分のゲノム情報が自分の健康の向上のために活用できる基盤を作りたいと思っています。そのような社会が実現するためには、遺伝子による差別など、社会に及ぼす可能性がある影響も含め、研究していく必要があるでしょう。法整備や仕組みづくりも重要だと考えています。

関連情報

関連記事

ページトップへ
Copyright © TechnoAssociates, Inc. All rights reserved.