読者です 読者をやめる 読者になる 読者になる

アメリエフのブログ

Amelieff Staff Blog

「医療ビッグデータを活用して世界を変える! 学生インターンMeetup 2017春」を開催いたしました。

 先日4月21日(金)、アメリエフ株式会社にて学生インターンMeetupを開催いたしました。このイベントは長期実践型インターンに興味のある学生を対象としたもので、現在インターンシップを経験している学生が企画したイベントです。イベント当日は、代表取締役社長 山口昌雄による講演『医療版ビッグデータの活用とアメリエフの目指す未来』と、現役インターン生による業務内容プレゼンが行われました。

f:id:amelieff:20170508212545j:plain

 最初に行われた社長山口による講演では、医療版ビッグデータの活用を主軸に、アメリエフが目指す将来像について語られました。アメリエフが行っているゲノムデータ解析事業は、生命情報を理解するうえで重要な役割を担っています。例えばがんを患った場合、治療するための抗がん剤は誰にでも効くわけではありません。がんのタイプや遺伝子パターンによって効果が違ってくるのです。そこで、アメリエフは大量のDNAゲノム解析結果をデータベース化し、がんに対する遺伝情報のパターンを統計処理によって明らかにすることを目指しています。その結果患者さんの患っているがんに適した治療法を提供することができますし、副作用の少ない抗がん剤の開発にもつながります。

 続けて、現役インターン生による業務紹介プレゼンテーションが行われました。現在アメリエフには開発事業に2名、経営企画に1名のインターン生が在籍しています。まず開発事業では、データ解析の補佐に加え、WEBアプリの新サービス開発やデータ作成などが業務として挙げられました。経営企画では、公式ウェブサイトの管理や記事執筆、クライアントとのやり取りなどかなり実践的な業務を行っていることが紹介されました。

 インターン生は3名とも、生物やプログラミングの知識を持っていたわけではありませんが、業務を通じて徐々に専門的な知識を身につけ、実践することができたと話します。そのため、皆が「チャレンジできる」「成長できる」ことをメリットとして挙げていました。インターン生の中には、自分のレベルに合った案件を任され段階的な成長を実感できた人もいれば、インターンに参加してから2週間で大きな商談に参加するという刺激的な経験をした人もいます。さらに、インターン生からは経験豊富なエンジニアから常にアドバイスをもらうことができたり、社員さん達との距離が近く楽しく仕事ができることもメリットとして語られ、一人一人が自分なりの意義を業務に見出している様子でした。

 イベントに参加した学生も、イベントの冒頭で30秒間の自己紹介を行い、自身の研究内容やアメリエフに期待していることを話してくれました。初めのうちは少々硬かった雰囲気も、講演やプレゼンが進むにつれて徐々に緩やかになり、最後の懇親会では自分から積極的にアメリエフのビジョンや業務・研究内容について語り合っていました。アメリエフのインターン生にとっても、幅広いバックグラウンドを持つ学生さん達とインターンシップの内容や今後の医療ビッグデータの動向について話し合うことができ、刺激的な交流の機会になったと自分たちが企画したイベントに達成感を感じている様子でした。

 アメリエフの長期実践型インターンに興味のある方は、ぜひ一度連絡していただければと思います。

腫瘍と免疫の相互作用

がん免疫治療に関するデータ解析の連載1つ目のトピックです。 ここでは、がん免疫サイクル、がん免疫編集、そしてがん免疫ゲノミクスついて簡単にまとめます。

がん免疫サイクル

がん免疫サイクルの最初のステップはネオアンチゲンの生成です。ネオアンチゲンとは、体細胞変異由来のペプチドのことです。 腫瘍の体細胞変異は数十〜数万になるので、ネオアンチゲンは分子レベルで腫瘍細胞に不均一(heterogeneity)にしています。

f:id:onouek:20170306171905p:plain

http://dx.doi.org/10.1038/nrg.2016.67 Fig1Aより

  • ネオアンチゲンは、主要組織適合遺伝子複合体 MHC(ヒト白血球抗原 HLA)によって抗原提示細胞 APCの表面に提示されます。
  • がん細胞死後のネオアンチゲンの放出が様々なプロセスを開始することによって、分子的に不均一なT細胞を拡大します。
  • T細胞とネオアンチゲン-MHC複合体との相互作用によって、個々のTCRががん細胞を認識します。

がん免疫編集

腫瘍内の免疫浸潤は分子レベルのheterogeneityに加えて、自然免疫および獲得免疫に関連する多様な亜集団からなる細胞レベルのheterogeneityをもっています。 例えば、メラノーマやマイクロサテライト不安定性の大腸がんのようなネオアンチゲンを多く持つがんでは、多くの免疫亜集団に深く浸潤されますが、変異率の低い腫瘍ではとても低い浸潤レベルを示します。 免疫浸潤の結果、進行中の腫瘍表現型は「がん免疫編集」というプロセスで生じます。これらの分子・細胞レベルでのheterogeneityは、腫瘍免疫細胞相互作用の複雑なネットワークを形成していて、 そのネットワークと抗腫瘍免疫のメカニズム解明の大きな課題になっています。

がん免疫ゲノミクス

がんゲノミクスプロジェクトととして有名なTCGAICGCは、2万6千人以上のがんサンプルから得られた3千万以上の腫瘍変異の豊富な情報を提供しています。 免疫ゲノミクスにおいて巨大コホートはまだないですが、特にがん免疫ゲノミクスはライフサイエンス領域におけるビッグデータになると考えられています。 理由としては、

  1. HLA領域は個々人のゲノムの4〜5百万変異の半分以上のSNPを占めており、獲得免疫系がヒトの遺伝子変異に最も関与している
  2. 免疫細胞は200以上の種類があり、300以上の免疫細胞の状態遷移が存在する(例えば各細胞および各細胞状態に対する1300種類の薬剤の影響に関する発現プロファイルのデータベースは、0.1ペタバイトのRNA-seqデータになる)
  3. 異なるTCR αβ対(約1020あるとされるヘテロ二量体TCRを構成するα-およびβ-サブユニットの組み合わせ)の数、HLA対立遺伝子(> 13,000)の数、TCRレセプターに結合する抗原(2.5×1010〜1.6×1018)の数を考えると、TCR-ネオアンチゲン-MHCの複合体の数は膨大になる

からです。

ここまで腫瘍と免疫の相互作用についての概要になりますが、複雑なネットワークと抗腫瘍免疫のメカニズムの解明にはゲノミクスツールの開発とデータ解析が必須になってきます。

ということで、次回はオミクスデータ解析の概要を見ていきます。

がん免疫治療法と国際的がんプロジェクト

アメリエフは月一回の頻度で広報誌「AmeliPress」を発行しております。その内容を今月からブログでも配信することになりました。 今回は2月号の内容になります。

NGS技術と国際的がんプロジェクト

 NGS 技術は利用の裾野が広がり、多様な遺伝子研究において活用されています。その中でも、がんの研究や治療での活用の例を一部を挙げると、WGS を用いた体細 胞変異解析やコピー数解析、主要ながん遺伝子に注目してactionableな変異を探索するtargeted-sequencing、 RNA-seqを用いた融合遺伝子検出などがあります。ICGC (International Cancer Genome Consortium)、TCGA (The Cancer Genome Atlas) など膨大な量のクリニカル なゲノミックデータの蓄積も進んでいます。しかし、actionableな変異が必ず見つかるとは限らずまたがんは免疫チェックポイントの働きを促進することにより免疫システムの標的を逃れることもわかってきました。

がん免疫治療法と統合解析

 最近では、がん免疫治療法における NGS データ活用も期待されています。たとえば、がん細胞と正常細胞のNGS(ゲノムシーケンスや RNA-seq)を用いて体細胞変異を検出し、体細胞変異を持つ細タンパク質(neoantigen)を予測することで、がん細胞特異的な neoantigen を認識して攻撃するT細胞を作成することが考えられます。また、RNA-seq データを同時に使用することで、がん細胞で発現しているタンパク質を選択することができます。予測した neoantigenは、BIMASE、SYFPEITHI、NetMHCpanなどのツールを使用し、患者のタイピングされたHLA アリルとの親和性を予測することが可能です。この HLAのタイピングについても、HLAminer、Seq2HLA、PolysoverなどのNGS データを用いたタイピングツールが開発されています。

f:id:amelieff:20170423130911p:plain

図 次世代シーケンサデータ統合による neoantigen 候補及び MHC 親和性の予測

出典:Hackl et al., Nature reviews genetics, Vol.17, Aug 2016.Fig4

がん免疫治療に関するデータ解析(序)

ブログを移転いたしました。 新しいブログでも、アメリエフをどうぞよろしくお願いいたします。

さてもう二月になってしまい、時流に遅れている感満載ですが、年末年始は、それまでの一年を振り返り、これからの一年を考える機会ですね。2016年を振り返るとNGS技術が多様化し、様々な分野で活用され始め、生命科学データ解析の裾野が広がってきていることを感じた一年でした。

そんなNGS技術活用の一面として、がん免疫治療法におけるNGSデータ解析を、論文をもとに取り上げてみたいと思います。

Computational genomics tools for dissecting tumour-immune cell interactions

がんにおけるNGSデータ解析利用は、当ブログでも何度かご紹介しているとおり、多く行われています。 WGSを用いた体細胞変異解析やコピー数解析、主要ながん遺伝子のみに注目したtargeted-sequencing、RNA-seqを用いた融合遺伝子検出…etc。ICGC、TCGAなどクリニカルなゲノミックデータの蓄積も進んでいます。 しかし、actionableな変異が見つかるとは限らず、またがんは免疫チェックポイントの働きを促進することにより免疫システムの標的を逃れることもわかってきました。

がん免疫治療法(cancer immunotherapy)とは、「免疫チェックポイントのブロッカーや治療用ワクチン、用途のため設計されたT細胞等を用いて特定のがん細胞を標的として攻撃するよう免疫システムを活性化する」ことによりがんを治療する方法です(上記論文からそのまま訳しています)。

この連載では、論文に取り上げられている以下の5つのトピックについて簡単にご紹介していきます。

1) 腫瘍と免疫の相互作用
2) オミクスデータ解析の概要
3) 免疫細胞浸潤の細胞作用機序
4.1) 腫瘍抗体の同定
4.2) T細胞受容体(TCR)のプロファイリング
5) 解析パイプライン

誰でもわかる(と思う!)LTR解析 その2

LTR解析について連載するとか言っておきながら何ヶ月たったことか・・・
どうもmisawatです。大丈夫です。生きてます。

さて、期間が大分空いてしまいましたが、第二回として
「LTRの研究事例」
について紹介していきたいと思います。

やはり「どんなことがわかるのか!」ってのが知りたいとこですよね。

さて、少しおさらいですがLTRはレトロトランスポゾンのRNAの両端に存在する繰り返し配列のことでした。
さらに、この領域はプロモーターとしての機能を有するというのも前回お話したとおりです。
これらの前知識を持った上で、実際にpublishされた論文を紹介していこうと思います。

まず一報目。
CAGE profiling of ncRNAs in hepatocellular carcinoma reveals widespread activation of retroviral LTR promoters in virus-induced tumors
Kosuke Hashimoto et al., Genome Res, 2015, 25, 1812-1824

主にnon-coading RNA(以下ncRNA)の研究をされているグループが2015年にGenome Research誌に出した論文です。
背景としてncRNAとガンとの関係性が日々とりざだされていますが、ガンとは多様なもので、その部位、癌腫等によって全く違うメカニズムを有していたりします。
よって、「〜ガンとncRNAの関係」の「〜」の部分が大変重要なんですね。

この研究では肝細胞癌とncRNAの関係性について調べています。
肝細胞癌B型肝炎ウイルスやC型肝炎ウイルスによる肝炎からの発症が多い病気です。
その他の原因としてはアルコールとかですかね。

聡明な皆様ならもうLTRとの関連がわかったかもしれませんね。
そう、この論文のリザルトの中には
肝細胞癌においてLTRプロモーターが活性化されていた」
「LTRに由来するncRNA発現増加量は通常の10倍以上であった」
というのがあります。

LTRの研究は癌研究にもつながっていくんですねぇ。
ちなみにこの論文はCAGE(Cap Analysis of Gene Expression)法を用いた肝細胞癌の転写開始地点及び発現増強部位の特定を行うところがからスタートしています。
手法としてもとてもためになる論文なので一度読んでみると良いかもしれないですね。



次に二報目。
MMTV/LTR Promoter-Driven Transgenic Expression of EpCAM Leads to the Development of Large Pancreatic Islets
Jeffrey R. Vercollone et al., J Histochem Cytochem August 2015 vol. 63 no. 8 613-625

先ほどは肝臓、今回は膵臓のお話ですね。
ここではガンの話ではなく、膵臓ランゲルハンス細胞の接着、分化、成長について調べています。
膵臓ランゲルハンス細胞の接着、分化、成長はEpCAMという遺伝子によって調節されているらしいです。

この遺伝子はマウスにおいてMMTV(Mouse mammary tumor virus)のLTRの支配下にあるんだそうです。
ガンとかではなく、細胞の成長分化にまで関与してしまうLTR・・・こわいですね!!

論文の内容としてはin vivoでEpCAMのValidationを行いました!という論文のようです。
in vivo・・・大変ですよねぇ。



最後に三報目。
結構長くなってきているので巻きで行きます。
Quantification of Total and 2-LTR (Long terminal repeat) HIV DNA, HIV RNA and Herpesvirus DNA in PBMCs
Massanella, M. et al., BioProtoc., 2015, 5(11), e1492.

これは論文というか、手法紹介に近い論文?ですね。

HIVにかかると、日和見感染と呼ばれる「普段はなんともないようなウイルスや細菌に感染する」現象が起こります。
日和見感染の代表的なウイルスにCMV(Cytomegalovirus)やEBV(Epstein‐Barr virus)などがあげられますね。
医学系の教育を受けた方なら「EBV」=「伝染性単核症」といった関連付けがされるのではないでしょうか。

この論文では、HIV潜在的な貯留量を計測し、CMVやEBVとの関係性を見る手法を紹介しています。
定量自体はdroplet digital PCRという手法を用いています。
ターゲットはもちろん末梢血の単核球分画です。

「LTRの有無」ではなく、定量情報で議論できるのはいいですね。


さてさて、今回はLTRに関する論文を三報程紹介してみました。
やはりウイルスが絡むと研究の色が一気に医学よりになりますね。
それだけ応用が期待される研究分野だということなのかもしれません。


次回は・・・、いよいよ分析とかの話にはいりたいですね〜。
果たしていい公開データや紹介できそうな優良な分析ツールはあるのか!
乞うご期待です。。。




いや、やっぱりそんな期待しないでくだs・・・






〜つぶやき〜
最近、愛車にアルミテープを貼りました。
こういうオカルトチック(?)なテクノロジーが大好きです(生命科学においても)。

ASHG2016でgnomADが公開

10/18~22はアメリカ人類遺伝学会(ASHG)2016バンクーバーで開催されていました。

 

その中でBroad Institueから発表されたGenome Aggregation Database (gnomAD)について紹介したいと思います。

 

次世代シーケンサー(NGS)を使っている人にはお馴染みの図ですが、NGSの技術の発展と普及によりDNAのシーケンスコストがどんどん下がっています。

 

 

 そのため、NGSを使った大規模なヒトゲノムの解析が世界中で行われています。例えばイギリスでは今まさに1万人分のゲノムを解析するUK10Kプロジェクトが行われていたり、日本では東北メディカルメガバンクから日本人2,049人の全ゲノム解析の結果がiJGVDで公開されていたりします。  最も大規模なものとしては、Exome Aggregation Consortium (ExAC)による60,706人のエクソームのデータベースが公開されており、今年の8月にNature誌で発表されました。

 

 今回発表されたgnomADは、ExACのversion 1からエクソームのデータが約2倍の126,216人分になり、 15,136 人の全ゲノム解析の結果も追加されています!

 

 


gnomADのブラウザでは、WESとWGSを合わせたSNPとINDELの頻度が閲覧可能ですが、今後CNVの解析もして閲覧できるようになるようです。まだβ版でフィルタリングの条件を検討している段階ということです。また、変異詳細のページではPhenotypeの情報を報告できるようになっており、情報が集まってくれば変異との関連付けもされていきそうです。
ちなみに、gnomADは"ノマド"と発音するみたいです。

 

 

gnomADでは、全部で40テラバイトの変異データをパースすることで作成しているそうで、解析にはScalaで実装されたhailというソフトウェアを使っています。このソフトについてはまた別の機会に紹介できればと思います。

 

 gnomADは、疾患関連変異の探索に強力なツールとして使えると思いますが、インハウスデータの頻度情報と比較して閲覧ができると便利ですね。

 

データ解析トレンド

現在、アメリエフはNGSデータを中心に解析を行っています。
しかし、もともと起業した社長は遺伝統計学のバックグラウンドがあり、最初はSNPアレイデータ解析の会社でした(そもそも、創業当時はNGSが今ほど普及していませんでした)。

とはいえ、ここ数年ずっとNGSデータ解析のお問い合わせが主でした。
ところが、今年に入ったころくらいから、GWAS解析、CNV解析などのSNPデータ解析のお問い合わせを立て続けにいただきました。
NGSは網羅性、データ量では勝りますが、安価さと精度ではSNPアレイのほうがまだ勝っていることもあり、大規模な集団の解析ではSNPアレイの需要は高いということでしょうか。
東北大ToMMoと東芝が開発した日本人SNPを反映したSNPアレイも販売されており、SNPアレイの活用はますます進むのではないかと思います。

アメリエフでは、SNPデータ解析受託、SNPアレイデータ解析で一般的に使われるソフトウェアをプリインストールしたサーバの販売、ソフトウェアを使用するためのLinuxコマンド基礎を含めたトレーニングの提供を行っております。
ご興味のある方は、弊社HPお問い合わせフォームよりお問い合わせください。