読者です 読者をやめる 読者になる 読者になる

アメリエフのブログ

Amelieff Staff Blog

がん免疫治療に関するデータ解析(序)

ブログを移転いたしました。 新しいブログでも、アメリエフをどうぞよろしくお願いいたします。

さてもう二月になってしまい、時流に遅れている感満載ですが、年末年始は、それまでの一年を振り返り、これからの一年を考える機会ですね。2016年を振り返るとNGS技術が多様化し、様々な分野で活用され始め、生命科学データ解析の裾野が広がってきていることを感じた一年でした。

そんなNGS技術活用の一面として、がん免疫治療法におけるNGSデータ解析を、論文をもとに取り上げてみたいと思います。

Computational genomics tools for dissecting tumour-immune cell interactions

がんにおけるNGSデータ解析利用は、当ブログでも何度かご紹介しているとおり、多く行われています。 WGSを用いた体細胞変異解析やコピー数解析、主要ながん遺伝子のみに注目したtargeted-sequencing、RNA-seqを用いた融合遺伝子検出…etc。ICGC、TCGAなどクリニカルなゲノミックデータの蓄積も進んでいます。 しかし、actionableな変異が見つかるとは限らず、またがんは免疫チェックポイントの働きを促進することにより免疫システムの標的を逃れることもわかってきました。

がん免疫治療法(cancer immunotherapy)とは、「免疫チェックポイントのブロッカーや治療用ワクチン、用途のため設計されたT細胞等を用いて特定のがん細胞を標的として攻撃するよう免疫システムを活性化する」ことによりがんを治療する方法です(上記論文からそのまま訳しています)。

この連載では、論文に取り上げられている以下の5つのトピックについて簡単にご紹介していきます。

1) 腫瘍と免疫の相互作用
2) オミクスデータ解析の概要
3) 免疫細胞浸潤の細胞作用機序
4.1) 腫瘍抗体の同定
4.2) T細胞受容体(TCR)のプロファイリング
5) 解析パイプライン

誰でもわかる(と思う!)LTR解析 その2

バイオインフォマティクス
LTR解析について連載するとか言っておきながら何ヶ月たったことか・・・
どうもmisawatです。大丈夫です。生きてます。

さて、期間が大分空いてしまいましたが、第二回として
「LTRの研究事例」
について紹介していきたいと思います。

やはり「どんなことがわかるのか!」ってのが知りたいとこですよね。

さて、少しおさらいですがLTRはレトロトランスポゾンのRNAの両端に存在する繰り返し配列のことでした。
さらに、この領域はプロモーターとしての機能を有するというのも前回お話したとおりです。
これらの前知識を持った上で、実際にpublishされた論文を紹介していこうと思います。

まず一報目。
CAGE profiling of ncRNAs in hepatocellular carcinoma reveals widespread activation of retroviral LTR promoters in virus-induced tumors
Kosuke Hashimoto et al., Genome Res, 2015, 25, 1812-1824

主にnon-coading RNA(以下ncRNA)の研究をされているグループが2015年にGenome Research誌に出した論文です。
背景としてncRNAとガンとの関係性が日々とりざだされていますが、ガンとは多様なもので、その部位、癌腫等によって全く違うメカニズムを有していたりします。
よって、「〜ガンとncRNAの関係」の「〜」の部分が大変重要なんですね。

この研究では肝細胞癌とncRNAの関係性について調べています。
肝細胞癌B型肝炎ウイルスやC型肝炎ウイルスによる肝炎からの発症が多い病気です。
その他の原因としてはアルコールとかですかね。

聡明な皆様ならもうLTRとの関連がわかったかもしれませんね。
そう、この論文のリザルトの中には
肝細胞癌においてLTRプロモーターが活性化されていた」
「LTRに由来するncRNA発現増加量は通常の10倍以上であった」
というのがあります。

LTRの研究は癌研究にもつながっていくんですねぇ。
ちなみにこの論文はCAGE(Cap Analysis of Gene Expression)法を用いた肝細胞癌の転写開始地点及び発現増強部位の特定を行うところがからスタートしています。
手法としてもとてもためになる論文なので一度読んでみると良いかもしれないですね。



次に二報目。
MMTV/LTR Promoter-Driven Transgenic Expression of EpCAM Leads to the Development of Large Pancreatic Islets
Jeffrey R. Vercollone et al., J Histochem Cytochem August 2015 vol. 63 no. 8 613-625

先ほどは肝臓、今回は膵臓のお話ですね。
ここではガンの話ではなく、膵臓ランゲルハンス細胞の接着、分化、成長について調べています。
膵臓ランゲルハンス細胞の接着、分化、成長はEpCAMという遺伝子によって調節されているらしいです。

この遺伝子はマウスにおいてMMTV(Mouse mammary tumor virus)のLTRの支配下にあるんだそうです。
ガンとかではなく、細胞の成長分化にまで関与してしまうLTR・・・こわいですね!!

論文の内容としてはin vivoでEpCAMのValidationを行いました!という論文のようです。
in vivo・・・大変ですよねぇ。



最後に三報目。
結構長くなってきているので巻きで行きます。
Quantification of Total and 2-LTR (Long terminal repeat) HIV DNA, HIV RNA and Herpesvirus DNA in PBMCs
Massanella, M. et al., BioProtoc., 2015, 5(11), e1492.

これは論文というか、手法紹介に近い論文?ですね。

HIVにかかると、日和見感染と呼ばれる「普段はなんともないようなウイルスや細菌に感染する」現象が起こります。
日和見感染の代表的なウイルスにCMV(Cytomegalovirus)やEBV(Epstein‐Barr virus)などがあげられますね。
医学系の教育を受けた方なら「EBV」=「伝染性単核症」といった関連付けがされるのではないでしょうか。

この論文では、HIV潜在的な貯留量を計測し、CMVやEBVとの関係性を見る手法を紹介しています。
定量自体はdroplet digital PCRという手法を用いています。
ターゲットはもちろん末梢血の単核球分画です。

「LTRの有無」ではなく、定量情報で議論できるのはいいですね。


さてさて、今回はLTRに関する論文を三報程紹介してみました。
やはりウイルスが絡むと研究の色が一気に医学よりになりますね。
それだけ応用が期待される研究分野だということなのかもしれません。


次回は・・・、いよいよ分析とかの話にはいりたいですね〜。
果たしていい公開データや紹介できそうな優良な分析ツールはあるのか!
乞うご期待です。。。




いや、やっぱりそんな期待しないでくだs・・・






〜つぶやき〜
最近、愛車にアルミテープを貼りました。
こういうオカルトチック(?)なテクノロジーが大好きです(生命科学においても)。

ASHG2016でgnomADが公開

次世代シーケンサー解析

10/18~22はアメリカ人類遺伝学会(ASHG)2016バンクーバーで開催されていました。

 

その中でBroad Institueから発表されたGenome Aggregation Database (gnomAD)について紹介したいと思います。

 

次世代シーケンサー(NGS)を使っている人にはお馴染みの図ですが、NGSの技術の発展と普及によりDNAのシーケンスコストがどんどん下がっています。

 

 

 そのため、NGSを使った大規模なヒトゲノムの解析が世界中で行われています。例えばイギリスでは今まさに1万人分のゲノムを解析するUK10Kプロジェクトが行われていたり、日本では東北メディカルメガバンクから日本人2,049人の全ゲノム解析の結果がiJGVDで公開されていたりします。  最も大規模なものとしては、Exome Aggregation Consortium (ExAC)による60,706人のエクソームのデータベースが公開されており、今年の8月にNature誌で発表されました。

 

 今回発表されたgnomADは、ExACのversion 1からエクソームのデータが約2倍の126,216人分になり、 15,136 人の全ゲノム解析の結果も追加されています!

 

 


gnomADのブラウザでは、WESとWGSを合わせたSNPとINDELの頻度が閲覧可能ですが、今後CNVの解析もして閲覧できるようになるようです。まだβ版でフィルタリングの条件を検討している段階ということです。また、変異詳細のページではPhenotypeの情報を報告できるようになっており、情報が集まってくれば変異との関連付けもされていきそうです。
ちなみに、gnomADは"ノマド"と発音するみたいです。

 

 

gnomADでは、全部で40テラバイトの変異データをパースすることで作成しているそうで、解析にはScalaで実装されたhailというソフトウェアを使っています。このソフトについてはまた別の機会に紹介できればと思います。

 

 gnomADは、疾患関連変異の探索に強力なツールとして使えると思いますが、インハウスデータの頻度情報と比較して閲覧ができると便利ですね。

 

データ解析トレンド

バイオインフォマティクス
現在、アメリエフはNGSデータを中心に解析を行っています。
しかし、もともと起業した社長は遺伝統計学のバックグラウンドがあり、最初はSNPアレイデータ解析の会社でした(そもそも、創業当時はNGSが今ほど普及していませんでした)。

とはいえ、ここ数年ずっとNGSデータ解析のお問い合わせが主でした。
ところが、今年に入ったころくらいから、GWAS解析、CNV解析などのSNPデータ解析のお問い合わせを立て続けにいただきました。
NGSは網羅性、データ量では勝りますが、安価さと精度ではSNPアレイのほうがまだ勝っていることもあり、大規模な集団の解析ではSNPアレイの需要は高いということでしょうか。
東北大ToMMoと東芝が開発した日本人SNPを反映したSNPアレイも販売されており、SNPアレイの活用はますます進むのではないかと思います。

アメリエフでは、SNPデータ解析受託、SNPアレイデータ解析で一般的に使われるソフトウェアをプリインストールしたサーバの販売、ソフトウェアを使用するためのLinuxコマンド基礎を含めたトレーニングの提供を行っております。
ご興味のある方は、弊社HPお問い合わせフォームよりお問い合わせください。

誰でもわかる(と思う!)LTR解析 その1

バイオインフォマティクス
〜前置き〜

だんまりを決め込んでいました。
どうもmisawatです。

たまにはInputだけではなくOutputせねば!と謎の義務感にかられたので記事を書きにきました。

テーマは「LTR (Long Terminal Repeat)」の解析です。

・・・。

はい。


「繰り返し〜」とか「リピート〜」とか言うと遺伝子解析屋さんは「むぇ〜(´・ω・`)」ってなるかもしれませんね。


ただこのLTR、解析出来ると色々おもしろいことがわかってきます。
そこで、「LTRとは何か」から始まり「LTRの解析方法」までを解析する記事を連載していこうと思います。


今回は第一回として「LTRとは何か」を書いていきます。





〜本編〜

さて、LTRとは上述したとおりLong Terminal Repeatの頭文字をとった単語です。

LTRはレトロウイルスやLTR型レトロトランスポゾンのRNAの両端に存在する数百〜数千の長い長〜い繰り返し配列です。特徴的ですね。



・・・特徴的ですね!!


そう"特徴的"なんです。

つまり宿主への感染を感会えた時に、このLTRを目印に感染が確認出来ます。

更にこのLTRにはプロモータとしての機能があったりもするのでウイルス関連の研究をされている方には魅力的な研究対象かもしれませんね!


次回はLTRに関する研究について書こうと思います。


以上、misawatがお送りしました!





〜つぶやき〜
「頭文字」って単語を見ると無性に峠を攻めたくなるのは私だけじゃないはず・・・。

第46回バイオインフォマティクス勉強会「10x Genomicsによるロングリード解析@東京」開催のお知らせ

勉強会
9月9日(金)に開かれるバイオインフォマティクス勉強会のご案内です。

《内容》

10x Genomicsが開発したGemCodeシステムは、ショートリードから擬似的にロングリードを生成する革新的な技術です。
本勉強会では、日本で10x Genomicsのサービスを提供する3社をお招きし、実験から解析までトータルにご紹介いたします。

  • 10x Genomics社のChromiumシステムのご紹介 株式会社スクラム社 掛谷 知志 様
  • Chromium向けターゲットエンリッチメント試薬のご紹介 アジレント社 吉崎 史子 様
  • 受託解析サービスのご紹介 受託解析会社 ご担当者 様
  • データ解析のご紹介 アメリエフ 山口 昌雄

10x Genomicsの技術にご興味のある方、お試しされたい方、導入をご検討されている方などご参加をお待ちしております。

             記

【日時】2016年9月9日(金) 15:30-16:45 (受付開始 15:00〜)
【場所】東京都港区芝四丁目1-17 三田いきいきプラザ 集会室A(洋室)
【アクセス】
・地下鉄三田線・浅草線 三田駅 A9番出口 徒歩1分
・JR山手線・京浜東北線 田町駅 西口 徒歩8分
【定員】 30名
【対象】
・これからNGSを用いたロングリード解析をラボまたは委託で始めたい方
・10x Genomics社製品に興味がある方
・NGSを使ったロングリード解析に興味がある方
【お申込みフォーム】こちら
【お申込み締切】 9月8日(木)正午まで

プロジェクターで投影しながら進行していきます。
電源やネット環境のご準備はございませので、予めご了承ください。
参加をご希望の方は、上記URLからお早めにお申し込みください。

勉強会の後には、近くの飲食店にて情報交換会(実費 3,000〜4,000円)を
企画しております。講師も参加いたしますので、情報交換や横のつながりを
作る機会として、お楽しみいただければと思います。

ヒトデータのセキュリティ

バイオインフォマティクス
今夏は慎重に行動していたおかげでほとんど蚊に刺されていなかったのですが、お盆休みで実家に帰ったところ、寝ている間に10箇所も刺されてしまいました。
せっかく気を付けていたのに、台無しです。

無理やりこじつけますが、気を付けるといえば、ヒトのシーケンスデータを扱うときに、セキュリティはどれくらい気にするものなのか、ご質問をたびたびいただきます。
弊社がヒトシーケンスデータを扱う際のセキュリティルールは、NBDCヒトデータ取扱いセキュリティガイドラインを参考にしています。

NBDCヒトデータ取扱いセキュリティガイドライン
こちらは、NBDCで提供しているNBDCヒトデータベースの共有データを利用する際のセキュリティルールです。
セキュリティレベルには標準レベル(Type-I)とハイレベル(Type-II)があり、弊社では標準レベルの基準と同等のセキュリティを適用したサーバでヒトデータの解析を行っています。

ひとつの指針として、ご参考になりましたら幸いです。