アメリエフの技術ブログ

Amelieff Staff Blog

snpEffのアノテーション書式

たびたびブログでもご紹介している、アノテーションソフトsnpEff、一年前の9月にバージョン4.0になったとご紹介しましたが、2015年1月現在のバージョンは4.2です。

snpEffで付与されるアノテーションの書式は、以前は下記のような「EFF=...」でした。

##INFO=<ID=EFF,Number=.,Type=String,Description="Predicted effects for this variant.Format: 'Effect ( Effect_Impact | Functional_Class | Codon_Change | Amino_Acid_change| Amino_Acid_length | Gene_Name | Gene_BioType | Coding | Transcript | Exon | GenotypeNum [ | ERRORS | WARNINGS ] )' ">

現在のバージョンでは、デフォルトでは「ANN=...」に変更しています。

##INFO=<ID=ANN,Number=.,Type=String,Description="Functional annotations: 'Allele | Annotation | Annotation_Impact | Gene_Name | Gene_ID | Feature_Type | Feature_ID | Transcript_BioType | Rank | HGVS.c | HGVS.p | cDNA.pos / cDNA.length | CDS.pos / CDS.length | AA.pos / AA.length | Distance | ERRORS / WARNINGS / INFO' ">

バージョン4.1でも、実行時に「-classic」オプションを使用することで、「EFF=...」の書式でアノテーションすることも可能です。古いバージョンと互換性を残してくれるのはうれしいですね。

ANN書式が旧書式に比べ発展している点として、連続する変異を合わせた影響を考慮するなど、便利なアノテーションが増えているようなので、今後はぜひともANN書式を使いこなしていきたいです。

書式の詳細については公式の説明をご覧ください。